中國大模型的落地DNA,寫在這個雙螺旋結構裏_風聞
脑极体-脑极体官方账号-从技术协同到产业革命,从智能密钥到已知尽头07-07 00:29
隨着大模型的飛速發展,行業各界對大模型的核心疑問,已經從“有沒有大模型”,轉變為積極投入建設之後,中國AI產業如何實現大模型落地?巨大的建設投資應該如何獲得確定性、可持續的回報?
事實上,中國AI最強的特徵一直是落地。
技術落地的一個重要指標是技術密度,即一項技術在社會和經濟中的普及程度和應用密度。過去幾年裏,AI技術已經在中國的農田、工廠、港口、礦山、校園、城市等遍地開花,是全球其他地區都極少見到的景象。
產業革命的發生不可能一蹴而就,擁有大量業務場景和AI落地經驗的中國,也應該是大模型落地的前哨站。
果不其然,外界對中國AI和大模型落地的疑問與好奇,已經可以在文心的最新進展中,得到解答。
7月6日,在2023世界人工智能大會(WAIC)上,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峯,解讀文心大模型3.5版核心技術,同時發佈了飛槳生態最新進展,首次披露了飛槳深度學習平台最新數據,闡述人工智能產業模式。
文心和飛槳的協同發展,組成了一個雙螺旋結構,讀懂這個DNA 片段,可以更清晰地理解中國AI技術持續走向落地的方法與路徑。
一、產業AI的無形之牆
一個技術走向產業,有三個因素構成了影響其市場格局的制約點:一是技術領先性,二是市場需求度,三是產品可靠與可用程度。
大模型技術的領先性和市場需求度,自然毋庸置疑,那麼產品能否經受得住產業用户的考驗呢?中國AI場景多、落地早、實踐多,所以已經可以清晰地看到一堵產業AI的無形之牆,各行各業普遍存在的“三高”要求,是大模型落地所必須跨越的挑戰:
能力要求高。一些IT基礎好的產業會率先應用AI、落地大模型,但這些領域往往有着複雜的業務場景,以及使用多年的傳統算法,因此產業對AI大模型的基礎能力,要求會比較苛刻,超出現有技術手段,才有升級替換的必要性。
專業性要求高。通用大模型進入垂直細分的業務場景,會面臨非常複雜的業務狀況,要注意哪些問題和細節,需要哪些數據,目標是什麼,需要大模型能夠像行業專家一樣,掌握專有知識和行業Know-How。
開發成本高。行業場景的龐雜和差異化廣泛,大模型落地需要有針對性的訓練、精調,而很多行業和企業缺乏充足的IT人才、算力資源等來進行定製開發,延緩了大模型落地的速度。
“三高”要求制約着AI技術落地,這也使得大模型走向產業,還處於初級階段。
二、中國大模型的強落地範本
鑿穿產業AI 的圍牆,需要築重器。在世界人工智能大會上,王海峯分享了文心大模型3.5的核心技術創新。
與文心大模型3.0版本相比,文心大模型3.5版本在效果、功能、性能上全面提升,實現了基礎模型升級、精調技術創新、知識點增強、邏輯推理增強等能力升級。
更值得關注的是,文心大模型在應用層面,展現出了掙脱制約、指向落地的一系列方法,可以成為產業示範。
文心大模型3.5的幾大技術創新,就滿足了產業各界對大模型的三種強期待:
一是對先進生產力的期待。
歸根結底,大模型要可靠、可用,為行業提質增效。文心大模型3.5的兩大升級點,就着眼於此:
首先,基礎模型升級,基於飛槳加快模型迭代,提升模型效果和安全性,模同時,百度文心大模型研發團隊創新了多類型多階段有監督精調、多層次多粒度獎勵模型、多損失函數混合優化策略、雙飛輪結合的模型優化等技術,使模型效果及場景適配能力進一步提升。
此外,文心大模型3.5的邏輯推理提升,在語義理解、數學計算、代碼生成等領域表現更好,這些任務是實際業務中高頻出現的。王海峯舉了個例子,百度每天有大量工程師在寫代碼,文心一言發揮大模型的代碼生成能力,可以更好地幫助工程師提升寫代碼的效率,切實提高生產力。
二是對行業專家的期待。
大模型需要與行業場景適配,解決業務中更具專業性的實際問題,已經成為共識。此次3.5版本,就通過“精調”+“知識點增強”兩大技術創新,讓大模型具備行業專家一樣的專精能力。
有監督的精調技術,可以針對性地適配業務場景,讓結果更加可靠,從而更好地滿足業務場景對模型效果和安全性的需求。知識點增強技術,則在此前的知識增強和檢索增強的基礎上,為大模型注入更具體、更詳細、更專業的知識點,顯著提升大模型對世界知識的掌握和運用,更好地完成專業任務。比如在生成報告時,文心大模型就能夠對用户輸入的查詢、問題等進行分析理解,並解析生成答案所需要的相關知識點,生成更匹配業務特點的內容。
三是對豐富應用的期待。
智能手機中豐富多彩的應用,是移動互聯網產業繁榮的前提。用户使用大模型也需要多樣、豐富、易用的各種應用工具,這就需要插件機制來滿足。
文心大模型3.5新增的插件機制,可以擴展大模型的能力邊界,細緻高效地應用於各類場景。比如文心一言的長文本摘要和問答插件ChatFile,支持超長文本輸入,可以在辦公場景下,形成會議議題、摘要及總結等關鍵信息,幫助提升工作效率。
王海峯也表示,文心一言將發佈更多優質的百度官方和第三方插件,讓用户能夠更好地應用文心大模型,同時也將逐步開放插件生態,幫助開發者基於文心大模型打造自己的應用。
隨着大量優秀的開發者和軟件工程師,基於文心大模型來打造專屬插件,不僅大模型的可用性和產業適配性會進一步提高,所帶來的應用市場空間也是巨大的。
文心大模型3.5的升級曲線,緊密貼合產業期待。從中可以看到,文心大模型時刻準備着落地千行百業。
三、大模型落地需要可持續動力
僅有大模型還不夠,王海峯提出,在文心一言這類大模型產業落地的進程中,可以採用“集約化生產,平台化應用”的模式,即具有算法、算力和數據綜合優勢的企業將模型生產的複雜過程封裝起來,通過低門檻、高效率的生產平台,為千行百業提供大模型服務。
文心大模型能夠率先卡位在大模型落地的關鍵位置,離不開背後的另一條上升曲線:飛槳的聯合優化。
飛槳對文心的全面賦能,有四個層面:
首先,飛槳支撐大模型開發、訓練和推理部署,全面提升大模型落地效率。大模型的訓練、迭代要消耗大量訓練成本、訓練時間,經過飛槳與文心大模的協同優化,最新升級的文心大模型3.5的模型效果提升50%,訓練速度提升2倍,推理速度提升30倍。
其次,文心大模型成為飛槳模型庫的重要組成部分,通過飛槳平台進行精調、推理部署,就可以有效支持千行百業的應用,降低行業獲取大模型門檻。
再次,飛槳提供了全流程產業化工具與平台,解決大模型開發中的卡點、堵點,比如模型體積大、訓練難度高、算力消耗大等,更好地滿足企業開發應用大模型的需求。
此外,大模型落地產業離不開人才,飛槳已經凝聚了750萬開發者,也支持了大量企業產生了大量的模型,為中國AI培養了大量新型人才,是大模型落地的有生力量。
可以看到,飛槳的技術和生態積累,正在為文心大模型走向產業,注入了源源不斷的動力。
四、中國AI,憑藉這樣的DNA落地生根
在大會現場,王海峯也展現了文心一言在辦公、會議、編碼等場景的應用。可以説,文心一言已經有了豐富的新落地場景,這種強勁的落地表現,應該能夠打消外界對中國大模型可持續發展的擔憂。
從文心與飛槳組成了雙螺旋結構的DNA,從中可以看出中國AI以實用為先,以產業為向的底色,中國大模型產業也開始呈現出這樣的發展趨勢:
1.低門檻。通過各個端口的技術創新,形成了AI技術全面低門檻化的特徵,讓模型的開發、獲取和應用,都更加便捷、易得。
2.高效率。芯片、框架、模型、應用的全棧協同,帶來了效率持續增長的乘法效應,大大加快了模型的落地速度。
3.通行業。AI開發、訓練、部署、應用的全鏈路得到越來越飽滿的支撐,“集約化生產,平台化應用”讓大模型更適配產業和行業的現實需要,賦能產業智能化。
落地成為中國AI的DNA,大模型也不例外。以大模型為代表的AI技術和先進生產力在各行各業落地生根,這是為什麼智能革命一定會發生在中國。