十年「化繭」,文心一言「成蝶」_風聞
蓝洞商业-将价值写作进行到底03-17 20:21

賽道已經有了,圍繞大語言模型的競賽正式開跑,對參賽者來説,大規模語言的商用還有很長的一段路要走。
撰文|藍洞商業 趙衞衞
「文心一言」發佈的前一天,百度創始人李彥宏問文心一言,「你怎麼看GPT4?」
文心一言代表的是百度在知識增強大語言模型上的最新成果,對標的就是美國人工智能公司Open AI在大語言模型上的產品ChatGPT,在過去三個月的時間裏,ChatGPT吸引了全球互聯網的目光,而就在百度發佈文心一言的前一天,ChatGPT發佈了最新的GPT4版本,已經支持圖像輸入等多模態模型。
**「我測試感覺還是有很多不完美的地方」,李彥宏在文心一言的新聞發佈會上,承認文心一言的不足。**但前提是,文心一言是全球第一個互聯網大廠正式發佈的產品(ChatGPT由OpenAI開發,不隸屬於微軟)。
這種不完美其實廣泛存在於ChatGPT和文心一言的大語言模型產品中,尤其是ChatGPT在2022年11月發佈後,ChatGPT備受詬病的一點就是,其一本正經的胡説八道,經常樂於編造事實和發明材料來證明其論點,直到GPT4發佈,這一弱點才得以真正改善。
百度的文心一言誕生,意味着中國市場有了自己的大語言模型產品。
領先於國內一眾互聯網公司,百度成為本土化市場中第一家真正發佈大語言模型的公司,真正站上了賽道。文心一言,也無可避免被拿來對標微軟廣泛應用於其產品中的ChatGPT,二者也被視為中美互聯網大廠競爭的代表。
即便「不完美」,但對於「你怎麼看GPT4」這件事上,文心一言還是給出了讓李彥宏相對滿意的答案。因為疊加在大語言模型之上的知識增強和檢索增強能力,讓文心一言對GPT4這個新鮮事物做出了及時的總結,李彥宏説,「未來大家在這個方面也會看到我們不斷的進步」。
於是「藍洞商業」也把問題拋給了ChatGPT,它如何看待新生的文心一言?
ChatGPT把文心一言歸入自己的同類,都是基於大規模預訓練語言模型的聊天機器人技術,都可以根據用户的輸入生成自然流暢的回覆,「ChatGPT和百度文心一言各有優劣,沒有絕對的強弱之分。它們都是人工智能領域的重要成果,也為未來的聊天機器人發展提供了新的可能性。」
雖遲但到
作為ChatGPT的對標,文心一言在發佈時,李彥宏重點展現了大模型語言通用的五種能力,包括文學創作、商業文案創作、數理推算、中文理解和多模態生產等方面。續寫三體,做雞鴨同籠的算數遊戲,寫藏頭詩,創作海報,都可以在文心一言中實現。
換句話説,文心一言會寫小作文,能解數學方程式,能玩轉生成圖片和視頻內容,這些都是文心一言的基本功。
尤其是在文學創作、商業文案創作的展現上,體現的是文心一言在內容創作生成上的能力,這需要一定大模型語言的總結分析,輔之以知識增強提高事實性的準確率,進而做到回答的準確和流暢,完成清晰的輸出表達。
**於是「藍洞商業」也測試了一下文心一言和ChatGPT,試圖從中找到二者的差異化。**首先把問題拋給文心一言,讓它問問它所關心的ChatGPT。

文心一言的回答邏輯清晰,列出了五個問題所涉及的方向,尤其是在多次驗證中,關於人工智能語言模型如何理解人類的情感和溝通方式的問題,是文心一言和ChatGPT二者生成內容中的同類項,都是二者普遍關心的問題。
而同樣的提問,拋給基於ChatGPT4的微軟瀏覽器New Bing,得到的回答則同樣是五個問題,二者的回答速度相差不多,都展現出了思維和邏輯分析能力,只是ChatGPT4內容相對簡單很多,這可能是因為文心一言剛剛發佈,內容並不太多。

AI不分高低,能夠解決實際需求就是好的AI。
事實上,相比於用户感知到文心一言的生成內容,更值得注意的是其底層技術邏輯系統,這是文心一言得以不斷迭代和進化的基礎。
文心一言的大語言模型,改變了IT技術的技術棧,讓過去的三層分級,變成了芯片層、框架層、模型層和應用層,而文心一言就處於模型層的位置中,百度在這四層中都有佈局,所以李彥宏能夠強調説,百度的優勢獨特,「在全球範圍內每一層都有領先產品的公司,幾乎沒有」。

從2019年3月推出文心ERNIE1.0以來,期間經歷了多次迭代,而正是因為這些底層技術的支撐,得以讓文心一言的大模型不斷迭代進化,四層形成一個高效反饋的閉環,幫助大模型越做越好。如今,ERNIE 3.0每天接受數十億次用户的搜索請求。
如同ChatGPT在過去三個月間的進化一樣,文心一言也開啓了進化之路,二者將在各自的技術架構中不斷優化並提升效率。從這一層面説,百度的文心一言作為本土化的大語言大模型仍舊值得期待,其賴以生存的更高效的模型,需不斷升級來滿足用户更豐富的場景需求。
十年埋伏在國內一眾互聯網大廠中,百度算是在人工智能領域涉足最早、佈局最成體系的一個。
究其原因,人工智能一直是李彥宏心心念唸的所在。從早年在美國學習計算機科學,李彥宏就表現出了對人工智能課程的興趣,遠超過硬件相關的課程,只是因為當時缺少人工智能的應用環境,李彥宏就覺得比較失望,「只好把這個興趣埋藏了起來」。
此後,隨着計算機網絡的發展,尤其是互聯網技術的進步,李彥宏才覺得「希望回來了」。
從2012年成立深度學習研究院,到2014年首提搭建「百度大腦」,再到2016年將人工智能列為百度業務核心的核心,百度在人工智能領域的佈局一直領先於國內廠商,帶動了國內互聯網公司成立人工智能實驗室的風潮,形成了人工智能科學家從學界向企業界轉移的潮流。
**「人工智能將是照亮又一個新世代的火種,並在當時幾乎無人看好的情況下,大規模投入這一領域。」**在李彥宏這一判斷之下,百度的體系不斷完善,百度在2017年整合內部的AI團隊,形成百度AI技術平台體系(AIG),由王海峯任總負責人,此舉意在用新的組織形式釋放百度人工智能的活力。
伏筆就此埋下。
2019年,王海峯成為百度CTO,這是10年來百度首次進行集團CTO的任命,被外界認為是百度AI戰略落地、技術創新驅動產品創新加速的決心。也正是那一年,百度在自然語言處理領域取得先發優勢,推出了文心大模型ERNIE 1.0,這成為如今文心一言的技術基礎。
這背後的數字,更能證明百度十年埋伏下的能力。從2012年的23.05億研發投入,到2021年249.38億研發投入,近十年間百度積累超過1000億在人工智能等領域的研發,讓百度連續5年在人工智能申請量和授權量上排名國內第一。

「智能革命,它的過程會轟轟烈烈,但它的成果將會是一條寬廣平緩的河流。人工智能領域的權威人士都認為,在不久的未來,智能流會像今天的電流一樣平靜地環繞、支持着我們,在一切環節提供養料,徹底改變人類經濟、政治、社會、生活的形態。」李彥宏在《智能革命》一書的序言中説。
如今,風終於來了。文心一言標誌着百度站上了大語言模型的智能革命賽道,更折射出互聯網搜索賽道成為這場智能革命的風暴中心。
在過去的短短一個月,超過650家合作伙伴宣佈加入文心一言生態,這成為大語言模型旺盛市場的證明,李彥宏認為,「AI市場即將迎來爆發性的需求增長,其商業價值的釋放將是前所未有的、指數級的。」
李彥宏將基於大語言模型上的應用開發,比作是基於安卓或IOS開發的微信、淘寶、抖音等超級應用,因而大語言模型將會給全行業帶來三大產業機會:
第一類是新型雲計算公司,其主流商業模式從IaaS變為MaaS;
第二類是進行行業模型精調的公司,這是通用大模型和企業之間的中間層,他們具有行業Konwhow(技術訣竅),調用通用大模型能力,為行業客户提供解決方案;
而第三類是基於大模型底座進行應用開發的公司,即應用服務提供商。
多元開發平台的生態價值,才是未來的重點。只有開放邏輯下,擁有連接其他合作伙伴成果與產業環節的機會,才能讓大語言模型技術擁抱未來。
在這些產業的未來中,以大語言模型為支撐的智能流,會不會像電流一樣平靜地環繞、支持着我們?這顯然是百度巨大的空間所在。
交匯之後如今回頭看,競爭格局的決定性瞬間在2019年就已經定下。
當百度作為國內人工智能領導者推出文心大模型ERNIE 1.0時,微軟也向ChatGPT的母公司OpenAI下注投資10億美元,試圖在雲計算和人工智能領域超越亞馬遜和谷歌。
如今,隨着文心一言在國內的發佈,大語言模型的進化速度更快了,中美科技界在大語言模型上實現了交匯。
李彥宏説過,一旦有了真實的人類反饋,文心一言的進步速度會非常快,「我們都希望它快點成長,早日為用户和客户創造價值」。
而競爭的另一端,微軟將ChatGPT背後的AI技術納入Office 辦公套件,而提升為GPT4技術之後,ChatGPT是記憶力增加了10倍,開啓的視圖功能也進入了多模態模式,通過律師考試等一系列考核驗證了其邏輯思維能力的增強。
「文心一言不是中美科技對抗的工具」,李彥宏在發佈會的最後特別強調。此番是想説明,文心一言是一代代百度技術人員追逐科技改變世界的夢想的產物,是服務億萬用户,賦能千行百業的全新的平台,是創新驅動發展的最佳證明。
這番也是變相回應了微軟,微軟已然是把百度作為了對手,雙方都在觸碰人工智能的不同可能。
在今年2月,微軟副董事長布拉德·史密斯(Brad Smith)就曾強調,通過負責任的AI推進未來,人工智能是這場競爭的下一個前沿領域。他把百度的人工智能研究院列為下一波人工智能浪潮中的第三大領先者,排在之前的分別是Open AI和微軟的結合,以及谷歌內部的Deep Mind。
無論如何,賽道已經有了,圍繞大語言模型的競賽顯然已經正式開跑,而對參賽者來説,大規模語言的商用還有很長的一段路要走。
「有必須是前提,可能一開始不夠好,但隨着用的人越來越多,生態體系越來越完善,國內外的差距會越來越小,甚至追平乃至超越,實踐無數次證明,在把某一項技術玩出「花」這點上,我們要充分相信中國企業的智慧」,人工智能技術從業者胖總對「藍洞商業」表示。
顯而易見,人工智能系統正在成為未來日常生活的一部分。AI領域的大神傑弗裏·辛頓 (Geoffrey Everest Hinton)曾做過一個精彩的中文比喻,他把GPT4比作是化繭成蝶,「毛毛蟲提取養分,然後轉化為蝴蝶。人們已經提取了數十億塊理解的金塊,GPT4是人類的蝴蝶。」
從這一意義上看,百度和微軟是當下「蝴蝶」,只不過分處兩地,都是通過背後的NLP(自然語言)技術和大語言模型,確保從機器中提煉符合人類意圖和價值觀的金子。