百度版ChatGPT“文心一言”亮相,李彥宏:發展遠未完善、進步空間很大
贺喜格

(文/呂棟 賀喜格)
在OpenAI推出大模型GPT-4一天後,百度官宣已久的類ChatGPT產品“文心一言”也終於公開露面,並且和GPT-4一樣是多模態。
北京時間3月16日下午,百度召開發佈會,主題圍繞新一代大語言模型、生成式AI產品“文心一言”。
觀察者網在現場看到,百度首席執行官李彥宏和百度首席技術官王海峯均出席了發佈會,並在現場展示了“文心一言”在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。

在現場,李彥宏用錄好的視頻進行了演示。
從展示案例來看,“文心一言”某種程度上具有了對人類意圖的理解能力。但李彥宏也多次提及,這類大語言模型還遠未到發展完善的階段,進步空間很大,未來這段時間它一定會飛速發展。
觀察者網從現場瞭解到,此次“文心一言”公開亮相後,並不會直接面向公眾推出,而是先採用邀請測試方案。從3月16日起,首批用户可通過邀請測試碼,在官網體驗產品,後續才會陸續開放給更多用户。
那麼,百度為何甘冒風險,略顯倉促地推出“文心一言”呢?這一方面可能是為了搶得對標ChatGPT的頭籌,獲得更多用户以訓練大語言模型,另一方面則可能考慮到內外部的需求。
李彥宏在現場表示:“在全球的大廠中,百度是第一個做出對標ChatGPT的產品的企業。雖然‘文心一言’的內測體驗不能稱作完美,但為什麼現在發佈呢?是因為百度的各個產品現都在等着這樣的產品,我們的客户和合作伙伴也在等着這樣的技術。”
在此次發佈會之前,有外媒援引知情人士稱,為了開發“文心一言”,數百名百度員工一直在夜以繼日地工作。甚至在正式發佈前夕,“文心一言”基於的AI模型仍在接受數據訓練。一些員工坦言,他們沒有足夠的時間來打造一款功能完善的產品。
根據百度方面的披露,“文心一言”大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。
那這次通過視頻亮相的“文心一言”表現如何呢?在現場,李彥宏展示了“文心一言”在五個使用場景的表現,包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。
以文學創作場景為例,“文心一言”根據對話問題將《三體》的核心內容進行了總結,並提出了五個續寫《三體》的建議角度,體現出對話問答、總結分析、內容創作生成的綜合能力。商業文案創作場景中,文心一言順利完成了給公司起名、寫Slogan、寫新聞稿的創作任務。

在數理推算場景中,“文心一言”能夠學會數學推演及邏輯推理等相對複雜任務。面對“雞兔同籠”這類鍛鍊人類邏輯思維的經典題,文心一言能理解題意,並有正確的解題思路,進而像學生做題一樣,按正確的步驟,一步步算出正確答案。

作為紮根於中國市場的大語言模型,文心一言在中文語言和中國文化上,相比國外的大模型產品無疑會有更好的表現。在現場展示中,文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對應的經濟學理論,還用“洛陽紙貴”四個字創作了一首藏頭詩。
昨日(3月15日),OpenAI發佈多模態模型GPT-4,可接收圖像和文本輸入來輸出文本內容,受到外界關注,而文心一言本次發佈的版本同樣具備多模態功能,支持文本、圖片、音頻、視頻生成。
在更體現技術能力的多模態生成方面,李彥宏現場展示了“文心一言”生成文本、圖片、音頻和視頻的能力。有趣的是,“文心一言”甚至能夠生成四川話等方言語音;“文心一言”的視頻生成能力則因成本較高,現階段還未對所有用户開放,未來會逐步接入。

從“文心一言”的表現看,某種程度上它具有了對人類意圖的理解能力,回答的準確性、邏輯性、流暢性都逐漸接近人類水平。但整體而言,這類大語言模型還遠未到發展完善的階段,有賴於通過真實的用户反饋而逐步迭代。
王海峯表示,文心一言,是新一代知識增強大語言模型,是在ERNIE及PLATO系列模型的基礎上研發的。它的關鍵技術包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。
前三項是這類大語言模型都會採用的技術,ERNIE和PLATO中也已經有應用和積累,在文心一言中又有了進一步強化和打磨;後三項則是百度已有技術優勢的再創新。
多年來,百度大語言模型上投入積極,有市場數據顯示,百度研發的50%-60%的投入都給到了Ernie。
近日有外媒援引知情人士稱,隨着ChatGPT熱度上升,今年1月初,百度高管讓其自然語言處理團隊開始用文心大模型整合出一款對標ChatGPT的產品。但前述知情人士表示,與其他從事類ChatGPT技術的AI開發者所遇到的情況一樣,這一項目面臨一些挑戰。
其中一個挑戰是,需要訓練該模型對有多種釋義的短語或可指代多人的名字進行辨別,從而能對用户的要求做出更精確的反應。另一個挑戰是使該聊天機器人生成的語言看起來更像人類説的話。第三個挑戰是提高事實準確性,這是大語言模型的一個技術限制;大語言模型會根據不同詞語可能出現在一起的概率將句子串起來,而不是根據信息片段。這種限制也使得這種模型難以控制以避免敏感話題。
“文心一言”的真實水平如何,還有待觀察百度後續推出的公測版本。據百度披露,自2月份該公司官宣“文心一言”以來,已有超過650家企業宣佈接入文心一言生態。
有市場觀點指出,百度之所以沒有迅速開放公測,一方面是因為產品尚未成熟,另一方面可能也是出於成本和收入考慮。之前有估算稱,ChatGPT每天成本消耗有超過10萬美元。來自摩根士丹利的分析師估計,ChatGPT每次查詢的成本大約是谷歌傳統搜索查詢成本的七倍。
在本次發佈會上,李彥宏表示:“無論哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理,需要多年堅持和積累,沒法速成。”他同時提到,如果建立起真實用户反饋、開發者調用和模型迭代之間的飛輪,“文心一言”效果會迅速提升。
本文系觀察者網獨家稿件,未經授權,不得轉載。