百度版ChatGPT“文心一言”亮相，李彥宏：發展遠未完善、進步空間很大

贺喜格

2023-03-16

（文/呂棟賀喜格）

在OpenAI推出大模型GPT-4一天後，百度官宣已久的類ChatGPT產品“文心一言”也終於公開露面，並且和GPT-4一樣是多模態。

北京時間3月16日下午，百度召開發佈會，主題圍繞新一代大語言模型、生成式AI產品“文心一言”。

觀察者網在現場看到，百度首席執行官李彥宏和百度首席技術官王海峯均出席了發佈會，並在現場展示了“文心一言”在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。

在現場，李彥宏用錄好的視頻進行了演示。

從展示案例來看，“文心一言”某種程度上具有了對人類意圖的理解能力。但李彥宏也多次提及，這類大語言模型還遠未到發展完善的階段，進步空間很大，未來這段時間它一定會飛速發展。

觀察者網從現場瞭解到，此次“文心一言”公開亮相後，並不會直接面向公眾推出，而是先採用邀請測試方案。從3月16日起，首批用户可通過邀請測試碼，在官網體驗產品，後續才會陸續開放給更多用户。

那麼，百度為何甘冒風險，略顯倉促地推出“文心一言”呢？這一方面可能是為了搶得對標ChatGPT的頭籌，獲得更多用户以訓練大語言模型，另一方面則可能考慮到內外部的需求。

李彥宏在現場表示：“在全球的大廠中，百度是第一個做出對標ChatGPT的產品的企業。雖然‘文心一言’的內測體驗不能稱作完美，但為什麼現在發佈呢？是因為百度的各個產品現都在等着這樣的產品，我們的客户和合作伙伴也在等着這樣的技術。”

在此次發佈會之前，有外媒援引知情人士稱，為了開發“文心一言”，數百名百度員工一直在夜以繼日地工作。甚至在正式發佈前夕，“文心一言”基於的AI模型仍在接受數據訓練。一些員工坦言，他們沒有足夠的時間來打造一款功能完善的產品。

根據百度方面的披露，“文心一言”大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據，以及5500億事實的知識圖譜等。

那這次通過視頻亮相的“文心一言”表現如何呢？在現場，李彥宏展示了“文心一言”在五個使用場景的表現，包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。

以文學創作場景為例，“文心一言”根據對話問題將《三體》的核心內容進行了總結，並提出了五個續寫《三體》的建議角度，體現出對話問答、總結分析、內容創作生成的綜合能力。商業文案創作場景中，文心一言順利完成了給公司起名、寫Slogan、寫新聞稿的創作任務。

在數理推算場景中，“文心一言”能夠學會數學推演及邏輯推理等相對複雜任務。面對“雞兔同籠”這類鍛鍊人類邏輯思維的經典題，文心一言能理解題意，並有正確的解題思路，進而像學生做題一樣，按正確的步驟，一步步算出正確答案。

作為紮根於中國市場的大語言模型，文心一言在中文語言和中國文化上，相比國外的大模型產品無疑會有更好的表現。在現場展示中，文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對應的經濟學理論，還用“洛陽紙貴”四個字創作了一首藏頭詩。

昨日（3月15日），OpenAI發佈多模態模型GPT-4，可接收圖像和文本輸入來輸出文本內容，受到外界關注，而文心一言本次發佈的版本同樣具備多模態功能，支持文本、圖片、音頻、視頻生成。

在更體現技術能力的多模態生成方面，李彥宏現場展示了“文心一言”生成文本、圖片、音頻和視頻的能力。有趣的是，“文心一言”甚至能夠生成四川話等方言語音；“文心一言”的視頻生成能力則因成本較高，現階段還未對所有用户開放，未來會逐步接入。

從“文心一言”的表現看，某種程度上它具有了對人類意圖的理解能力，回答的準確性、邏輯性、流暢性都逐漸接近人類水平。但整體而言，這類大語言模型還遠未到發展完善的階段，有賴於通過真實的用户反饋而逐步迭代。

王海峯表示，文心一言，是新一代知識增強大語言模型，是在ERNIE及PLATO系列模型的基礎上研發的。它的關鍵技術包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。

前三項是這類大語言模型都會採用的技術，ERNIE和PLATO中也已經有應用和積累，在文心一言中又有了進一步強化和打磨；後三項則是百度已有技術優勢的再創新。

多年來，百度大語言模型上投入積極，有市場數據顯示，百度研發的50%-60%的投入都給到了Ernie。

近日有外媒援引知情人士稱，隨着ChatGPT熱度上升，今年1月初，百度高管讓其自然語言處理團隊開始用文心大模型整合出一款對標ChatGPT的產品。但前述知情人士表示，與其他從事類ChatGPT技術的AI開發者所遇到的情況一樣，這一項目面臨一些挑戰。

其中一個挑戰是，需要訓練該模型對有多種釋義的短語或可指代多人的名字進行辨別，從而能對用户的要求做出更精確的反應。另一個挑戰是使該聊天機器人生成的語言看起來更像人類説的話。第三個挑戰是提高事實準確性，這是大語言模型的一個技術限制；大語言模型會根據不同詞語可能出現在一起的概率將句子串起來，而不是根據信息片段。這種限制也使得這種模型難以控制以避免敏感話題。

“文心一言”的真實水平如何，還有待觀察百度後續推出的公測版本。據百度披露，自2月份該公司官宣“文心一言”以來，已有超過650家企業宣佈接入文心一言生態。

有市場觀點指出，百度之所以沒有迅速開放公測，一方面是因為產品尚未成熟，另一方面可能也是出於成本和收入考慮。之前有估算稱，ChatGPT每天成本消耗有超過10萬美元。來自摩根士丹利的分析師估計，ChatGPT每次查詢的成本大約是谷歌傳統搜索查詢成本的七倍。

在本次發佈會上，李彥宏表示：“無論哪家公司，都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理，需要多年堅持和積累，沒法速成。”他同時提到，如果建立起真實用户反饋、開發者調用和模型迭代之間的飛輪，“文心一言”效果會迅速提升。

本文系觀察者網獨家稿件，未經授權，不得轉載。