股價跌幅近10%，百度“文心”沒能滿足萬眾期待？_風聞

根新未来-03-17 09:49

2023-03-17

文/觀察未來科技

ChatGPT的爆火點燃了人工智能萬億賽道，互聯網科技巨頭紛紛入局。其中，百度作為中國領先AI技術公司，同時也是最大的中文搜索引擎，成為了第一個衝刺國產版ChatGPT的公司。蓄勢了一個多月，承載着萬眾的期盼或好奇，“國產版ChatGPT——文心一言”終於在3月16日正式亮相。

百度同時公佈了文心一言的邀請測試方案。3月16日起，首批用户即可通過邀請測試碼，在文心一言官網體驗產品，後續將陸續開放給更多用户。此外，百度智能雲即將面向企業客户開放文心一言API接口調用服務。

那麼，承載萬眾期待的“文心一言”滿足了眾人的期待嗎？百度推出“文心一言”後，國產版ChatGPT局面又將發生怎樣的變化？

百度文心，十年磨一劍

在中國眾多科技大廠中，百度是最早針對ChatGPT做出明確表態的公司之一，也是中國最早佈局人工智能的公司之一。

2022年9月的世界人工智能大會，百度創始人、董事長李彥宏就在開幕式上發表視頻演講，**表示百度已在人工智能領域摸爬滾打10年，10年累計研發投入超1000億元，2021年核心研發佔比23%****，**研發投入強度持續位於全球大型科技公司前列。相較而言，去年前三季度，阿里、騰訊、美團的研發投入佔比分別約為15%、10%和8%。

持續的研發投入讓百度在人工智能領域愈發沉澱。**在2023年百度Create大會暨百度AI開發者大會上，****李彥宏提到，百度是如今少有的同時具備人工智能四層能力的公司，**這包括芯片層的崑崙AI芯片、框架層的飛槳深度學習框架、模型層的文心大模型和應用層的搜索、自動駕駛、智能家居等產品。

芯片層方面，百度是中國第一批自研AI芯片的互聯網公司。百度的崑崙AI芯片研發始於2011年，正式發佈於2018年。對外發布時，崑崙已支持百度業務多年。到2020年秋天之前，已有超2萬片崑崙芯片每天為百度搜索引擎、廣告推薦和智能語音助手小度提供AI計算能力。

框架層方面，百度飛槳是國內最早啓動研發的自研深度學習框架。2016年百度推出的飛槳在2021年成為中國開發者使用最多的深度學習框架，在全球排名第三，開源至今，飛槳已凝聚406萬開發者，服務過15.7萬企事業單位，開發模型達47.6萬個。飛槳能幫開發者快速創建、部署模型，它現在已擁有535萬開發者，服務了20萬家企事業單位，創建了67萬個模型。

模型層方面，百度在2019年發佈文心大模型，它可以根據用户的描述生成文章、畫作、視頻等多種內容，這就是去年至今大熱的“生成式AI”。目前，百度的文心大模型已更新迭代至文心ERNIE 3.0，參數規模高達2600億，是全球最大的中文單體模型。與此同時，文心ERNIE 3.0還支持生成式AI，具備強大的跨模態、跨語言的深度語義理解與生成能力。

基於文心大模型，百度目前已發佈11個行業大模型，大模型總量達36個，已構成業界規模最大的產業大模型體系。目前已大規模應用於搜索、信息流等互聯網產品，並在工業、能源、金融、汽車、通信、媒體、教育等各行業落地應用。

百度的**“文心一言”也正是基於文心大模型****而開發的國產版ChatGPT。**2月7日，百度公佈其類ChatGPT項目名為“文心一言”，預計將於3月完成內測並向公眾開放。當時，百度宣佈這一消息後，百度港股股價跳漲15%以上。

實際上，百度這些技術佈局，也往往始於技術微末之時，甚至被冠以“燒錢”的字眼。但也正是十年飲冰的堅持投入，使得百度AI大底座成為了行業內首個全棧自研的智算基礎設施。又正是長期技術積累帶來的全棧自研能力，給行業和百度本身，都帶來了更深遠的影響。

**文心一言，水平如何？**3月16日下午2點，百度的邀請測試展示正式召開。現場，李彥宏展示了文心一言在五個使用場景的表現，包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。

在文學創作方向，問題主要圍繞《三體》進行詢問，包括作品信息、核心內容、續寫創作。當然，文心一言也準確、詳細地介紹了《三體》作者劉慈欣。緊接着，文心一言總結了《三體》核心內容，條理分明地列出了3大點，並且還給出了5個續寫的角度。

在商業文案創作中，文心一言則順利完成了給公司起名、寫Slogan、寫新聞稿的創作任務。在連續3次內容創作生成中，文心一言既能準確理解人類意圖，又能清晰地表達。並且，在回答之餘，文心一言會自動增加冗餘的額外解釋**——儘管整體內容更傾向於正確的廢話**。李彥宏稱：“這些訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據，以及5500億事實的知識圖譜等。”

**除了基本的文學方向，文心一言還可以嘗試解決含邏輯思維的數學推演題目，**現場演示中，雞兔同籠經典題型，文心一言的確表現出能理解題意，還給出了正確的解題思路，就像學生做題一樣，按正確的步驟，一步步算出正確答案。當然，解答本質上和當下的小猿搜題、作業幫等第三方解題軟件並無區別。

此外，在中文理解方面，文心一言還表現出先進的自然語言處理能力。在現場展示中，文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對應的經濟學理論，還用“洛陽紙貴”四個字創作了一首藏頭詩。

在多模態生成方面，李彥宏現場展示了文心一言生成文本、圖片、音頻和視頻的能力。比如，讓文心一言為2023世界智能交通大會創作一張海報。幾秒之後，一張賽博風格的圖片就生成了。有意思的是，文心一言還能根據內容生成四川話等方言的語音。

但遺憾的是，這些都不是實時演示**——**李彥宏表示，為了保證演示效果，文心一言現場問答測試為提前錄好的視頻。

這也不難理解為什麼發佈會召開後，百度股價不漲反跌，港股百度集團跌幅近10%。不少梗圖頻現，消費者對產品預期之低可見一斑。**實際上，就連李彥宏也****直言，文心一言對標ChatGPT，但不能叫完美。**尤其是從其回答表現來看，問題準確性與上下文的邏輯聯繫性表現尚可，以搜索引擎論已屬優異，但類人性不足，可明顯感知信息多從語料資料庫中集成而來，並無直接對話之感。

而反觀GPT-4，其在各種專業測試和學術基準上的表現與人類水平相當，不僅以前10%的超強能力通過了模擬律師考試，SAT成績達到710，且具備解決高難度數理邏輯，拆解多語言複雜題型，以及速讀看論文總結摘要的能力。兩相對比，確實高下立現。

未來之路漫長

當然，雖然市場用腳投票，表示了對百度文心一言的態度，但需要指出的是，文心一言也並未一無是處，至少在國內，其仍代表着第一梯隊的水平。

從技術角度而言，文心一言核心引擎為百度自主推出的NLP模型ERNIE，整體框架基於BERT模型改進。ChatGPT和文心一言都是基於Transformer模型架構，但GPT採用單向語言模型，而文心一言則****採用雙向語言模型。因此，在實際操作時，GPT對於文本生成更為敏感，比如聊天、寫作等語言生成方向表現優異，而文心一言對於文本理解更為敏感，在問答、語義關係抽取更有優勢。

也就是説，文心ERNIE類人性稍差，回答以精準理解為主，同時更多聚焦於本土化，在語義複雜的中文NPL處理中有顯著優勢，畢竟由於各種限制，即使是最新版本GPT-4測試的26種語言中也並未涵蓋中文。**實際問答題體驗中，當涉及中文語義理解時，ERNIE表現突出，甚至部分勝於GPT3.5。**比如，在關於洛陽紙貴的回答中，文心一言可正確理解其的經濟現象，古詩詞的可讀性和觀賞性也更高，更符合國人的審美與品味。

**當然，作為首發的國產版ChatGPT，文心一言的發佈也進一步暴露出國產化ChatGPT的困境。**雖然百度已經在AI的各個層面都有較為全面的佈局，並且具有中文世界裏最大的數據庫，但百度同時面臨的一個更大的困境，就是數據的質量問題，因為沒有高質量的數據就難以訓練出高質量的類ChatGPT產品。

如果百度訓練ChatGPT的數據優質，那麼輸出的結果也相對客觀。如果訓練的數據都是百度中文世界的網絡信息，那麼可能就要慎重，以免曾經的魏則西事件重演。**因為如果訓練的數據質量，以及產品背後的規則不夠清晰，結果可能就不會有那麼理性。**實際上，這也是中文互聯網的問題。

當然，就百度來説，其在人工智能領域還面臨着另外一個重要並現實的挑戰，那就是推行類ChatGPT的業務可能會對其傳統的搜索業務帶來影響。而傳統的搜索業務中，廣告收入是百度當前最主要，也是大部分的利潤來源。如果百度的傳統搜索業務中的廣告業務受到了類ChatGPT技術的影響，必然會影響到百度的研發投入。

此外，在落地場景方面，ChatGPT能否適應中國各行各業的碎片化轉型需求，尚有待驗證。李彥宏也坦言，“ChatGPT是AI技術發展到一定地步後產生的新機會。但怎麼把這麼酷的技術，變成人人都需要的好產品，這一步其實才是最難的，最偉大的，也是最能產生影響力的。”

對於人工智能而言，比拼的不單單是人工智能領域的技術研發，而是集人工智能研發、算力、芯片、數據等多方面的集成綜合實力。而百度和文心一言才剛剛出發，未來還有很長的路要走。