股價跌幅近10%,百度“文心”沒能滿足萬眾期待?_風聞
根新未来-03-17 09:49
文/觀察未來科技
ChatGPT的爆火點燃了人工智能萬億賽道,互聯網科技巨頭紛紛入局。其中,百度作為中國領先AI技術公司,同時也是最大的中文搜索引擎,成為了第一個衝刺國產版ChatGPT的公司。蓄勢了一個多月,承載着萬眾的期盼或好奇,“國產版ChatGPT——文心一言”終於在3月16日正式亮相。
百度同時公佈了文心一言的邀請測試方案。3月16日起,首批用户即可通過邀請測試碼,在文心一言官網體驗產品,後續將陸續開放給更多用户。此外,百度智能雲即將面向企業客户開放文心一言API接口調用服務。
那麼,承載萬眾期待的“文心一言”滿足了眾人的期待嗎?百度推出“文心一言”後,國產版ChatGPT局面又將發生怎樣的變化?

百度文心,十年磨一劍
在中國眾多科技大廠中,百度是最早針對ChatGPT做出明確表態的公司之一,也是中國最早佈局人工智能的公司之一。
2022年9月的世界人工智能大會,百度創始人、董事長李彥宏就在開幕式上發表視頻演講,**表示百度已在人工智能領域摸爬滾打10年,10年累計研發投入超1000億元,2021年核心研發佔比23%****,**研發投入強度持續位於全球大型科技公司前列。相較而言,去年前三季度,阿里、騰訊、美團的研發投入佔比分別約為15%、10%和8%。
持續的研發投入讓百度在人工智能領域愈發沉澱。**在2023年百度Create大會暨百度AI開發者大會上,****李彥宏提到,百度是如今少有的同時具備人工智能四層能力的公司,**這包括芯片層的崑崙AI芯片、框架層的飛槳深度學習框架、模型層的文心大模型和應用層的搜索、自動駕駛、智能家居等產品。
芯片層方面,百度是中國第一批自研AI芯片的互聯網公司。百度的崑崙AI芯片研發始於2011年,正式發佈於2018年。對外發布時,崑崙已支持百度業務多年。到2020年秋天之前,已有超2萬片崑崙芯片每天為百度搜索引擎、廣告推薦和智能語音助手小度提供AI計算能力。
框架層方面,百度飛槳是國內最早啓動研發的自研深度學習框架。2016年百度推出的飛槳在2021年成為中國開發者使用最多的深度學習框架,在全球排名第三,開源至今,飛槳已凝聚406萬開發者,服務過15.7萬企事業單位,開發模型達47.6萬個。飛槳能幫開發者快速創建、部署模型,它現在已擁有535萬開發者,服務了20萬家企事業單位,創建了67萬個模型。
模型層方面,百度在2019年發佈文心大模型,它可以根據用户的描述生成文章、畫作、視頻等多種內容,這就是去年至今大熱的“生成式AI”。目前,百度的文心大模型已更新迭代至文心ERNIE 3.0,參數規模高達2600億,是全球最大的中文單體模型。與此同時,文心ERNIE 3.0還支持生成式AI,具備強大的跨模態、跨語言的深度語義理解與生成能力。
基於文心大模型,百度目前已發佈11個行業大模型,大模型總量達36個,已構成業界規模最大的產業大模型體系。目前已大規模應用於搜索、信息流等互聯網產品,並在工業、能源、金融、汽車、通信、媒體、教育等各行業落地應用。
百度的**“文心一言”也正是基於文心大模型****而開發的國產版ChatGPT。**2月7日,百度公佈其類ChatGPT項目名為“文心一言”,預計將於3月完成內測並向公眾開放。當時,百度宣佈這一消息後,百度港股股價跳漲15%以上。
實際上,百度這些技術佈局,也往往始於技術微末之時,甚至被冠以“燒錢”的字眼。但也正是十年飲冰的堅持投入,使得百度AI大底座成為了行業內首個全棧自研的智算基礎設施。又正是長期技術積累帶來的全棧自研能力,給行業和百度本身,都帶來了更深遠的影響。

**文心一言,水平如何?**3月16日下午2點,百度的邀請測試展示正式召開。現場,李彥宏展示了文心一言在五個使用場景的表現,包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。
在文學創作方向,問題主要圍繞《三體》進行詢問,包括作品信息、核心內容、續寫創作。當然,文心一言也準確、詳細地介紹了《三體》作者劉慈欣。緊接着,文心一言總結了《三體》核心內容,條理分明地列出了3大點,並且還給出了5個續寫的角度。
在商業文案創作中,文心一言則順利完成了給公司起名、寫Slogan、寫新聞稿的創作任務。在連續3次內容創作生成中,文心一言既能準確理解人類意圖,又能清晰地表達。並且,在回答之餘,文心一言會自動增加冗餘的額外解釋**——儘管整體內容更傾向於正確的廢話**。李彥宏稱:“這些訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。”
**除了基本的文學方向,文心一言還可以嘗試解決含邏輯思維的數學推演題目,**現場演示中,雞兔同籠經典題型,文心一言的確表現出能理解題意,還給出了正確的解題思路,就像學生做題一樣,按正確的步驟,一步步算出正確答案。當然,解答本質上和當下的小猿搜題、作業幫等第三方解題軟件並無區別。
此外,在中文理解方面,文心一言還表現出先進的自然語言處理能力。在現場展示中,文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對應的經濟學理論,還用“洛陽紙貴”四個字創作了一首藏頭詩。
在多模態生成方面,李彥宏現場展示了文心一言生成文本、圖片、音頻和視頻的能力。比如,讓文心一言為2023世界智能交通大會創作一張海報。幾秒之後,一張賽博風格的圖片就生成了。有意思的是,文心一言還能根據內容生成四川話等方言的語音。
但遺憾的是,這些都不是實時演示**——**李彥宏表示,為了保證演示效果,文心一言現場問答測試為提前錄好的視頻。
這也不難理解為什麼發佈會召開後,百度股價不漲反跌,港股百度集團跌幅近10%。不少梗圖頻現,消費者對產品預期之低可見一斑。**實際上,就連李彥宏也****直言,文心一言對標ChatGPT,但不能叫完美。**尤其是從其回答表現來看,問題準確性與上下文的邏輯聯繫性表現尚可,以搜索引擎論已屬優異,但類人性不足,可明顯感知信息多從語料資料庫中集成而來,並無直接對話之感。
而反觀GPT-4,其在各種專業測試和學術基準上的表現與人類水平相當,不僅以前10%的超強能力通過了模擬律師考試,SAT成績達到710,且具備解決高難度數理邏輯,拆解多語言複雜題型,以及速讀看論文總結摘要的能力。兩相對比,確實高下立現。

未來之路漫長
當然,雖然市場用腳投票,表示了對百度文心一言的態度,但需要指出的是,文心一言也並未一無是處,至少在國內,其仍代表着第一梯隊的水平。
從技術角度而言,文心一言核心引擎為百度自主推出的NLP模型ERNIE,整體框架基於BERT模型改進。ChatGPT和文心一言都是基於Transformer模型架構,但GPT採用單向語言模型,而文心一言則****採用雙向語言模型。因此,在實際操作時,GPT對於文本生成更為敏感,比如聊天、寫作等語言生成方向表現優異,而文心一言對於文本理解更為敏感,在問答、語義關係抽取更有優勢。
也就是説,文心ERNIE類人性稍差,回答以精準理解為主,同時更多聚焦於本土化,在語義複雜的中文NPL處理中有顯著優勢,畢竟由於各種限制,即使是最新版本GPT-4測試的26種語言中也並未涵蓋中文。**實際問答題體驗中,當涉及中文語義理解時,ERNIE表現突出,甚至部分勝於GPT3.5。**比如,在關於洛陽紙貴的回答中,文心一言可正確理解其的經濟現象,古詩詞的可讀性和觀賞性也更高,更符合國人的審美與品味。
**當然,作為首發的國產版ChatGPT,文心一言的發佈也進一步暴露出國產化ChatGPT的困境。**雖然百度已經在AI的各個層面都有較為全面的佈局,並且具有中文世界裏最大的數據庫,但百度同時面臨的一個更大的困境,就是數據的質量問題,因為沒有高質量的數據就難以訓練出高質量的類ChatGPT產品。
如果百度訓練ChatGPT的數據優質,那麼輸出的結果也相對客觀。如果訓練的數據都是百度中文世界的網絡信息,那麼可能就要慎重,以免曾經的魏則西事件重演。**因為如果訓練的數據質量,以及產品背後的規則不夠清晰,結果可能就不會有那麼理性。**實際上,這也是中文互聯網的問題。
當然,就百度來説,其在人工智能領域還面臨着另外一個重要並現實的挑戰,那就是推行類ChatGPT的業務可能會對其傳統的搜索業務帶來影響。而傳統的搜索業務中,廣告收入是百度當前最主要,也是大部分的利潤來源。如果百度的傳統搜索業務中的廣告業務受到了類ChatGPT技術的影響,必然會影響到百度的研發投入。
此外,在落地場景方面,ChatGPT能否適應中國各行各業的碎片化轉型需求,尚有待驗證。李彥宏也坦言,“ChatGPT是AI技術發展到一定地步後產生的新機會。但怎麼把這麼酷的技術,變成人人都需要的好產品,這一步其實才是最難的,最偉大的,也是最能產生影響力的。”
對於人工智能而言,比拼的不單單是人工智能領域的技術研發,而是集人工智能研發、算力、芯片、數據等多方面的集成綜合實力。而百度和文心一言才剛剛出發,未來還有很長的路要走。