重讀百度:文心一言意味着什麼?_風聞
新熵-新熵官方账号-拒绝冗余,洞察商业变量,探寻商业本质。02-22 19:19

@新熵 原創
作者丨樟稻 編輯丨伊頁
2022年11月30日,人工智能領域可能也迎來了與網景導航者的問世同樣重要的關鍵時刻。當天,OpenAI的首席執行官山姆·阿爾特曼發推文稱:“今天我們發佈了ChatGPT。歡迎點擊這裏與它聊天。”
沒承想,這一應用以迅雷不及掩耳之勢成為眾人茶餘飯後討論的話題。據瑞銀的一份報告顯示,在ChatGPT推出僅兩個月後,它的月活用户已經突破1億,成為史上用户增長速度最快的消費級應用程序。
隨着ChatGPT的爆火,眼下其產生的巨大吞噬力如同黑洞一般,吸引着國內外各大科技互聯網企業,紛紛宣佈要在ChatGPT背後的大語言模型賽道佈局。
**在外界看來,大語言模型的成熟是人工智能里程碑,更是分水嶺,這意味着AI技術發展到臨界點,也同樣預示着將對原有商業模式進行重塑。**由於大語言模型影響最大的將是搜索引擎行業,市場紛紛聯想到百度。
作為國內搜索引擎和人工智能的代表,百度自然不會錯過這次機會。此前在2月7日,百度確認大語言模型名為“文心一言”,英文名“ERNIE Bot”,預計三月份完成內測,面向公眾開放。
就在2023年2月22日,百度發佈了截至2022年12月31日的第四季度及全年未經審計的財務報告。2022年,百度實現營收1236.75億元,歸屬百度的淨利潤(非美國通用會計準則)206.8億元,同比增長10%。第四季度,百度實現營收330.77億元,歸屬百度的淨利潤(非美國通用會計準則)53.71億元,同比增長32%。2022財年,百度核心連續四個季度業績超市場預期。
輔以財報數據,我們可以嘗試探尋,在人工智能領域深耕數十年的百度,能否乘文心一言東風完成自我變革,引發行業“重讀”。
搜索的代際變革
早在ChatGPT發佈的第一天,就有生成式AI要取代搜索引擎的聲音出現,原因在於,ChatGPT本質上是自然語言生成式AI,天然適用於搜索場景,提供高度智能的對話式搜索結果。
對此,行業形成的共識是,ChatGPT在中短期內仍無法完全取代傳統搜索引擎,但將會加速搜索引擎演化進程,並在中期形成以傳統搜索為主、ChatGPT類模型為輔的新搜索引擎形態。也就是説,生成式AI是搜索引擎的新奇點。
這與百度的想法不謀而合。
今年1月Create AI開發者大會前夕,百度搜索宣佈將基於百度自研的生成式模型,升級“生成式搜索”能力,並指出,生成式AI和搜索引擎是互補關係而不是替代,搜索底層技術和AI底層技術是相通的。
更早之前,百度董事長兼首席執行官李彥宏曾在一場內部直播中表示,AIGC(AI生成內容)和ChatGPT這些都是AI技術發展到一定地步後產生的新機會。“這個事情很難,但百度必須要做。”
彼時,市場還在觀望百度將如何參與這場熱潮,答案很快被揭曉——2023年2月7日,百度官宣即將發佈的大模型新項目:文心一言(英文名ERNIE Bot)。
此後時隔一日,經媒體披露,百度董事長兼首席執行官李彥宏2023年一季度OKR關鍵任務為“引領搜索體驗的代際變革”。顯然,文心一言將在這輪變革中起到核心作用。
譬如,文心一言是搜索引擎實現“模糊搜索”到“精準推送”跨越的關鍵:生成式AI問世之前,搜索引擎以“模糊搜索”為主,用户需要根據在搜索引擎中打入關鍵字找到需要的內容或鏈接,而通過文心一言,用户可以通過自然語言交互的方式輕鬆獲得需要的內容或鏈接,且內容較為精準,即“精準推送”。
與此同時,生成式內容也會極大豐富內容生態和內容供給,讓成熟的搜索業務和搜索體驗煥發生機。這在於,決定一個內容產品平台優質與否最關鍵的因素是內容數量、內容質量、客户互動。
從這個角度來看,文心一言勢必提高百度在內容層面的核心驅動力。例如,文心一言可有效對已有信息進行語言整合、文字輸出,人類只需扮演提供靈感的角色,AI將協助創作過程生成個性化的文本內容。
至於被市場關注的生成式AI整合進搜索引擎對於商業模式的挑戰,百度並沒有這方面的擔憂。
首先,百度營收更趨多元化,非廣告營收佔比逐季增加。根據財報數據,2022年Q4,百度核心收入為257億元人民幣 ,其中,廣告收入為181億元人民幣,非廣告收入為76億元人民幣,同比上升11%,主要受百度智能雲及其他AI驅動業務的推動。
其次,文心一言對於廣告業務更是一次重大利好。原理很簡單,有機器學習行業人士解釋道,“從商業模式的角度,廣告業務最大的關鍵點是平台的控制力,平台的控制力越大,粒度越細,變現的空間越大。”
可以預見的是,伴隨文心一言接入搜索,除開因文心一言帶來的DAU及用户使用時長的攀升,同時搜索將能夠充分利用類ChatGPT技術完善升級,形成搜索代際變革。
智能雲有了最新解
文心一言為搜索業務帶來的改變毋庸置疑,而在搜索之外,一場雲計算行業的“AI浪潮”,也正在醖釀當中。
需要瞭解到,百度整體劃分為三條核心業務線,一是成熟的移動生態業務,二是快速發展的智能雲業務,三是未來硬科技的智能駕駛業務。當下,智能雲已經成為百度的第二增長曲線。

今年1月5日,IDC發佈《2022 H1中國AI雲服務市場研究報告》,數據顯示,AI公有云服務廠商市場格局相對穩定,2022上半年百度智能雲仍然穩居第一,整體市場份額佔比28.1%,這也是百度智能雲連續四年市場份額第一。
從這方面來看,憑藉智能雲“雲智一體”的獨特競爭優勢,百度將幫助企業實現雲和AI技術與業務實踐的結合,為企業實現全場景的解決方案,加速企業數字化轉型、產業智能化升級進程。
眼下,在ChatGPT爆火後,微軟宣佈Azure OpenAI服務全面上市,通過該服務可以訪問OpenAI開發的AI模型。目前,已經使用該服務的客户有半導電視台、畢馬威、RPA廠商Moveworks等等。
對於微軟而言,自2017年轉變戰略,由“移動為先,云為先”轉向“智能雲、智能邊緣計算”,為AI、雲計算、數據等領域服務,AI已經成為微軟贏得下一時代的重要棋子,也是此次從ChatGPT受益的前提。
而百度也可將文心一言通過百度智能雲提供給企業和機構客户,在同一思路下,文心一言將作為雲業務的一部分,為百度智能雲贏下更多的市場空間。
如同百度集團執行副總裁、百度智能雲事業羣總裁沈抖所述,文心一言是基於百度智能雲技術打造出來的大模型,它將根本性地改變雲市場的遊戲規則,雲服務將從數字時代躍遷到智能時代。
**這裏其實還有一筆“隱藏收入”。**考慮國內生成式AI的創業潮攀升,算力需求將成為擺在面前的一大問題。對此,根據投資機構A16Z最新推測,生成式AI市場裏的大量資金,其實最終流向了基礎設施公司。
A16Z估計,應用程序公司平均將約20%-40%的年收入,用於推理和定製化的微調。這部分通常直接支付給雲服務提供商以獲取實例,或支付給第三方模型提供商,後者將大約一半的收入投入於雲基礎設施。
除此之外,訓練着自有模型的初創公司們,已經籌集了數十億美元的風險投資,其中大部分(早期階段高達80%-90%)通常也花在雲服務提供商身上。
據此,有理由推測,生成式AI總營收的10%-20%將流向雲服務提供商。百度作為在AI領域最有話語權的國內雲廠商,無疑是生成式AI初創公司的最佳選擇。
總體而言,伴隨大模型、AIGC為代表的AI應用不斷成為行業熱議話題,AI原生時代正在加速到來。而早期就選擇在智能雲方向深耕的百度,理所當然成為國內最為受益的雲廠商。
藉由文心一言,重讀百度
眼下,國內眾多科技企業紛紛開啓軍備競賽,一個問題也隨之被拋出,誰能在大語言模型的競爭中搶佔先機?從這個角度來看,已經有超過20年發展歷史、最鮮明的標籤始終是AI的百度,無疑是“無冕之王”。
早在2010年,百度開始探索AI技術,成為中國最早佈局AI技術的巨頭企業。在這十年中,百度在AI技術研發上的投入早已超過1000億元,幾乎構成了百度過去十年的主旋律。
從本次財報中也能看到,2022全年,百度核心研發費用達到214.16億元,佔百度核心收入比例達22.4%。過去十年,百度的年研發投入佔營收比例均超過15%。
**持續高強度研發投入,使百度的AI 技術全面領先。**根據《2022 年百度人工智能專利白皮書》,截至2021年底,百度全球人工智能專利申請超2.2萬件,其中中國專利申請量超1.6萬件,授權專利超4600件。

去年12月27日,百度智能雲發佈國內首個全棧自研的AI基礎設施“AI大底座”,並全面升級25項產品和技術。簡單來説,AI原生時代,百度把芯片、大模型、深度學習框架等高門檻的技術,變成像水電一樣供客户按需取用。
**聚焦到開發大語言模型需要的技術上。**人工智能的快速發展依賴於三個核心要素:數據,算法,算力,在這三項上,百度在芯片層、框架層、模型層和應用層進行全方位佈局,具備堅實技術底座。
數據層面,大語言模型訓練使用主要來自互聯網的文本數據庫,而百度的搜索業務在真實數據和用户需求理解方面積累有先發優勢,這些大規模結構化非結構化數據有望支撐文心一言的充分預訓練。
算力、算法層面,百度自研AI芯片崑崙,可為不同場景中的AI應用提供多元化、高性能、彈性易運維的算力服務。此外,百度擁有多個雲計算可用區、龐大的超算集羣,奠定大模型訓練的基礎設施。
再結合與GPT3大模型對標的百度文心大模型——2021年發佈的“鵬城-百度·文心”(ERNIE 3.0 Titan)參數規模已達到2600億,是目前全球最大的中文單體模型。

從這幾方面來看,得益於四層技術棧,在大語言模型相關技術的科技競賽中,百度在中國乃至全球範圍均具有綜合優勢。
據瞭解,目前已經有包括互聯網、媒體、金融、保險、汽車、企業軟件等行業的近300家頭部企業宣佈加入百度文心一言生態,百度的AIGC生態圈已初具雛形並即將快速拓展。
隨着文心一言商業生態的逐漸成熟,後續對百度業務(搜索、雲業務)帶來的賦能,勢必將引發行業“重讀”寄身於AI信仰的百度。