Why always百度?OpenAI有的他有,OpenAI沒有的他還有_風聞
量子位-量子位官方账号-02-23 14:37
魚羊 一言 發自 凹非寺
量子位 | 公眾號 QbitAI
此時此刻,枕戈待旦,全力衝刺。
這是最新一季財報披露後,李彥宏在全員信中表達的百度狀態。
也是大語言模型技術火爆中,尋找中國版、抓住人工智能新範式機遇的呼聲中,百度獲得的期待——關於誰能給出最好回應?
在中國,最先被想到、最後被確定、最被多數人看好的,唯有百度。
看好百度,確實有最直接的原因:OpenAI有的他有,OpenAI沒有的他還有。百度早就完成了大模型技術研發,文心大模型技術力突出,產業落地還領先;百度還有天然的場景和資源,先進的計算資源,無人能比的中文搜索優勢。
但讓李彥宏壯懷激烈的,不止於此。

他看到的是人人都開始談論人工智能的顛覆性影響;他激動的是生成式AI和大模型的智能湧現給計算範式帶來的全新機遇,他認為AI技術已經發展到一個臨界點,各行各業都不可避免地被改變。
百度創始人還強調,曾經的提前出發和佈局,只為現在機會來臨時能夠率先抓住機遇,勇敢創新,用創新驅動新的增長。
中國AI市場即將迎來爆發性的需求增長,其商業價值的釋放將是前所未有的、指數級的。而百度作為中國人工智能市場長期增長的最佳代表,正站在浪潮之巔。
而這種前所未有的變革,將從文心一言帶來的重塑開始。
最受關注的還是大語言模型“文心一言”
此前,百度已經釋出3月份上線新一代大語言模型產品“文心一言”的消息。
而李彥宏內部信也用一半篇幅,進一步顯現了百度對這一生成式AI產品的重視。
根據內部信,百度計劃將多項主流業務與文心一言整合:
• 文心一言與搜索整合,將引領搜索體驗的代際變革;
• 文心一言將通過百度智能雲對外界提供服務,根本性地改變雲計算市場的遊戲規則;
• 文心一言將進入Apollo智艙系列產品,並與小度進行集成。
就是説,文心一言這一對話類生成式AI,不僅會出現在百度自家的搜索、語音助手產品中,還將對外輸出。
目前,已經有不少媒體、機構,宣佈將接入文心一言。
在財報電話會上,針對外界普遍關心的文心一言的表現,李彥宏信心十足:
百度的文心大模型是中國市場非常本土化的大語言模型,這意味着百度現在正在研發的文心一言,將比國外開發的模型更適合中文和中國市場。
財報發佈後,百度美股盤前漲超6%。
種種現象表明,在生成式AI這件事上,國內最受關注、最受期待、最被看好的,還是百度。
其中原因,既與公司屬性有關,又是百度佔據“地利”的體現。

自大語言模型引發熱議以來,不少業內人士都指出,此類產品需要耗費巨量雲計算資源。OpenAI本身的成功,離不開微軟這棵大樹:
早在2019年,微軟就給OpenAI砸了10億美元,成為其獨家雲計算供應商。截至今年,微軟已累計向OpenAI投了130億美元。
因此僅從成本的角度考慮,國內BAT等本身擁有云計算業務的大廠,天然具有算力資源優勢。
在其中,百度在算法和數據方面的儲備優勢最為明顯。
最直接的技術儲備方面,百度在大模型上的技術積累可以説是國內獨一檔的存在。
2019年,百度就提出了ERNIE。ERNIE是一種知識增強的預訓練模型,即在深度學習的基礎上融入了知識圖譜。
中文語言環境中,ERNIE在完形填空、命名實體識別、情感分類等任務場景中,都有優於BERT的表現,曾一度登頂NLP權威數據集GLUE榜單,並創紀錄地首次突破了90分大關。

百度的大語言模型文心一言正是在ERNIE的技術樹上發展而來。
其大模型體系,已經橫跨NLP、CV、多模態、生物計算四大基礎領域,還在電力、燃氣、金融、航天、傳媒等11個行業中以行業大模型的形態,積累了落地實踐經驗。
從ERNIE 1.0算起,文心大模型在公開權威語義評測中已斬獲十餘項世界冠軍。

值得一提的是,在Chatbot初露頭角之時,百度就發佈過開放域對話大模型PLATO-XL。這是全球首個百億參數的中英文對話預訓練生成模型。
算法之外,以搜索為核心業務的百度,還擁有20年產品業務沉澱下來的海量數據和用户。
數據對於大模型的意義無需多言。而英偉達AI科學家Jim Fan還做過這樣一個對比,闡述谷歌作為後發者,在面對OpenAI挑戰時仍然具備的優勢:

即在用户量遠超對手的情況下,一旦開放用户體驗與用户持續反饋的飛輪建立起來,對話AI產品的反饋迭代速度將直接起飛。
對於百度而言,這一點同樣適用。2022年12月數據顯示,百度App月活躍用户達到了6.48億,同比增長4%。
更重要的是,在開發大模型這件事上,李彥宏內部信中也強調了百度已經具備的完整技術棧:從底層芯片,到訓練框架,再到模型、應用,百度均有自研技術。
這也就意味着,百度有能力把算力、算法、數據三大要素集結到同一個體系結構當中。這種綜合優勢在中國乃至全球範圍內,都只有少數幾家人工智能公司具備。

自身實力過硬之外,百度還佔據“地利”。
首先,相比於谷歌的措手不及,中文搜索領域事實上存在緩衝區,並且目前,國內並沒有能立刻補上對話AI+搜索應用這一空白的公司。
而且百度不僅佔據中文搜索無可動搖的地位,還握有更懂中文的文心大模型,更有完整技術堆棧——近期市場上的穩定表現和反饋,也就都在情理之中了。
其次,在AI產業化落地進程中,百度一直扮演着排頭兵的角色。在年初的百度AI開發者大會上,李彥宏還曾表示,真正的創新要靠產業實際應用中的“反饋”才能實現。
在國內,百度是第一批把大模型真正落地應用到產業當中的公司。比如國家電網,就和百度合作打造了電力大模型,以解決複雜自然環境中設備巡檢等業務問題。在應對產業需求上,百度有着長期實踐和第一手應用經驗。這對於百度而言,其實也藴藏着一個新的機會:文心一言不僅能夠和百度搜索強強結合,在對外合作中,也更有可能直接給合作方帶來應用價值。
所以從另一種維度看來,大語言模型創新、文心一言對於百度,與其説是市場競爭帶來的壓力,更像是一個AI時代的新機會,一個AI市場迎來爆發性增長和商業機遇中,給一個長期守望者和準備者,激勵式的機遇。
更關鍵的是,在這輪機遇面前,百度可謂潮平岸闊風正帆懸。
在過往三年嚴峻大環境考驗中,百度一手提升了健康經營度,展現了穩健態勢;另一手通過組織調整和管理重組,建立了一個更高效的組織;而財報業績,最能反映變革效果和當前狀態。
財報業績如何反饋?
百度交出了一份亮眼的財報,連續四季度業績超市場預期。
2022年全年,百度實現營收1236.75億元,歸屬百度的淨利潤(非美國通用會計準則)206.8億元,同比增10%。
第四季度,百度實現營收330.77億元,歸屬百度的淨利潤(非美國通用會計準則)53.71億元,同比增長32%。

核心收入方面,2022年,百度核心收入為954億元,與去年基本持平。但值得關注的是,其中非廣告收入259億元,同比增長了22%,佔到核心收入的27%。
其中,AI驅動下的雲計算和創新業務,正在展現出新增長引擎價值。
財報披露在2020年和2021年,非廣告收入在百度核心收入中的佔比分別為16%和22%——智能雲帶來的貢獻相當突出,AI加持下的百度智能雲,為行業提供標準化的解決方案,提高了利潤率。
根據IDC報告,2022年,憑藉雲智一體的優勢,百度智能雲連續四年穩居AI雲服務市場第一。另外,百度的智能交通解決方案,以累計合同金額超過千萬元人民幣訂單計算,已經被69個城市採用,而且落地城市的緩堵保暢中發揮關鍵作用。2023年春節期間,保定、株洲、陽泉、重慶等多個城市,市內出行強度創5年來新高,而通行效率提升均達到15%以上。
除了將自動駕駛技術與大交通、雲計算融合,在終端落地中,百度也鞏固了全球最大的自動駕駛出行服務商地位。截至2023年1月底,蘿蔔快跑累計訂單量超過200萬。並且在全球“無人化”落地的關鍵分水嶺中,百度完全無人駕駛運營取得了突破,開始在武漢和重慶提供全無人出行服務,並獲准在北京開展全無人駕駛測試。
這種行業第一,百度財報還披露了兩個:一是智能終端,小度在2022年前九個月,位居中國智能屏和智能音箱出貨量第一。另一個是AI開發者平台,截至2022年底,百度飛槳平台開發者已經發展到535萬,服務了20萬家企業,同樣位居中國深度學習市場應用第一。
所以確實如李彥宏所言,人類進入人工智能時代,IT技術的技術棧發生了根本性的變化。百度是全球為數不多、進行全棧佈局的人工智能公司,從高端芯片崑崙芯,到飛槳深度學習框架,再到文心預訓練大模型,各個層面都有領先業界的關鍵自研技術,可以實現端到端優化,大幅提升效率。
這種全棧佈局,正是百度各項AI新業務業績突出的核心原因,但知易行難,背後其實離不開馬拉松式的堅定研發投入。
財報顯示,2022年,百度核心研發費用達到214.16億元,佔百度核心收入的22.4%——這基本也是常態,百度的研發投入節奏,基本穩定在營收的**20%**左右。

實際上,百度還已經把這種對於技術投入和研發投入的堅定,寫進DNA中。不管疫情前後,還是AI市場熱情冷熱不同的時期,李彥宏和百度上下對技術研發的信念沒有發生過改變,在回港二次上市的演講中,他就留下過金句:
有1塊錢的時候,我們會投進技術裏;有1個億,我們會投進技術裏;有100個億,我們還是會投進技術裏。
所以在這種始終熱愛技術、願意為長期投資、為未來投資的信念面前,“為什麼總是百度”的問題,答案不言自明。

為什麼又是百度?
生成式AI、大語言模型技術火了,當外界眾裏尋他千百度時,有人這樣問。
為什麼總是百度?
當自動駕駛展現創新變革,當AI基礎框架面臨斷供擔憂,當AI芯片被破圈熱議,當人類全新技術創新週期裏中國能否留有姓名……每一次關於技術和創新的討論和提問中,又總有人從百度那裏給出回答。
發生在技術領域的現象往往是這樣的,每當新技術爆發、新風口出現,百度都會出現在種子選手名單中,且不是蹭熱點、因為看見才相信,而是已經獨自上路,孤勇探索已久了。
2012年開啓的深度學習是這樣,2013年上路的自動駕駛是這樣,以及2010年就已經出發的自然語言理解研發也是這樣——沒有這種“江湖夜雨十年燈”式的提前出發,哪有生成式AI和大語言模型技術展現顛覆式影響時的枕戈待旦、最後一擊。
如今,關於文心一言將帶來的影響,正在被所有人看到和談論。
比如搜索將被重新定義,除了提供更好的搜索和答案,還會帶來全新的交互和聊天體驗,以及獨特的生成內容——一個新的流量入口正在被開啓。
又比如與智能雲協同,會改變傳統雲計算服務看算力、存儲的舊習慣,會進入看框架好不好、模型好不好,以及模型、框架、芯片、應用之間的協同的新遊戲規則。
以及人人受益的智能終端變革中,智能助手會更聰明、更善解人意,智能座艙會帶來更加先進的人車交互體驗。
所以此時此地,AI技術確實到了發展的臨界點,商業價值的釋放確實將前所未有、指數級增長。
百度確實也將毫無疑問獲得時代紅利中的最大回報,作為中國人工智能市場長期增長的最佳代表,站上浪潮之巔。
這令人嫉妒,也令人心悦誠服。
沒有什麼能保證我們所有人持續享受技術創新的紅利,除了讓敢於提前賭上一切開始技術創新的人,獲得應得的獎勵。