國產AI掀起“百模大戰”,突圍ChatGPT還要多久?_風聞
微果酱-微果酱官方账号-新媒体行业的观察者。05-10 17:31
曾經的“千團大戰”讓互聯網企業脱了層皮,如今的“百模大戰”再次呼嘯而來,而且更加迅猛。
出品 | 微果醬(wjam123456)
作者 | 陳出木
我們目前沒有訓練 GPT-5,也不會在短期內進行訓練。
近日,在麻省理工學院舉辦的“The Future of Business with AI”論壇上,OpenAI的首席執行官Sam Altman首次回應《暫停AI巨型實驗》的公開信。按照這位“ChatGPT之父”的説法,“建更大的模型,喂更多的數據”已經不能奏效,GPT-4的硬件條件也到了天花板。
但ChatGPT自發布以來掀起的科技軍備戰並沒有停息,其餘威在國內愈演愈烈,各公司在AI領域卷生卷死,各種大模型集中爆發,頗有十年前“千團大戰”的氣勢。相比此前數千家團購賽道玩家瘋狂燒錢,每一位“百模大戰”的參與者都在爭奪時間,試圖讓自己提前出線。
01#
“百模大戰”,一觸即發
原本,國內的這波“百模大戰”或許不會來得這麼快,但在國外的ChatGPT掀起AI熱潮之後,壓力給到了國內的科技公司。為了順勢提前卡位,各家都選擇且不管能否實戰,先把成果端出來溜溜。在媒體報道中,它們都屬於“類ChatGPT產品”。
在百度打響AI大模型內卷第一槍之前,大多還是小打小鬧。小公司的數據庫不夠,開發的AI大模型訓練不足;大公司則只停留在放出風聲的階段,阿里聲稱可能將AI大模型技術與釘釘深度結合,騰訊則表示成立“混元助手(HunyuanAide)”項目組來構建大參數語言模型。
直到2月7日,百度在公眾號官宣將推出大模型新項目文心一言(ERNIE Bot)。消息一出,全網翹首以盼,坐等百度大招。

沒想到的是,在3月16日文心一言新聞發佈會召開的前一天,GPT-4重磅推出,百度此前鋪墊的熱度為他人做嫁衣,還因為GPT-4的功能升級而被架到了毫無退路的期待高位上。
熱鬧之中,相比發佈會開始之前的眾望,發佈會開始之後鋪天蓋地的吐槽,諸如功能不驚豔、使用提前錄製的演示案例、需要邀請碼才能體驗等問題,讓文心一言在AI領域的路人盤岌岌可危,甚至被嘲“ChatPPT”。

而當時百度創始人李彥宏關於“百度文心一言和OpenAI差距可能在兩個月左右”的説法,在後來搜狗創始人王小川官宣與前搜狗COO茹立雲聯合創立的AI大模型公司“百川智能”之際,又被翻出來作為雙方隔空掐架的主題。很難想象,我們在2023年還能看到巨頭們互懟對方脱離一線。
但這只是“百模大戰”的冰山一角,過程中有無數公司或趕來入局,或官宣蟄伏的產品。無一例外的是,它們都吸取了百度翻車的教訓——拒絕高調直播,儘量配備現場實測。
阿里達摩院先是低調地在魔搭社區(ModelScope)放出了“文本生成視頻大模型”(體驗鏈接:https://modelscope.cn/studios/damo/text-to-video-synthesis/summary)。

至4月7日,阿里雲推出專門響應人類指令的語言大模型“通義千問”,面向企業及邀請用户開放,並表示在月底逐步開放文字生成圖像產品“通義萬相”。此外,旗下的AIGC交互系統和個性化大模型“鳥鳥分鳥”也將向行業開放。
實際上,阿里巴巴在大模型領域並非新手。其曾在2019年推出LLM模型(Large language model大語言模型)PLUG,在2021年官宣了多模態大模型M6,後者至今沒有對公眾開放,但據悉已在旗下產業應用。

目前,BAT已有兩家下場競賽,剩下的騰訊則另闢蹊徑,於4月14日發佈面向大模型訓練的新一代HCC**(High-Performance Computing Cluster)高性能計算集羣**。顯然,騰訊瞄準的是大模型最容易被卡脖子的算力問題。
躋身互聯網大廠新貴的字節跳動也沒閒着,旗下的火山引擎在4月18日發佈自研DPU等系列雲產品,並推出新版機器學習平台,支持企業客户更好地訓練AI大模型。根據火山引擎總裁譚待透露,“國內大模型領域的數十家企業,超過七成已經在火山引擎雲上。”
顯然,搞基層的這兩家未來必會有短兵交接的時候。

此外,據微果醬不完全統計,近期往大模型方向伸手的包括但不限於:
3月29日,三六零發佈360gpt“翻車”,十天後宣佈“360智腦”落地搜索場景。
4月8日,華為公開“盤古大模型”的進展,或將上線。
4月10日,崑崙萬維宣佈合作奇點智源的大語言模型“天工3.5”將發佈。
4月10日,商湯科技公佈大模型體系“日日新SenseNova”。
4月13日,知乎合作面壁智能發佈中文大模型“知海圖AI”。
4月20日,科大訊飛宣佈將於5月6日發佈訊飛星火認知大模型(https://xinghuo.xfyun.cn/)。
4月20日,出門問問宣佈內測大模型“序列猴子”。
4月21日,復旦大學的新版MOSS模型上線(https://moss.fastnlp.top/)。
……
如此密集的新品官宣場面,讓沉寂已久的科技圈沸騰了起來,也足以讓你對AI熱潮有更具象的認知。毋庸置疑,“百模大戰”一觸即發。
02#
“百模大戰”的實質和未來
不是誰都能拿到最後的船票
所有產品都值得用大模型重做一遍。
在2023年阿里雲峯會上,阿里巴巴集團董事會主席兼CEO張勇喊出如此口號。
這樣的説法在近幾年常常耳聞,每時興一種事物,所有產品、產業都能用其邏輯再做一遍,現在輪到大模型了。
放到應用層面來理解,每個玩家都期待藉着這個風口,把自家產品包裝一下再重新推廣出去。所以,目前各家的大模型都與本身業務類型相關,比如360智腦率先落地搜索場景,知海圖AI的首個功能“熱榜摘要”將對知乎熱榜的問答進行抓取並把梗概整合給用户。
這種風向在一定程度上説明了國內“百模大戰”的實質——相比底層技術的成熟程度,大家更加關注其應用的有效性。也就是説,當前大模型的內卷説到底仍然是互聯網企業主流業務的競爭,大模型的輔助作用更像是跟風的宣傳噱頭。
4月18日,釘釘、WPS、印象筆記在同一天官宣“AI辦公助手”,再加上相距一週前飛書發佈的“My AI”,都是大模型能力在辦公場景的落地。這便是“百模大戰”實質的力證之一,各家沒有將推廣筆墨花在背靠的大模型上,用户也並不關心,大家都聚焦在產品應用,實用才是硬道理。
所以,從初始提大模型必帶參數,到現在推出大模型只説明能如何應用,真正把大模型做出聲量的並不多。在這種情況下,諸如出門問問創始人李志飛等大佬,思路也從做通用型大模型轉向做結合自身業務場景的垂直整合大模型。

釘釘現場演示
另一方面,“百模大戰”實際上卷的還是各家多年技術積澱的實力,所以也體現為大家仍是在自己擅長的領域進階的情況。
就像OpenAI公司在發佈ChatGPT之前已經深耕行業八年,微軟先後投資高達100億美元,OpenAI對於GPT-3的訓練費用超1200萬美元,“每次訓練消耗的電力足夠3000輛特斯拉汽車每輛跑20萬英里。”
國內“百模大戰”的玩家們應當對這個賽道的鉅額成本深有體會,所以除了頭部的幾家企業,餘者還是從自己擅長的產品出發做結合。當前能夠把成果真正拿出手的寥寥,而它們大多已經在自己當霸主的領域發展多年,沉澱了海量數據。

實際上,“百模大戰”發展至今,滿打滿算才三個月左右,競爭卻按天論計。現階段“百模大戰”的實質釋放出一些關乎未來的信號,我們不妨大膽預測:
1、“百模大戰”的後期會變成寡頭相持
由於算力、資金、技術門檻存在,能在大模型內卷中走到最後的或許還是資本實力和科技積累更加深厚的巨頭們,新生選手面臨更大的競爭困難。
2、“百模大戰”的升級天花板有限
算力限制讓GPT的發展都有所保留,“百模大戰”的最後必然需要直面這個問題,在追趕GPT的路上能走多遠或許與客觀條件有更強的相關性。
3、“百模大戰”的結局將回歸產品深化
巨頭們不會輕易放棄原有的優勢賽道,大模型之爭最終會落到產品應用場景,為“產品+AI”提供支持,加固原有的產品護城河。
4、“百模大戰”將延伸出更多垂直模型競賽
近來,國外大模型的相關動作就呈現了細分趨勢,這在一定程度上可以預示國內“百模大戰”的更多可能性:
OpenAI發佈了AI畫圖模型Consistency Models,支持修改現有圖像不需任何額外訓練和數據;英偉達推出AI視頻生成模型VideoLDM,可以根據用户的文本描述自動生成視頻;Meta推出AI模型Segment Anything Model,能根據文本指令等方式實現“一鍵摳圖”;微軟則擬推出AI芯片“雅典娜”,為大語言模型提供動力……

綜上所述,國內“百模大戰”可以算是ChatGPT掀起AI熱潮的一個縮影,無論是否準備好,時代已經推着所有企業走到了這一步。就目前來説,大模型們仍然處於“只聞其聲不見其人”的初級階段,旋渦中心的參與者未來必將還有鏖戰。
但對於普通用户來説,感知到的時候,科技競爭就已經決出勝負,最終落地的產品應用便是贏家。