中國大模型肉搏:得技術者勝,得產業者強_風聞
智谷趋势-智谷趋势官方账号-新中产的首席财富顾问。微信500强。07-21 20:39

大模型,洗牌開始了
AI大模型扇動翅膀,掀起了歷史的波瀾。
但沒人想到,浪潮僅僅捲過半年,就將迎來一次徹底的大洗牌。
去年11月30日,ChatGPT正式發佈,2個月用户過億。
今年6月,ChatGPT流量開始下滑。網站與移動客户端流量環比下跌9.7%,用户在網站的使用時長下降8.5%。
這被解讀成AI泡沫的一個徵兆:初期新鮮感消失,AI要回到現實;
另一猜測,是OpenAI的對手強者如雲,它並沒有真正的技術護城河。

谷歌內部文件泄密泄露:我們沒有護城河,OpenAI也沒有
OpenAI迅速給GPT-4安排上Code Interpreter功能,賺足一波眼球。“這就是GPT-4.5!”人們歡呼。
然而,Meta(前Facebook)突然動手,直接將自己的大語言模型Llama 2開源了。
Llama 2的水平在GPT-3之上。它的免費開源商用,簡直是一次殺手級的突襲,堪稱“AI大模型的安卓時刻”。
這意味着,許多公司尚在研發的大模型,已被淘汰了。因為別人可以直接用開源模型,免費的。
國內的AI進程,更加熱火朝天。
今年3月,百度首個發佈了“文心一言”,開啓國產大模型“超越ChatGPT”之路。
120天狂飆突進,互聯網科技公司、學術界大牛、大廠創業者、地方國家隊紛紛下場。國內發佈了79款10億參數以上的大模型。

不過,行業和專家都提出了質疑:
這麼多的大模型,同質化嚴重嗎?誰的技術更強?誰在更快進入產業,解決問題?
這個風頭上,國際數據公司IDC發佈了《AI大模型技術能力評估報告,2023》,想要設立一些標準。
IDC圍繞產品技術、行業應用、服務生態三個維度,設計了36項評估標準,對頭部大模型進行測評。
目前,國內的百度、阿里、騰訊、華為、科大訊飛、360、商湯等14家廠商都在評估之中。

從結果看,百度的文心大模型3.5綜合評分最高。並且,在算法模型、行業覆蓋上,都拿到唯一的滿分。
文心從發佈後一直在迭代。文心大模型3.5相比之前,模型效果已提升了50%,訓練速度提升2倍,推理速度提升了30倍。
多個公開測評顯示,文心3.5的綜合能力已超過ChatGPT 3.5。在中文能力上,已有超出GPT-4的表現,拉平了中美的技術差。
AI大模型第一戰正式結束,參賽者站在十字路口。
超越GPT-3的開源模型,還會繼續出現。通用大模型註定是少數人的遊戲,留下技術最頂尖的。
更多創業者將集中到中間層、應用層,在這些基礎模型之上做創新。
IDC中國高級分析師楊雯表示:
AI大模型的主要價值體現在技術、應用以及商業化3個方面:
在技術方面,AI大模型帶來了認知智能技術跨越式發展;
在應用方面,AI大模型可以為人類提供更加精準和高效的服務;
在商業化方面,AI大模型將會帶來軟件入口級的顛覆,並促進上層生態發展。
國內大模型公司,在迅速形成共識:技術差距追平後,產業縱深和商業化能力,是下一階段的戰場。

大模型,扎堆進產業
前幾天,我們在WAIC世界人工智能大會上,幾乎只能看到中美的公司。
行業客户們圍在各個大廠的展台前,最想知道兩件事:
AI到底能解決什麼問題?怎麼賣,賣多少錢?

WAIC的現場
目前的大模型參數規模太大,加上算力成本極高,暫時還無法降低價格。動輒千萬、上億的部署成本,讓人望而卻步。
在具體的行業場景,尤其是一些專業性強、知識密度高的領域,大模型的表現也還不夠精準。
行業大模型、產業落地、賦能千行百業,成為各大廠商給出的標準答案。
百度文心大模型,提出源於產業實踐,服務於產業實踐;
華為雲的盤古大模型,喊出了“不做詩,只做事”,聚焦行業場景和垂直領域;
騰訊雲也認為,“企業需要的,是在實際場景中真正解決了某個問題,而不是在100個場景中,解決了70-80%的問題”,他們探索了超50個行業大模型的應用解決方案;
京東言犀大模型,也是立足做產業大模型,要“把供應鏈做透 ,把大模型做實”。
這些廠商身上,透出一股極為務實、“接地氣”的氣質。
這有些反常的。更多想象的AI研究者,在科研機構、實驗室裏把技術打磨成熟,像ChatGPT,而非直接到行業中應用。
背後真相是,僅在過去10年,國內就經歷了兩輪AI創業潮。但倖存者寥寥。

“AI教父”Geoffrey Hinton
2012年的ImageNet大賽,“圖靈三巨頭”中的傑弗裏·辛頓以卷積神經網絡奪冠,讓深度學習火了。
學院派們下場創業,如科大訊飛、商湯、曠視、雲從等AI公司成為資本寵兒。

紀錄片AlphaGo劇照
2016年,AlphaGo戰勝圍棋冠軍李世石,AI真正意義上出圈了。
AI創業和融資進入高峯期,互聯網大廠全部入局。

2012-2023人工智能融資趨勢
70%的中國AI公司成立於2014-2018年,但90%的公司到2019年還深陷虧損。
在技術研發和產業落地之間,隔着一個複雜的現實鴻溝。大部分創業者沒熬到今年的AI潮。
而“活下來”的AI公司,也都領悟到了:人工智能一定要落地去解決問題,才能形成良性的商業模式,才能持續創造價值。
所以AI大模型們,都爭先恐後往行業裏鑽。

千行百業,用大模型重做一遍
產業落地跑在前面的公司,都已佈局了十幾年。
他們從之前的雲計算、互聯網+、企業軟件、新基建潮、產業互聯網時期,就在積累行業合作者和高質量數據。
在幫助行業數字化期間,他們就是從一線場景、複雜問題、龐雜需求的摔打裏練出來的。
在IDC評估中,百度文心拿到了唯一的行業覆蓋度滿分,因為其AI在能源、金融、教育、城市、工業、醫療等領域都有佈局和落地。

製造業的產業升級,是大家的期待。在2008年,中國有4500種商品要靠進口,很多是技術和工業品,比如集成電路、屏幕、汽車、工業設備。
到今天,我們很多技術實現了自立自強,比如大飛機、新能源汽車、液晶顯示面板。
**很多工廠的智能化,是從質檢環節開始的。**過去,一條流水線要十幾個質檢工人,人工的效率很低,即便之後有了工業視覺的輔助,也是一份辛苦、附加值很低的工作。
顯示面板又是典型的高精產品,生產工序複雜、精密,良品率極為關鍵,幾微米的瑕疵也無法容忍。
TCL與百度文心合作,構建了電子製造行業大模型。將訓練樣本減少30%-40%,還讓TCL兩個產線檢測mAP指標平均提升10%+,新產線冷啓動效率提升3倍,產線上線開發週期降低30%。
而在汽車製造,百度與長安汽車的合作又不同。
汽車設計需要經驗豐富的工程師,在2萬多種零部件、幾十萬個參數裏,去尋找滿足需求的排列組合,再寫成文檔、畫出圖紙。
通過百度大模型,可以迅速進行信息組合,自動生成設計文檔,大幅減少了汽車研發的時間和成本。
如果把行業大模型的能力,從一個工廠放大到一座城市,就是百度打造的智能交通解決方案。
今年的五一,居民旅遊出行達到高峯。假期前的最後一個工作日,北京城市的擁堵指數暴增了2.5倍,從二環堵到了六環。
亦莊,成了當時北京唯一不堵車的“綠洲”。因為當地部署AI全域信控方案,亦莊300多個智能路口,都能根據車流量自動調節紅綠燈。

同樣的AI交通已經在國內69個城市落地。根據百度測算,這能讓通行效率提升15%-30%,從而拉動GDP2.4%-4.8%的增長。
除此之外,百度文心還和浦發銀行打造金融行業大模型,與國家電網做電力大模型,還打造了政務、汽車、城市、航天、傳媒等11個行業大模型。
數字化程度高的企業,有數據積累、人才團隊、基礎設施,落地大模型應用相應也會走得更快。
絕大部分中小企業還未數字化,他們並非沒有機會,但更需要低成本、低門檻、開箱即用的系列產品。
湖北襄陽一位鐵路工人,靠自學使用百度飛槳的開發套件,獨立實現了從建設數據集、到模型訓練、再到模型部署的整套流程,做了一個自動識別火車車號的應用程序。
以前檢查貨運火車的車號,往往要人工核對數小時,襄陽車輛段用了這個程序後,只用3分鐘就能做完,給當地車輛段節省了20多萬的成本。
研究機構Epoch估算,AI和大模型訓練,要不了3年時間,在2026年就會耗盡所有高質量數據。

左起:低質量文本、高質量文本、圖像數據耗盡時間
數據是未來AI競爭的一個勝負點。
把AI普及的門檻不斷降低,到產業落地中去,產生和積累更多高質量數據。這個過程中,AI能力也會不斷迭代,更符合行業需求,從而開啓增長的飛輪。
百度集團執行副總裁、百度智能雲事業羣總裁沈抖説,
未來所有企業都將強依賴大模型,所有產品都會基於大模型開發。

百度文心,AI十年
技術+產業落地的先跑,是百度過去十年All in AI,戰略轉向最好的嘉獎。
現如今,百度是全球少數在芯片、架構、大模型、產業應用上,都擁有先進自研技術的企業。與微軟、谷歌、Meta一起,被評為全球四大AI公司。
**算力和芯片是當下焦點。**大模型的基礎層需要數以萬計的芯片,而英偉達GPU面臨斷供。
百度自研有崑崙芯,目前已部署幾萬片,並對外向行業輸出。第三代的崑崙芯片預計在2024年初就會量產。
同時,百度智能雲在山西陽泉修建了亞洲最大單體智算中心,每秒可以完成4EFLOPS(400億億次浮點運算),滿足文心的訓練和推理。
在框架層,百度的飛槳PaddlePaddle是中國首個開源的產業級深度學習框架,替代谷歌TensorFlow和Meta的Pytorch,在中國的市場綜合份額排第一。

模型層的文心大模型,包含30多個大模型,分為基礎大模型、任務大模型、行業大模型三級體系,全面滿足產業需求。

百度內部的產品,如搜索、信息流、地圖等,都已在進行AI原生重構。
同時,飛槳長期深耕產業落地,連接着750萬的開發者,20萬家企事業單位。文心共享飛槳生態,解決了大模型研發和部署難題,加快文心的產業落地。
作為AI的領軍者,百度不但培育出本土化的中國AI平台和工具,還在搭建一個教育、產業、開發社區的AI生態,要在5年為社會培養500萬AI人才,補充國內AI人才缺口。
今年5月,百度也宣佈設立10億元的百度文心投資基金,鼓勵投資中國的AI創業者,鼓勵他們文心大模型的能力、百度智能雲的算力,去開發和創新。

百度創始人李彥宏説:
新的國際競爭戰略關鍵點,不是一個國家有多少個大模型,而是你的大模型上有多少原生的AI應用,這些應用在多大程度上提升了生產效率。
如果我們能擠上牌桌,獲得競賽入場券,中國將擁有更壯大的數字化產業,數字經濟規模將獲得巨大增長。”
我們總是高估未來2年的變化,而又低估未來10年的變革。
不管你叫它智能時代、第四次工業革命,人工智能是用技術變革,打破一切格局的難得機遇。
大模型推動的歷史車輪,才剛剛開始。接下來的十年,註定也屬於AI。
先期的泡沫會不斷釋放,大模型公司不斷洗牌,這是必然的過程。
在產業落地的進程中,留下那些能真正走進行業,去解決問題、創造生態的公司。