角逐AI大模型,是一場持久戰_風聞
赛格大道-09-12 16:03
賽格特約作者 餘紹清
史前智人經歷的最大一次低谷,很可能發生在7萬年前的某個時期。彼時,智人行將走出非洲,人口數量一度下滑到了數百人。但在穿越紅海抵達亞洲大陸後,我們的祖先進入了完全不同於熱帶非洲的廣闊天地,少數幾位女性的後代們,用了6萬年時間,覆蓋了藍色星球的絕大部分區域。
**在最低谷的時期,成功熬下去,便可以登上後續的高峯。與其説這是人類社會數萬年來的內置定律,不如説是根植於智人羣體的一種心理暗示。**在往後的人類發展歷程中,偉大事業的開創者,無一不是成功熬過低谷期的長期主義者。
今天,自18世紀以降陸續出現的交通與通信革命,使得人類社會的演進速率在持續提升,如果我們把人類社會的運行看成一條曲線,那麼就是説波峯與波谷之間的距離變得越來越近。
但可以確定的是,從2008年至今,再加上未來的5年、10年甚至更久,因為技術停滯不前而帶來的全球經濟萎靡、政治分裂、家庭收入減少乃至社會個體的普遍失落與集體瘋狂,將成為定局。沒錯,當下處在低谷期的不僅有國家,還有城市、企業、家庭和個體,所有人都在“熬”。
但縱觀各方,國家層面,不管大小,都在泛化“安全”概念,城市、家庭和大多數中小企業,都在收縮自己的資產負債表,個體則傾向於選擇躺平、低慾望,只有大型科技企業持有激進的高風險偏好。客觀上,科技巨頭們承擔着破局的社會期待,而這,也是去年OpenAI發佈ChatGPT之後,能帶來如此大規模衝擊的原因所在。
**身處大變局前夜,AI大模型激活了全球各地的科技巨頭,除了中美,還有印度、歐洲和以色列,都有機構在集中發力。**在中國,從3月份百度搶先發布“文心一言”,到9月7日騰訊亮相“混元”大模型,至此所有重量級玩家已全部入局。馬化騰説,這是數百年一遇的像發明電一樣的工業革命機遇,恰好表達了業內人士的心聲。

所有人都在等待大變局的到來,所有人都不清楚變革的精確時間,但幾乎所有人都認為,AI大模型是推動我們走出本輪低谷的關鍵角色。

AI大模型為何被視為救命稻草
假如把1946年“埃尼阿克(ENIAC)”的出現作為AI革命的起點,在過去四分之三的世紀裏,AI已經經歷了多輪起伏。
最近一次失望發生在“阿爾法狗(AlphaGo)”發佈之後,人們發現擊敗人類圍棋高手的AI,並沒有如期帶來生產生活上的衝擊波。而在上世紀80年代,研究經濟增長的經濟學家羅伯特·索洛(Robert Solow)發現,在個人電腦和互聯網開始勃興之際,雖然企業加大了IT方面的投入,但投資回報率(ROI)卻並沒有明顯得到增加。
一位名叫查斯曼(Strassman)的分析師,通過調查了292個企業印證了上述判斷,很多企業上了很多IT系統,但似乎並沒有什麼用。為此,學術界將這種現象稱為“生產率悖論”(productivity paradox),也稱“索洛悖論”。
類似的疑問在過去十多年裏的中國同樣存在:沒有切實的證據表明,近年來的產業數字化有效提升了全要素生產率。例如,從下圖可看到,儘管2011年以來AI在製造業中的應用持續增加,但製造業的增速和全要素生產率卻表現出波動下降的態勢。尤其是2013年以後,AI的使用迅猛增長,但是製造業全要素生產率卻從2011年的1.11下降到2020年的0.99。

不過,AI大模型的出現極可能將打破“索洛悖論”,這正是中美湧現“百模大戰”的真正原因。
對企業經營者而言,大模型第一次提供了便捷可用的“降本增效”產品,對金融公司來説,大模型提供的數據分析水平趕上了大學畢業2年的員工,時間和金錢成本比都可能是1比100;對於教育界來説,AI大模型可以進一步更精準地判別需求,定製化地提供服務,幫助用户提高學習的效率,預計全球AI教育市場很快達到60億美元,並在獲得市場認可後迅速擴張成千億美元市場。
服務業如此,製造業亦然。製造業領域過去推行數字化,用一個不恰當的比喻,有點像“馬拉火車”,部分環節的數字化非但不能提升生產率,反而加重企業負擔,導致發展質量下滑。但AI大模型出現後,隨着訓練水平的持續提升,大到生產、銷售,小到會議紀要、運營策劃,所有環節都可以被數字化,並且交由大模型進行計算。高盛的一份報告就認為,在AI大模型發展的十年內,預計每年可以將生產力提高超1.5%。
數據是石油,很早就有人喊出這句話。但要數據真正變成石油,必須首先依賴全域各環節的數字化才可能實現,其次也是更重要的,只有通過從海量數據中深度挖掘信息並將其轉化為知識資本,才能夠有效實現生產要素的功能倍增,由此帶來製造業全要素生產率的提升。
AI大模型之所以被賦予厚望,甚至被視為走出當下經濟與社會低谷的救命稻草,正是因為她已經初步展現了把數據變成石油的能力。

從應用到應用:本輪AI躍進的內核
從二戰末期“原子彈”的爆炸,到科學家範內瓦·布什的報告《科學:無盡的前沿》被時任美國總統杜魯門所接受,基礎科研及純理論科學家的地位獲得快速提升。在中國,從事“兩彈一星”的科學家名字也被廣為傳頌,院士、研究員、教授等高校科研院所的科學家們,也比企業研發人員獲得更為普遍的尊重。
**但在全球AI大模型的競賽裏,高校和科研院所卻相對邊緣,真正的主角全部集中在科技企業。**之所以會出現這樣的格局,是因為AI大模型能否獲得持續突破,並不是一個或多個理論問題,而在於能否快速形成“從應用到應用”的技術-商業正循環。
之所以會打破“基礎科研-技術創新-商業轉化”這樣的路徑,原因就在於AI大模型突破了原有的強弱人工智能邊界,過去人類智能時代所遵循的路徑,在人工智能面前必須做出改變。當然,更重要的是,無論是訓練大模型資金的持續投入,還是大模型對語料的高要求,都迫使整個AI大模型的發展向着落地應用走。
例如,在GPT-3階段,一次訓練費用就需要至少140萬美元,僅僅在今年1月,大模型每天的電費就要5萬美元;在國內,千億參數級別的大模型對GPU的需求至少在10億美元以上。除了科技巨頭,高校、科研院所幾乎不可能有能力進行這麼高昂的投入,更何況是持續投入。
對科技巨頭來説,這樣的投入也是不可持續的,所以企業必須儘快找到應用場景,找到願意埋單的消費者——無論B端還是C端。

所以,為什麼騰訊早在6月便率先發布行業大模型,其目的就在於通過展示自身在眾多行業的應用成果,來找到更多的消費者。9月7日的數字生態大會上,騰訊的一眾高管也同樣強調“騰訊各個產品都接入了混元大模型”這一核心信息,其目的在於突出自身應用場景豐富的比較優勢。
不僅僅是騰訊,Meta推出Llama 2開源模型後就與各家雲廠商打通,為的就是儘快獲得更多更豐富的應用場景。對應用場景的急切追求,並不代表對大模型訓練優化的忽視,相反,這本身就是一體兩面的存在。只有擴大應用場景,才能更好地優化大模型,在應用中提升服務水準。
客觀上,AI大模型將衝擊越來越多的科研工作者,近年來城池盡失的“分子生物學”只是一個信號,未來會有越來越多的學科將受到AI大模型的挑戰。這背後,不僅僅是科學家何去何從的挑戰,更是科研範式如何變革的問題。當然,這是另一個問題,不作延伸。

堅定的長期主義者,才可能穿越週期
從社會情緒上來看,悲觀是當前全球的主色調。局部戰爭與地緣衝突還在持續,通脹高企與貧富兩極化看不到被遏制的跡象,就連AI大模型獲得突破本身,也很快引發了倫理層面的爭議,不安全感籠罩在眾人的頭頂。
在中國,泛安全的隱憂同樣瀰漫在社會的各個角落。在承受了多年制裁高壓後,公眾以“輕舟已過萬重山”的詩句進行提前式的自我安慰,同時以“遙遙領先”這樣略帶調侃的戲謔,試圖呼出積壓在體內的一口悶氣。
但在北緯三四十度的土地上,凌晨三點只能看到星斗若干,距離東方魚肚白還需要忍受一陣接着一陣的孤寂與寒意。
對於微觀意義上的家庭與個人,也許可以在經緯大地上輾轉騰挪,選擇別處的自由與光明;但對於宏觀意義上的民族-國家、科技巨頭,必須選擇直面黑夜,穿越低谷,以迎接黎明,抵達高峯。
**某種程度上,AI大模型的角逐就像人類社會演化的隱喻,只有堅定的長期主義者,才能穿越技術-經濟的發展週期。**在穿越時,不到最後,沒有人知道誰是真正的長期主義者。因為真正的長期主義者,僅僅憑藉足夠的理性是不夠的,還需要一點信仰,一點被迫和一點運氣。
(原文首發於財新網,部分內容有改動)