人工智能需要開源模型才能發揮其潛力——《華爾街日報》

Kai-Fu Lee

2023-11-30

約翰內斯·古騰堡的印刷機在15世紀徹底改變了人類生活，使思想能夠以先前難以想象的速度傳播全球，為人類帶來巨大進步。古騰堡試圖保守技術秘密，但心懷不滿的前投資人約翰·福斯特很快複製了他的設備。福斯特不僅自立門户開辦印刷廠，還挖走了古騰堡的首席技術專家彼得·舍費爾。

對後世而言，這實屬幸事。試想若印刷技術被某家公司壟斷或侷限於某個國家，人類數百年的進步可能永遠不會發生。這個類比雖不完美，卻為當前人工智能的爭論提供了有益視角。

能夠生成文本、圖像等多媒體的生成式AI，將在21世紀引發比印刷機更劇烈的變革。通過訓練具有數千億參數的大語言模型算法，生成式AI能消化幾乎全部人類知識範疇，具備寫作、繪圖、推理和解決問題的能力。這些強大工具將極大增強知識工作者的能力。

印刷機加速了知識傳播，而生成式AI將加速知識創造。它能以人類難以企及的速度理解、闡釋並創造思想內容。這項技術不僅會提升生產力、創造不可估量的經濟價值，更能幫助創業者致富並——更重要的是——改變人類生存方式。基於我四十年AI領域的經歷——從學者到微軟與谷歌從業者，再到風險投資人——我可以斷言：生成式AI將引發有史以來最偉大的技術革命。

但我們不能將這種力量僅鎖在特權精英手中。面對即將到來的重大技術範式轉變，讓不同背景的人們理解並接觸這項技術至關重要，確保無人被排除在外。正因如此，我決定創立01.AI——這家致力於構建生成式AI基石（基礎大語言模型）的初創公司。我們推出的首個擁有340億參數的Yi-34B語言模型，其源代碼已在GitHub開源，任何人都能使用、改進並定製它。

雖然Yi-34B的適中規模特別適合研究者、創業者和中小企業，但OpenAI和谷歌仍將其更強大模型封閉商用。我並非主張所有模型都應開源，但希望科技公司在追求商業目標的同時，也能擁抱並回饋開源社區。

科技巨頭可開源小型模型而保留大型模型專有權，這正是01.AI的策略。這種開放性能讓研究者、教育者、學生、創業者、愛好者及非營利組織都用上AI模型。這種包容性至關重要，因為許多羣體根本負擔不起昂貴的商用模型。擁抱開放，就是讓生成式AI走向民主化。

通過技術封閉來阻礙生成式AI普及，只會讓成功企業將工具鎖入黑箱，導致某些羣體被邊緣化。當前最先進的生成式AI模型主要基於英美數據訓練，雖然具備多語言功能，但對網絡資源較少的語言表現糟糕。來自小國或貧困地區的用户獲得的使用體驗大打折扣——他們既無資源構建本族語海量數據庫，也缺乏開發高質量母語模型的技術能力。這場生成式AI革命正在將他們遺落。

主流專有模型還存在美國偏見。由於訓練方式的原因，這些模型反映的是美國的文化和價值觀，可能並不適合其他地方。一個國家認為的常態，在另一個國家可能是冒犯甚至違法的。美國和歐洲之間存在巨大差異，更不用説西方與世界其他地區之間了。一個通用模型不可能滿足每個國家的需求。每個國家都應該有一個高質量模型，根據其文化、價值觀、宗教和語言量身定製。

一些媒體將01.AI描述為中國對ChatGPT開發者OpenAI的回應。我們自視為對OpenAI更“開放”的回應。在我們看來，關鍵競爭不是中國對美國的競爭，而是開放系統對封閉系統的競爭。即使資源有限，我們也決心為更多語言開發高質量模型，讓全球更多人能使用這項技術。我們不希望AI讓任何人掉隊。

作為技術樂觀主義者，我堅信人工智能將推動人類進步，放大而非取代我們的人性。但只有堅持開放的美德，才能實現這一目標。

李先生是01.AI的首席執行官兼創新工場董事長。

圖片來源：Getty Images/iStockphoto刊登於2023年11月30日印刷版，標題為《AI需要開源模型才能發揮潛力》。