人工智能需要開源模型才能發揮其潛力——《華爾街日報》
Kai-Fu Lee
約翰內斯·古騰堡的印刷機在15世紀徹底改變了人類生活,使思想能夠以先前難以想象的速度傳播全球,為人類帶來巨大進步。古騰堡試圖保守技術秘密,但心懷不滿的前投資人約翰·福斯特很快複製了他的設備。福斯特不僅自立門户開辦印刷廠,還挖走了古騰堡的首席技術專家彼得·舍費爾。
對後世而言,這實屬幸事。試想若印刷技術被某家公司壟斷或侷限於某個國家,人類數百年的進步可能永遠不會發生。這個類比雖不完美,卻為當前人工智能的爭論提供了有益視角。
能夠生成文本、圖像等多媒體的生成式AI,將在21世紀引發比印刷機更劇烈的變革。通過訓練具有數千億參數的大語言模型算法,生成式AI能消化幾乎全部人類知識範疇,具備寫作、繪圖、推理和解決問題的能力。這些強大工具將極大增強知識工作者的能力。
印刷機加速了知識傳播,而生成式AI將加速知識創造。它能以人類難以企及的速度理解、闡釋並創造思想內容。這項技術不僅會提升生產力、創造不可估量的經濟價值,更能幫助創業者致富並——更重要的是——改變人類生存方式。基於我四十年AI領域的經歷——從學者到微軟與谷歌從業者,再到風險投資人——我可以斷言:生成式AI將引發有史以來最偉大的技術革命。
但我們不能將這種力量僅鎖在特權精英手中。面對即將到來的重大技術範式轉變,讓不同背景的人們理解並接觸這項技術至關重要,確保無人被排除在外。正因如此,我決定創立01.AI——這家致力於構建生成式AI基石(基礎大語言模型)的初創公司。我們推出的首個擁有340億參數的Yi-34B語言模型,其源代碼已在GitHub開源,任何人都能使用、改進並定製它。
雖然Yi-34B的適中規模特別適合研究者、創業者和中小企業,但OpenAI和谷歌仍將其更強大模型封閉商用。我並非主張所有模型都應開源,但希望科技公司在追求商業目標的同時,也能擁抱並回饋開源社區。
科技巨頭可開源小型模型而保留大型模型專有權,這正是01.AI的策略。這種開放性能讓研究者、教育者、學生、創業者、愛好者及非營利組織都用上AI模型。這種包容性至關重要,因為許多羣體根本負擔不起昂貴的商用模型。擁抱開放,就是讓生成式AI走向民主化。
通過技術封閉來阻礙生成式AI普及,只會讓成功企業將工具鎖入黑箱,導致某些羣體被邊緣化。當前最先進的生成式AI模型主要基於英美數據訓練,雖然具備多語言功能,但對網絡資源較少的語言表現糟糕。來自小國或貧困地區的用户獲得的使用體驗大打折扣——他們既無資源構建本族語海量數據庫,也缺乏開發高質量母語模型的技術能力。這場生成式AI革命正在將他們遺落。
主流專有模型還存在美國偏見。由於訓練方式的原因,這些模型反映的是美國的文化和價值觀,可能並不適合其他地方。一個國家認為的常態,在另一個國家可能是冒犯甚至違法的。美國和歐洲之間存在巨大差異,更不用説西方與世界其他地區之間了。一個通用模型不可能滿足每個國家的需求。每個國家都應該有一個高質量模型,根據其文化、價值觀、宗教和語言量身定製。
一些媒體將01.AI描述為中國對ChatGPT開發者OpenAI的回應。我們自視為對OpenAI更“開放”的回應。在我們看來,關鍵競爭不是中國對美國的競爭,而是開放系統對封閉系統的競爭。即使資源有限,我們也決心為更多語言開發高質量模型,讓全球更多人能使用這項技術。我們不希望AI讓任何人掉隊。
作為技術樂觀主義者,我堅信人工智能將推動人類進步,放大而非取代我們的人性。但只有堅持開放的美德,才能實現這一目標。
李先生是01.AI的首席執行官兼創新工場董事長。
圖片來源:Getty Images/iStockphoto刊登於2023年11月30日印刷版,標題為《AI需要開源模型才能發揮潛力》。