DeepSeek與開源AI模型如何顛覆科技巨頭 - 彭博社
Rachel Metz, Seth Fiegerman
OpenAI與DeepSeek旗下AI應用的標識圖片來源:彭博社科技企業與學術界長期在開源軟件的利弊之間博弈。而生成式人工智能的熱潮為這場辯論注入了新的內涵。
深度求索(DeepSeek)等中國企業近期推出一系列低成本開源模型,足以比肩美國頂尖AI開發商的軟件。作為回應,美國AI領軍企業OpenAI發佈了六年來首個開源模型。特朗普政府正呼籲更多美國科技企業效仿此舉。
以下是關鍵信息解讀。
何為開源?
廣義而言,開源指將源代碼公開供任何人使用或修改的軟件。總部位於加利福尼亞的非營利組織開源促進會(OSI)指出,要獲得開源認證,軟件必須符合特定的分發與獲取條款,該組織長期倡導開源工作模式的優勢。
OSI強調,要使AI模型被認定為真正開源,開發者必須提供模型訓練數據的詳細信息,並允許人們出於任何目的研究、使用及修改該系統。
相比之下,閉源軟件和模型由開發者掌控,不允許修改,其技術基礎也缺乏透明度。
頂級AI開發商是否提供開源軟件?
許多科技公司將其AI軟件標榜為開源,但並非所有人都認同它們符合這一定義。
Meta Platforms Inc.、法國初創公司Mistral以及如今的深度求索(DeepSeek)都發布了自稱開源的AI模型。
但這些模型通常屬於所謂的"開放權重模型"。這意味着除了提供模型及部分源代碼外,公司會公開權重參數(即模型在訓練過程中學習調整的數值集合,便於開發者定製),但不會透露實際訓練數據的具體細節。
以Meta為例,該公司公開了Llama系列AI模型的權重和部分源代碼,但未提供訓練數據的詳細信息。此前開源倡議組織(OSI)也曾批評Meta的許可協議包含對商業用途的限制條款。
類似地,深度求索在1月宣稱其最新系統R1是開源模型,但未公開代碼或訓練數據。這引發質疑:該公司究竟使用什麼數據構建模型?
儘管名稱含"開放",OpenAI並未開源其多數模型。但在深度求索爆紅後,OpenAI首席執行官薩姆·奧爾特曼承認ChatGPT開發商需要"制定新的開源戰略",並稱:“我個人認為我們在這個問題上站錯了歷史陣營。”
8月,OpenAI發佈了兩款模型,分別名為GPT-oss-120b和GPT-oss-20b,它們是類似於Llama的開源權重系統。這些模型可在AI軟件託管平台Hugging Face上免費獲取。這些模型能夠模擬人類推理過程,並根據用户提示生成文本(但不包括圖像或視頻)。
開源的好處是什麼?
開源軟件的倡導者通常認為它對用户更經濟實惠,因為它不需要支付相同的許可費用。更低的價格為更廣泛的人工智能應用鋪平了道路,而降低的開發成本則促進了創新。支持者還指出,這種方法通過讓其他人更好地理解模型的工作原理,增強了開發強大AI系統的開發者的責任感。
封閉系統存在產生由少數強大公司主導的AI市場的風險。雲存儲公司Box Inc.的首席執行官Aaron Levie表示:“在非常昂貴且專有的AI世界中,AI的提供者可以而且很可能應該選擇將所有經濟利益留給自己——這基本上會擠佔開發者和生態系統中的機會。”
對於Meta這樣的公司來説,開源還有一個額外的好處:普及度。通過允許其他開發者自由訪問並基於其開源軟件進行構建,Meta得以在整個AI生態系統中擴大其影響力。
開放系統存在哪些風險?
開源軟件的批評者認為其安全性較低。在人工智能領域,美國一些人擔心使用來自競爭對手(如中國)的此類模型會帶來國家安全風險,威脅公民安全。例如,收集海量用户數據的模型可能被用於監控目的。還有人擔憂,美國企業提供不同開放程度的人工智能模型,可能會給競爭對手國家提供技術趕超的機會。
深度求索為何選擇"開放"路線?
通過採取更開放的策略(儘管附帶限制條款),深度求索可能緩解了全球用户對中國嚴格技術管控的擔憂。這家初創公司還通過降低其他開發者適配底層技術的門檻,擴大了其聊天機器人在西方市場的覆蓋範圍。
換言之,深度求索效仿了Meta公司搶佔人工智能生態系統的成功策略——這一事實似乎沒有逃過Meta首席執行官馬克·扎克伯格的眼睛。
“這是場重大的地緣政治競爭,中國正全力以赴,“扎克伯格在接受《喬·羅根體驗》採訪時表示,“如果必須存在所有人都能使用的開源模型,我們應該確保它是美國開發的模型。”
深度求索的AI模型是如何運作的?
與美國頂尖開發者(包括OpenAI和谷歌)的最新模型類似,深度求索的R1模型旨在模仿人類思考問題的方式——在回應用户查詢前會花費時間計算答案。不過,該模型基於近期發佈的V3版本構建,其效率與美國同類產品存在差異。
研發團隊採用了創新方法。當競爭對手使用大量高性能計算芯片構建類似AI模型時,深度求索團隊似乎找到了途徑,能夠高效利用因美國尖端芯片出口管制而獲得的少量相對落後芯片。他們大量運用了強化學習的技術——對系統正確答案給予獎勵,錯誤答案則進行懲罰。
美國部分科技和政策領袖承認這些進展,同時質疑這家中國公司是否依託西方技術開發聊天機器人,從而規避了構建大語言模型(聊天機器人的基礎模塊)所需的鉅額成本。
觀看:彭博原創紀錄片探索中國深度求索如何進軍大模型領域。
政府官員對開源技術有何表態?
經過審查後,2024年時任總統喬·拜登政府得出結論,認為對開放AI模型實施限制為時過早,但也保留了未來可能有必要採取限制的可能性。
唐納德·特朗普政府在一定程度上支持開源和開放權重模型,這可能是出於對中國AI崛起的擔憂。在特朗普7月發佈的《AI行動計劃》中,白宮鼓勵開發開放模型,稱其有潛力成為商業和學術研究的“全球標準”。該計劃表示:“因此,它們也具有地緣戰略價值。”
參考資料
- 閲讀關於美中在AI領域的戰略競爭、生成式AI是否正在扼殺初級工作崗位、世界大國為何在計算機芯片問題上爭執不休,以及深度求索低成本AI模型的解析文章。
- 觀看彭博原創視頻《中國深度求索如何挑戰AI巨頭》。