深度求索結束為期一週的馬拉松式AI模型細節披露 | 南華早報

Ben Jiang

2025-03-01

中國人工智能初創企業深度求索（DeepSeek）近日用一週時間公開了其開發ChatGPT競爭產品的技術細節，該項目的實現成本僅為行業常規投入的零頭，此舉有望推動全球AI領域加速發展。過去幾天裏，深度求索在全球最大開源社區GitHub上公佈了八個開源項目。這是該公司首次詳細披露如何從計算、通信和存儲等模型訓練三大核心環節中充分釋放芯片性能。

這支由年輕科學家組成的團隊表示，他們公開這些"經過實戰檢驗的構建模塊"，是為了"以完全透明的方式分享我們微小但真誠的進步"。

全球開發者紛紛為深度求索點贊，盛讚這家中國公司公開了構建低成本高性能AI模型的技術。AI開發平台Hyperbolic創始人等開發者更稱深度求索是"真正的OpenAI"。

儘管名為"開放"AI，ChatGPT的創造者OpenAI卻轉向了閉源模式，對其模型的具體訓練方法和計算成本嚴格保密。OpenAI創始人兼CEO薩姆·奧爾特曼今年2月初曾表示，公司"站在了歷史的錯誤面"，“需要制定新的開源戰略”。