深度求索結束為期一週的馬拉松式AI模型細節披露 | 南華早報
Ben Jiang
中國人工智能初創企業深度求索(DeepSeek)近日用一週時間公開了其開發ChatGPT競爭產品的技術細節,該項目的實現成本僅為行業常規投入的零頭,此舉有望推動全球AI領域加速發展。過去幾天裏,深度求索在全球最大開源社區GitHub上公佈了八個開源項目。這是該公司首次詳細披露如何從計算、通信和存儲等模型訓練三大核心環節中充分釋放芯片性能。
這支由年輕科學家組成的團隊表示,他們公開這些"經過實戰檢驗的構建模塊",是為了"以完全透明的方式分享我們微小但真誠的進步"。
全球開發者紛紛為深度求索點贊,盛讚這家中國公司公開了構建低成本高性能AI模型的技術。AI開發平台Hyperbolic創始人等開發者更稱深度求索是"真正的OpenAI"。
儘管名為"開放"AI,ChatGPT的創造者OpenAI卻轉向了閉源模式,對其模型的具體訓練方法和計算成本嚴格保密。OpenAI創始人兼CEO薩姆·奧爾特曼今年2月初曾表示,公司"站在了歷史的錯誤面",“需要制定新的開源戰略”。