《南華早報》| DeepSeek開源突破如何重塑人工智能創新

Winston Mok

2025-02-12

DeepSeek V3和R1的突破性表現雖不能保證中國人工智能發展持續領先，但確實表明美國市場領軍者的競爭優勢並非如曾經認為的那般不可逾越。在創新週期被壓縮至數月的高度競爭性AI領域，頂尖大語言模型(LLM)排名可能隨着每一代新產品的推出而重新洗牌。如今這些動態競賽中已包含中國LLM參與最高水平角逐，挑戰美國傳統主導地位。農曆新年首日，阿里巴巴發佈Qwen 2.5 Max，宣稱其表現優於DeepSeek V3和美國的領先LLM。儘管DeepSeek R1已實現與OpenAI o1持平，但新發布的o3具備更強功能。DeepSeek在資源有限情況下取得了驚人成就。然而要與美國市場領導者保持競爭力，仍需通過利用日益壯大的開源AI生態系統等途徑獲取外部資源，持續改進。令世界震驚的不僅是DeepSeek的強勁表現，更是它如何以遠少於在投資、計算能力和時間方面。這一成就是通過工程優化和基於現有基礎實現的。該公司採用了蒸餾技術，將來自更大、更復雜模型的知識轉移到較小模型中，同時保持強大的性能。這種包括蒸餾在內的相互學習，是工業和學術AI開發中的常見做法。DeepSeek R1的高級推理能力使其進入了之前由OpenAI的o1主導的領域。在OpenAI旗下，“推理"o1在某些高級數學和編碼任務上表現出色。但DeepSeek R1以顯著降低的使用成本提供了可比的能力——僅收取o1使用費用的一小部分。