中國DeepSeek發佈廉價大模型性能比肩美OpenAI最新模型 | 聯合早報

zaobao

2025-01-26

（北京／倫敦綜合訊）僅相隔兩個月，中國初創公司深度求索（DeepSeek）再度發佈廉價大模型，其性能可比肩美國OpenAI最新模型。

綜合英國科技週刊《自然》（Nature）和英國科技網站“生命科學”（Live Science）等報道，深度求索（DeepSeek）去年12月發佈免費語言大模型DeepSeek V3，並稱在兩個月內花費558萬美元（751萬新元）完成訓練該模型，所需時間和費用僅硅谷競爭對手的十分之一。

中國對沖基金幻方量化旗下的子公司深度求索星期一（1月20日）發佈推理模型DeepSeek-R1，在第三方多個項目的基準測試中均超越美國OpenAI開發的最新模型o1。

據美國消費者新聞與商業頻道（CNBC）報道，美國微軟首席執行官納德拉星期三（1月22日）在達沃斯世界經濟論壇上説，深度求索的新模型令人印象深刻，不僅因為他們有效地構建一個開源模型，還因為它的推理計算效率極高。“我們應該非常嚴肅地看待中國人工智能（AI）的發展”。

除測試表現優於o1外，R1的訓練成本和開源開放程度也勝於o1。《自然》週刊報道稱，開源開放指的是，讓用户參與二次開發，可更改演算法。雖然可自由重複使用，但R1的開源開放程度仍受限，因為訓練數據尚未公開。

延伸閲讀

[下午察：AI界拼多多開拓大模型新賽道

](https://www.bdggg.com/2025/zaobao/news_2025_01_01_730145) 《每日經濟新聞》引述深度求索發佈的技術報告稱，R1的訓練成本是o1的三十分之一。《自然》週刊報道稱，R1給用户開出低廉的使用方案，是o1的三十分之一。

讓西方科技界讚歎的是，深度求索在受美國限制先進科技輸華的背景下，依然開發出新穎模型。

“生命科學”報道稱，美國限制向中企出口先進AI計算晶片，迫使R1研發者採用更智能和有效的演算法，以彌補演算能力的不足。ChatGPT據報需要一萬台英偉達的圖像處理器處理訓練數據，深度求索工程師稱他們僅用2000台圖像處理器就取得相同結果。