中國深度求索公司逼近美國對手OpenAI,升級模型超越阿里巴巴 | 南華早報
Ben Jiang
中國人工智能(AI)初創企業深度求索(DeepSeek)表示,其1月首次發佈的R1推理模型迎來首個重大升級版本R1-0528,性能已匹敵包括OpenAI和谷歌在內的全球頂尖競爭對手。在週四晚間發佈的聲明中,深度求索重點介紹了新模型在推理和創意寫作能力上的提升,使其更擅長撰寫議論文、小説和散文,文風可高度模擬人類作者。編程能力也得到增強。
該公司稱最新版本將"幻覺"(AI生成缺乏事實依據的誤導性信息)發生率降低了50%。
深度求索表示,這些升級是通過在後訓練階段投入額外算力實現的。後訓練指開發者在模型完成主要訓練流程後,對其進行最終調優與強化的過程,通常用於提升效率、加強內容安全性與準確性。
“升級後的R1模型在數學、編程和通用邏輯等多項基準測試中表現優於國內其他AI模型,與[OpenAI的]O3、[谷歌的]Gemini2.5-Pro等國際頂級模型持平。“深度求索稱。
深度求索引用的基準結果顯示,R1-0528性能超越阿里巴巴的通義千問3模型。圖片來源:Shutterstock
此次更新源於原R1模型在四月底被阿里巴巴集團旗艦模型Qwen3超越,失去LiveBench開源AI系統排行榜榜首位置。這一變動凸顯出中國科技企業在推進AI能力方面的激烈競爭。