中國深度求索公司發佈其R1推理引擎更新 | 路透社
Reuters
2025年1月29日拍攝的插圖中可見Deepseek標識。路透社/Dado Ruvic/插圖/檔案照片上海,5月29日 - 中國人工智能初創公司深度求索(DeepSeek)於週四凌晨發佈了其R1推理模型的更新,加劇了與OpenAI等美國競爭對手的較量。
深度求索在開發者平台Hugging Face上線了R1-0528版本,但尚未正式對外公告。該公司未發佈該模型的説明文檔及性能對比數據。
路透關税觀察日報是您獲取全球貿易與關税動態的每日指南。點擊此處註冊
由加州大學伯克利分校、麻省理工學院和康奈爾大學研究人員開發的LiveCodeBench基準測試顯示,在代碼生成能力上,深度求索新版R1推理模型略遜於OpenAI的o4 mini和o3推理模型,但優於xAI的Grok 3 mini及阿里巴巴的千問3。
彭博社週三早些報道了此次更新。報道稱深度求索代表在微信羣中表示已完成"小規模試驗性升級",用户可開始測試。
今年早些時候,深度求索發佈的AI模型以極低成本達到甚至超越美國行業領先模型水平,打破了"美國出口管制阻礙中國AI發展"的固有認知。
1月R1模型的發佈曾導致中國境外科技股暴跌挑戰了傳統觀點即擴展人工智能需要巨大的計算能力和投資。自R1發佈以來,阿里巴巴(9988.HK),新開標籤頁和騰訊(0700.HK),新開標籤頁等中國科技巨頭已發佈聲稱超越深度求索的模型。谷歌(GOOGL.O),新開標籤頁的Gemini推出了分級折扣訪問服務,而OpenAI則降價併發布了依賴較少計算能力的o3 Mini模型。外界普遍預計該公司仍將發佈R1的繼任者R2。路透社3月援引消息人士報道稱,R2原計劃於5月發佈。深度求索還在3月發佈了升級版V3大語言模型。* 推薦主題:
- 人工智能