DeepSeek通過R1模型更新向美國競爭對手施壓 | 路透社
Brenda Goh,Eduardo Baptista
5月29日 - 中國人工智能初創公司深度求索(DeepSeek)於本週四凌晨發佈了其推理模型R1的首個升級版本,加劇了與OpenAI等美國競爭對手的較量。
深度求索通過開發者平台Hugging Face表示,R1-0528是R1的一個小版本更新,但顯著提升了其推理深度和推斷能力,包括更好地處理複雜任務,使其性能接近OpenAI的o3推理模型和谷歌(GOOGL.O)的新標籤頁。1月份R1的發佈在全球引發轟動,導致中國境外科技股暴跌,並挑戰了"AI需要強大算力和鉅額投資"的傳統認知。自R1發佈以來,阿里巴巴(9988.HK)的新標籤頁和騰訊(0700.HK)的新標籤頁等中國科技巨頭也推出了聲稱超越深度求索的模型。與1月份R1時伴隨多作者學術論文、全球AI界爭相解讀公司策略的盛況不同,本週四的升級公告顯得頗為低調。
這家總部位於杭州的公司隨後在X平台簡短髮帖稱R1-0528性能有所提升。在微信公眾號的長文中,深度求索表示在文本改寫和摘要等場景下,“幻覺”(虛假或誤導性結果)發生率降低了約45%至50%。
該公司表示,此次升級還支持以創新方式生成散文、小説等文體,並增強了前端代碼生成和角色扮演等領域的性能。
深度求索表示:“該模型在數學、編程和通用邏輯等多項基準測試中展現出卓越表現。”
深度求索的成功打破了美國出口管制會阻礙中國AI發展的論調——該公司以極低成本發佈的AI模型已達到或超越行業領先的美國模型水平。
這家初創公司週四補充稱,其採用R1-0528模型的推理流程對阿里巴巴Qwen3 8B基礎模型進行增強(該過程稱為"蒸餾"),由此產生的變體性能較原版Qwen3提升超10%。
深度求索強調:“我們相信DeepSeek-R1-0528的思維鏈技術,無論對推理模型的學術研究還是小型化模型的工業開發都具有重要意義。”
彭博社週三報道了這次更新。報道稱深度求索代表在微信羣透露已完成"小規模實驗性升級",用户可開始測試。
為應對深度求索的競爭,谷歌Gemini推出折扣訪問方案,OpenAI則降價併發布算力需求更低的o3 Mini模型。
仍有預期認為Deepseek將推出R1的繼任者R2。路透社3月援引消息人士稱,R2原計劃於5月發佈。DeepSeek還在3月對其語言模型V3進行了更新。
(Brenda Goh和Eduardo Baptista報道)
((巴西利亞編輯部翻譯))
路透社MCM
- 推薦主題:
- 商業