深度求索低調更新R1 AI模型,下一代技術引期待 | 南華早報
Ben Jiang
中國人工智能(AI)初創企業深度求索(DeepSeek)於週三悄然發佈其R1推理模型的新版本,這是該模型自1月高調亮相以來的首次迭代。這家總部位於杭州的公司在一則發佈於內部微信羣的公告中表示,已"完成對R1模型的小幅更新",新版模型現可通過同名聊天機器人官網及移動端使用。
深度求索未透露此次R1-0528版本更新的具體細節,該版本已在開源AI平台Hugging Face上線。
針對置評請求,深度求索未立即作出回應。
該公司最近一次更新是在3月,於Hugging Face發佈了基礎大語言模型V3-0324版本,宣稱在代碼生成和文本寫作方面有所提升。
儘管R1-0528升級的具體內容尚未公開,但其迅速引發開發者社區關注。獨立基準測試平台LiveCodeBench報告顯示,新模型在AI輔助編程方面表現提升,現居LiveCodeBench中國模型編程能力榜首,僅次於OpenAI的o4-mini-high、o3-high和o4-mini-medium三款模型,同時超越了阿里巴巴集團最新發布的Qwen3及被公認為AI編程領先模型的Anthropic Claude 3.7。