再次打破傳統!DeepSeek發佈更新,可以直接在消費級硬件上運行
周毅是故意的还是不小心?

3月25日,DeepSeek在其官網宣佈了一項最新更新。
據官網公告,DeepSeek V3模型已完成小版本升級,目前版本號DeepSeek-V3-0324,用户登錄官方網頁、APP、小程序進入對話界面後,關閉“深度思考”即可體驗。API接口和使用方式保持不變。“如非複雜推理任務,建議使用新版本V3模型,即刻享受速度更加流暢、效果全面提升的對話體驗。”
新版V3模型借鑑DeepSeek-R1模型訓練過程中所使用的強化學習技術,大幅提高了在推理類任務上的表現水平,在數學、代碼類相關評測集上取得了超過GPT-4.5的得分成績;在HTML等代碼前端任務上,新版V3模型生成的代碼可用性更高,視覺效果也更加美觀、富有設計感。
Deepseek公告截圖
同時,新版V3模型基於R1的寫作水平進行了進一步優化,同時特別提升了中長篇文本創作的內容質量。新版V3模型可以在聯網搜索場景下,對於報告生成類指令輸出內容更為詳實準確、排版更加清晰美觀的結果。此外,在工具調用、角色扮演、問答閒聊等方面,新模型也得到了提升。
值得一提的是,業內的早期測試證實,該模型可以直接在消費級硬件上運行。
據報道,AI研究員Awni Hannun表示,新的DeepSeek-V3模型可以在配備M3 Ultra芯片的蘋果電腦上,以每秒20個token的速度運行。這打破了業界關於人工智能模型能力與本地化運行或衝突的早前共識,也意味着數據中心並不是大模型的必要搭配。
本文系觀察者網獨家稿件,未經授權,不得轉載。