中國AI初創企業深度求索發佈支持國產芯片的升級模型 | 路透社
Reuters
2025年1月29日拍攝的插圖中展示了深度求索(Deepseek)的標誌。路透社/Dado Ruvic/插圖購買授權權利,打開新標籤頁北京,8月21日(路透社)——中國人工智能初創公司深度求索(DeepSeek)週四發佈了其旗艦V3模型的升級版,該公司表示,該模型具有一項可以針對中國製造的芯片進行優化的功能,同時處理速度更快。
對國產芯片兼容性的關注可能表明,深度求索的人工智能模型正被定位為與中國新興的半導體生態系統協同工作,因為北京方面在面臨華盛頓的出口限制時,正推動替代美國技術。路透社每日簡報通訊提供您開始一天所需的所有新聞。在此註冊。
廣告·繼續滾動深度求索震撼了今年的科技界,當時它發佈了與西方模型如OpenAI的ChatGPT競爭的人工智能模型,同時提供更低的運營成本。深度求索V3模型的升級是在其核心模型的另外兩次近期更新之後進行的——5月的R1模型更新和早期V3增強版於三月。關於國產芯片支持,深度求索在微信文章中表示,其DeepSeek-V3.1模型的UE8M0 FP8精度格式專為"即將發佈的下一代國產芯片"進行了優化。
該公司未具體説明將支持哪些芯片型號或製造商。
FP8即8位浮點,是一種數據處理格式,可使AI模型運行更高效,相比傳統方法佔用更少內存且速度更快。
廣告·繼續滾動深度求索在週四的微信文章中表示,DeepSeek-V3.1採用混合推理架構,支持模型在推理和非推理模式下運行。
用户可通過官方應用和網頁平台上的"深度思考"按鈕切換模式,這兩個平台目前均運行V3.1版本。
聲明顯示,自9月6日起,該公司還將調整模型API(供其他應用和網頁產品開發者集成其模型的平台)的使用費用。
- 推薦主題:
- 人工智能