華為推出DeepSeek訓/推一體機,國產芯片迎來新機遇?
连政guanchazhewanxgun

DeepSeek的熱潮,終於帶火了AI一體機產品?這種頗具“中國特色”的AI硬件,能否給國產芯片的普及再加一把火?
2月16日,據“華為數據存儲”公眾號消息,華為DCS AI解決方案針對DeepSeek的本地部署,推出了DS版FusionCube A3000訓/推超融合一體機,深度適配DeepSeekV3&R1及蒸餾模型,支持私有化部署。

配置清單顯示,DS版的FusionCube A3000訓/推超融合一體機有三種型號,分別為Ultra(滿血版)、Pro(蒸餾版)和 Lite(蒸餾輕量版)。
其中滿血版可以完美適配DeepSeek-R1、V3的671B模型,硬件使用2個華為Atlas800l A2,處理速度達到671B: 1911 token/s 。而蒸餾版則配備1個Atlas800l A2,適配DeepSeek R1-Distill-Qwen-32B、Llama-70B等蒸餾模型,處理速度 70B: 3300 token/s,32B: 4940 token/s。

Atlas800l A2是華為推出的鯤鵬920+昇騰 AI處理器的AI推理服務器,應用於深度學習模型開發和AI推理服務場景,目前面向公有云、互聯網、運營商、政府、交通、金融、高校、電力等領域,用於企業機房部署和大規模數據中心集羣部署。
軟件方面,DS版訓/推超融合一體機使用大模型訓練、推理和應用開發的華為ModelEngine AI平台,該平台基於昇騰AI芯片,通過推理框架優化和MoE存算協同,提供動態換入換出和全局統一緩存,實現推理高併發和低時延。2月6日,華為對外宣佈,ModelEngine平台全面支持DeepSeek大模型R1&V3和蒸餾系列模型的本地部署與優化,開發者可通過該平台實現上述DeepSeek大模型的“一鍵部署”。
近一段時間以來,DeepSeek線上算力的嚴重不足,帶火了大模型本地部署需求,許多廠商開始營銷各類AI一體機產品。
2月5日,聯想與國內AI芯片廠商沐曦聯合發佈基於DeepSeek 大模型的一體機解決方案,採用ThinkStation PX工作站為載體,搭載沐曦曦思N260 GPU。
2月14日,中科曙光也發佈了全國產的DeepSeek超融合一體機,該一體機採用全國產技術路線,選用國產X86 CPU和國產GPGPU加速卡,支持全精度、半精度混合訓練與推理。

中科曙光的DS超融合一體機
在模型適配方面,中科曙光一體機同樣全面適配DeepSeek系列模型,如DeepSeek V3、DeepSeek R1和DeepSeek Janus Pro,還支持全系列量化蒸餾版本。同時,對QWen2.5、LLama3.2、ChatGLM等主流大模型也全面兼容,滿足各種業務場景需求。
中科曙光公眾號的文章,就毫不吝惜地稱呼該一體機為“國貨之光”,將為政府和企業的數字化、智能化轉型按下“加速鍵”。
實際上,AI一體機並不是最近才出現的新事物。在中國市場上,由於大量企業不願意為單純的軟件和算力付費,或者處於數據安全等原因傾向於將硬件本地部署,因此把軟硬件打包在一起的“一體機”一直擁有獨特的生存空間。
作為對比,儘管英偉達也推出了Jetson系列的硬件集成平台,但是主要用於機器人和嵌入式邊緣計算等場景,而非去做通用大模型的推理。
不過,隨着大模型推理成本的降低,以及C端用户需求的增長,英偉達也將目光投向了個人市場。今年早些時候,英偉達就推出了個人超級計算機“Project DIGITS”,該產品搭載英偉達全新GB10超級芯片,最高可提供達1 PFLOPS的AI性能,主要用於AI大模型的原型設計、微調及運行。

Project DIGITS(左下角類紙盒物品)號稱全球最小的可運行 200B 參數模型的 AI 超級計算機。英偉達官網
英偉達表示,GB10超級芯片讓Project DIGITS只需使用標準電源插座就能提供強大的性能。藉助 Project DIGITS,用户則可以使用自己的桌面系統開發和運行模型推理,並在加速的雲或數據中心基礎設施上無縫部署模型。同時,用户還可以通過英偉達技術將兩台Project DIGITS AI超級計算機連接在一起,運行包含高達4050億參數的模型。
華為DS版FusionCube A3000以及中科曙光的DS超融合一體機價格暫不清楚,而英偉達面向個人的消費級Project DIGITS的具體售價約在3000美元左右,今年晚些時候上市。
本文系觀察者網獨家稿件,未經授權,不得轉載。