華為推出DeepSeek訓/推一體機，國產芯片迎來新機遇？

连政guanchazhewanxgun

2025-02-17

DeepSeek的熱潮，終於帶火了AI一體機產品？這種頗具“中國特色”的AI硬件，能否給國產芯片的普及再加一把火？

2月16日，據“華為數據存儲”公眾號消息，華為DCS AI解決方案針對DeepSeek的本地部署，推出了DS版FusionCube A3000訓/推超融合一體機，深度適配DeepSeekV3&R1及蒸餾模型，支持私有化部署。

配置清單顯示，DS版的FusionCube A3000訓/推超融合一體機有三種型號，分別為Ultra（滿血版）、Pro（蒸餾版）和 Lite（蒸餾輕量版）。

其中滿血版可以完美適配DeepSeek-R1、V3的671B模型，硬件使用2個華為Atlas800l A2，處理速度達到671B: 1911 token/s 。而蒸餾版則配備1個Atlas800l A2，適配DeepSeek R1-Distill-Qwen-32B、Llama-70B等蒸餾模型，處理速度 70B: 3300 token/s，32B: 4940 token/s。

Atlas800l A2是華為推出的鯤鵬920+昇騰 AI處理器的AI推理服務器，應用於深度學習模型開發和AI推理服務場景，目前面向公有云、互聯網、運營商、政府、交通、金融、高校、電力等領域，用於企業機房部署和大規模數據中心集羣部署。

軟件方面，DS版訓/推超融合一體機使用大模型訓練、推理和應用開發的華為ModelEngine AI平台，該平台基於昇騰AI芯片，通過推理框架優化和MoE存算協同，提供動態換入換出和全局統一緩存，實現推理高併發和低時延。2月6日，華為對外宣佈，ModelEngine平台全面支持DeepSeek大模型R1&V3和蒸餾系列模型的本地部署與優化，開發者可通過該平台實現上述DeepSeek大模型的“一鍵部署”。

近一段時間以來，DeepSeek線上算力的嚴重不足，帶火了大模型本地部署需求，許多廠商開始營銷各類AI一體機產品。

2月5日，聯想與國內AI芯片廠商沐曦聯合發佈基於DeepSeek 大模型的一體機解決方案，採用ThinkStation PX工作站為載體，搭載沐曦曦思N260 GPU。

2月14日，中科曙光也發佈了全國產的DeepSeek超融合一體機，該一體機採用全國產技術路線，選用國產X86 CPU和國產GPGPU加速卡，支持全精度、半精度混合訓練與推理。

中科曙光的DS超融合一體機

在模型適配方面，中科曙光一體機同樣全面適配DeepSeek系列模型，如DeepSeek V3、DeepSeek R1和DeepSeek Janus Pro，還支持全系列量化蒸餾版本。同時，對QWen2.5、LLama3.2、ChatGLM等主流大模型也全面兼容，滿足各種業務場景需求。

中科曙光公眾號的文章，就毫不吝惜地稱呼該一體機為“國貨之光”，將為政府和企業的數字化、智能化轉型按下“加速鍵”。

實際上，AI一體機並不是最近才出現的新事物。在中國市場上，由於大量企業不願意為單純的軟件和算力付費，或者處於數據安全等原因傾向於將硬件本地部署，因此把軟硬件打包在一起的“一體機”一直擁有獨特的生存空間。

作為對比，儘管英偉達也推出了Jetson系列的硬件集成平台，但是主要用於機器人和嵌入式邊緣計算等場景，而非去做通用大模型的推理。

不過，隨着大模型推理成本的降低，以及C端用户需求的增長，英偉達也將目光投向了個人市場。今年早些時候，英偉達就推出了個人超級計算機“Project DIGITS”，該產品搭載英偉達全新GB10超級芯片，最高可提供達1 PFLOPS的AI性能，主要用於AI大模型的原型設計、微調及運行。

Project DIGITS（左下角類紙盒物品）號稱全球最小的可運行 200B 參數模型的 AI 超級計算機。英偉達官網

英偉達表示，GB10超級芯片讓Project DIGITS只需使用標準電源插座就能提供強大的性能。藉助 Project DIGITS，用户則可以使用自己的桌面系統開發和運行模型推理，並在加速的雲或數據中心基礎設施上無縫部署模型。同時，用户還可以通過英偉達技術將兩台Project DIGITS AI超級計算機連接在一起，運行包含高達4050億參數的模型。

華為DS版FusionCube A3000以及中科曙光的DS超融合一體機價格暫不清楚，而英偉達面向個人的消費級Project DIGITS的具體售價約在3000美元左右，今年晚些時候上市。

本文系觀察者網獨家稿件，未經授權，不得轉載。