為什麼昇騰384超節點能成為“鎮館之寶”?

文 觀察者網 呂棟
機器人不僅能調酒、分揀還能格鬥,AI眼鏡不僅能翻譯、導航還能支付,醫療大模型不僅能識別病理切片還能自動生成診斷報告,金融數字員工正從輔助工具變身“專業研究員”……這些畫面並不是科幻電影,而是世界人工智能大會(WAIC 2025)被火爆圍觀的場景。
在這裏,每個人都能感受到,中國AI應用創新正呈現百花齊放之勢。但不可否認的是,無論AI技術在哪個場景落地,都離不開算力底座的支撐。尤其是在當下,隨着全球AI競爭進入白熱化,美國不斷收緊技術出口管制,中國產業界更加呼喚底層軟硬件的技術突破。
行業變革中,華為一直走在開放創新的前列。這次參展WAIC,華為重磅展出了昇騰384超節點真機,並獲評“WAIC鎮館之寶”。它的創新之處在於,並沒有像傳統計算架構一樣簡單堆疊芯片,而是通過高速互聯總線,突破互聯瓶頸,讓超節點像一台“AI服務器”一樣工作,超大帶寬、超低時延和超強性能等三大技術優勢,可以長期滿足行業算力需求。

在國外巨頭的先發優勢下,外界之前或許對國產算力沒有底氣,但相信這次大會能打消不少人的疑慮。在昇騰384超節點的身後,華為全方位展現了昇騰算力底座的創新能力、訓練及推理解決方案、開源開放的軟硬件生態,以及在互聯網、運營商、金融、能源、教育科研等11大行業的豐富實踐。
適配和開發超80個大模型,孵化6000+個行業解決方案等數據,充分證明了昇騰絕對不是“花架子”,而是已形成技術、應用和生態的正向循環。
鎮館之寶背後,是系統工程的突破
自大模型蓬勃發展以來,中國產業界就一直存在算力焦慮。一方面,大模型的Scaling Law(尺度定律)持續有效,訓練和推理的算力需求爆發式增長;另一方面,美國不斷收緊對先進算力芯片的出口管制,並遏制中國先進芯片製造能力,給國產單卡算力追趕製造障礙。
但實際上,大模型技術演進過程中,國產算力的挑戰和機遇並存。一方面訓練萬億參數大模型,僅靠單卡算力無法實現,集羣算力成為大勢所趨;另一方面,隨着以DeepSeek為代表的MoE(混合專家模型)成為主流模型架構,其複雜混合並行導致通信需求驟增,單純靠堆芯片,已不能帶來有效算力的線性增加,但給提升通信帶寬進而改善性能帶來機遇。
在這種趨勢下,華為充分發揮在通信、存儲、基礎軟件等方面的大雜燴優勢,通過非摩爾補摩爾、數學補物理等系統工程創新,成功實現業界最大規模的384顆昇騰NPU高速總線互聯,構建了昇騰384超節點。它由12個計算櫃和4個總線櫃構成,算力總規模達300 PFLOPS。

並且,昇騰384超節點還可以通過靈活分配資源,更好地支持混合專家MoE大模型的訓推,實現384卡“一卡一專家”,是業界唯一支持DeepSeekV3/R1在一個超節點域內即可完成所有的專家並行(EP)的方案,也是MoE模型的最佳訓練/推理方案。
之所以能實現這種超強性能,是因為昇騰超節點並非修補式改進,而是徹底重構系統。一是打破以CPU為中心的馮諾依曼架構,計算單元通過總線直接互訪,轉變為更高效、更靈活的全對等架構;其次,新的總線技術重新定義通信互聯協議,減少系統開銷,內存統一編址,超節點內全局TB級內存統一訪問;第三,突破傳統服務器間通信能力不足帶來的系統性能瓶頸,實現通信能力10倍提升,讓計算不再等待通信,提升算力利用率和整體性能。
在半導體制程受限的情況下,昇騰384超節點通過資源高效調度,一定程度彌補了芯片工藝的不足。性能測試數據顯示,在昇騰超節點集羣上,LLaMA3等千億稠密模型性能相比傳統集羣提升2.5倍以上;在通信需求更高的Qwen、DeepSeek等多模態、MoE模型上,性能提升可達3倍以上,較業界其他集羣高出1.2倍,在行業中處於領先地位。更重要的是,通過最佳負載均衡組網等方案,還能將昇騰超節點組成數萬卡的Atlas 900 SuperCluster超節點集羣,支持更大規模的模型訓練,成為中國AI創新的可靠底座。

枝繁葉茂,昇騰已走進千行萬業
“中國製造業像今天這樣如此強大的原因,不僅是它能更便宜地生產東西,也因為它能更便宜、更快、更好、更智能地生產東西,而且正在越來越多地將人工智能融入到產品中來。”美國記者 托馬斯·弗裏德曼 在《我在中國看到了世界未來的樣子》一文中寫道。
毫無疑問,任何技術只有落地才能產生價值,而中國AI技術的落地正走在世界前列。如果深入華為WAIC的展台就會發現,昇騰不僅在大規模算力集羣上進行系統性創新,同時也已經深入千行萬業,支撐互聯網、運營商、金融、政務、教育等垂直領域的創新落地。

以運營商領域為例,浙江移動基於昇騰算力與移動九天大模型打造的“營銷助手”ChatCRM,為一線人員提供智能問答、信息搜索和業務辦理支持,目標客户獲取時間從3小時驟降至3分鐘,營銷成功率提升5個百分點,知識問答準確率超過95%;上海電信基於昇騰算力自研魔方應用系統,讓一線客服人員從被動接受變為主動設計,已經基於昇騰完成了Telechat和Qwen大模型的微調,把大模型在客服場景的準確度從80%提升到了90%。
金融行業也在積極攜手昇騰,擁抱智能化。交通銀行基於昇騰千卡算力集羣,瞄準審貸聯動、惠民催收、數據速查等大模型高價值場景,通過全流程優化,大幅減少人工校驗工作量,縮短處理時間,目前已落地大小模型融合應用超100個,累計提升人力效能超1000人。浦發銀行基於昇騰千卡算力集羣,採用CANN架構,通過MindIE硬件使能引擎及ModelArts一站式AI開發平台進行統一納管,支持DeepSeek、Qwen等多種主流大模型的部署,幫助浦發銀行實現運營、普惠、零售、信用卡等200多個AI應用場景落地。
昇騰還深度融入實體產業,賦能更多領域。例如在醫療場景,昇騰+DeepSeek智慧醫療應用一體化解決方案,已在瑞金醫院、華西醫院、中山眼科等多家醫療機構落地,覆蓋醫學科研、輔助診斷、院區管理等多個核心場景;在電力領域,昇騰助力南方電網打造電力行業首個開放創新大模型“大瓦特”;在建材領域,昇騰助力海螺水泥打造建材行業大模型……

與此同時,AI技術也正在深刻重塑零售行業的各個環節。以深圳大型零售企業天虹為例,在昇騰算力和豐富AI工具鏈的支撐下,基於Qwen、DeepSeek等開源模型以及內外部海量數據進行模型後訓練,打造了“百靈鳥”零售垂直模型,在營銷策劃、導購服務、商品運營、客服售後、經營決策、辦公助手等業務維度開發了30多個智能應用,服務於6萬名員工及合作伙伴,每月模型訪問請求量超300萬次,企業內部工作效率提升30%。
當全球AI競爭進入白熱化,昇騰展現的不僅是根技術實力,更是一幅清晰的產業落地圖景。截至目前,業界基於昇騰適配和開發超過80個大模型,在基礎大模型多個技術方向均有積累,如訊飛星火認知、DeepSeek、Qwen、鵬城、LLaMA等。同時,昇騰聯合2700+行業合作伙伴,共同孵化超過6000+個行業解決方案,正加速AI賦能千行萬業。

以開放促發展,昇騰產業生態快速成長
AI技術的競賽從來不是單點的比拼,本質上是軟硬件生態的競爭。英偉達能領跑行業,不僅是因為有高性能的GPU,同時也因為擁有深厚的軟件與開發者生態護城河。
從這一點來看,昇騰之所以能引領中國AI算力產業創新,在千行萬業迅速落地,首先就是因為構建了完整且開放的昇騰AI基礎軟硬件平台,包括Atlas系列硬件、異構計算架構CANN、全場景AI框架昇思MindSpore、昇騰應用使能MindX以及一站式開發平台ModelArts等,幫助夥伴和開發者高效使用AI能力,創新場景化AI應用。

短短六年,昇騰產業生態以驚人速度構建起一片繁榮之地,330萬開發者、2700家行業夥伴、6000餘個行業解決方案、60餘家硬件夥伴推出150多款產品……這些數字背後,是中國AI底層軟硬件生態的強勢崛起,更揭示了構建自主開放的AI算力生態已是大勢所趨。
昇騰生態的爆發性增長,本質是華為和產業夥伴的集體突圍。
當英偉達CUDA構築的“圍牆花園”日益成為全球AI研發的隱形基礎設施,其生態黏性幾乎定義了開發者的技術路徑。然而昇騰以“開放”為抓手,開闢了另一條路徑:作為充分釋放處理器極致性能的關鍵,CANN實現分層深度開放,從最底層的算子開發層,到模型開發層、推理層,進一步兼容三方開源框架,讓運行在三方框架、推理引擎上的模型/應用遷移至昇騰無需修改;新增開放AscendNPU IR接口,使能開發者向昇騰平台“無感遷移”。

昇騰的快速生長,也印證了AI競爭的本質是生態之爭。英偉達CUDA生態的統治力,源自長期積累的龐大工具鏈、優化庫與開發者社區形成的“護城河”。昇騰的破局之道在於雙軌並行:一方面以開源開放加速技術民主化,在算子開發、系統調優、編譯鏈優化等場景提供好用的工具軟件,推動AI開發效率與性能的雙重突破,截至目前,已攜手互聯網、運營商、金融等30多個夥伴,創新開發260多個高性能算子;另一方面,以“智能基座”產教融合深入人才土壤,2600門+實戰導向課程,與高校聯合成立實驗室,為生態持續造血。“技術+人才”的雙輪驅動,讓昇騰持續成為中國AI創新的堅實底座。
在AI重塑未來的時代,沒有生態的算力如同無根之木。國外廠商雖有先發優勢,但單一依賴將扼殺技術多樣性與產業安全。昇騰生態的快速成長,標誌着全球AI算力格局正從“一極統治”向多元生態深刻演變。當昇騰“黑土地”上持續生長出本土化的框架、工具與人才,中國AI產業將實現真正的技術、應用和生態繁茂,握緊通往智能時代的鑰匙。