阿里放大招:自研AI芯片100%國產,不用台積電代工_風聞
歪睿老哥-芯片研发工程师-聚焦芯片行业的那些事,唯武侠与芯片不可辜负09-02 07:57
電子發燒友網報道(文 / 吳子鵬)8 月 31 日晚間,有消息稱阿里雲通義千問大模型面臨算力缺口,阿里緊急追加寒武紀思元 370 芯片訂單至 15 萬片。然而,該消息隨後不久便被阿里雲相關人士闢謠。9 月 1 日凌晨,該人士表示:“阿里雲確實通過‘一雲多芯’模式支持國產供應鏈,但傳言中阿里採購寒武紀 15 萬片 GPU 的消息不實。”
實際上,就在 “阿里緊急追加寒武紀思元 370 芯片訂單” 這一消息傳出的同時,甚至更早之前,已有行業人士爆料:阿里巴巴正在自研一款 AI 芯片,以填補英偉達 H20 採購受限後留下的算力空白。同時,爆料人士透露,這款 AI 芯片將採用全國產供應鏈,不再選用台積電的代工方案,業界將其定義為阿里巴巴的 “B 計劃”。
豪擲 3800 億構建國產算力底座
據《華爾街日報》、36 氪等媒體報道,在 “B 計劃” 中,阿里制定了一項宏大規劃 —— 未來三年,將持續投入超 3800 億元用於雲計算與 AI 硬件基礎設施建設,進一步夯實國內算力底座。
在產品設計層面,阿里自研 AI 芯片採用全新自主研發路徑,針對通義千問大模型及 AI 推理任務進行架構優化,能效比與計算效率實現顯著提升。需要明確的是,這款芯片並非訓練芯片,而是專注於人工智能推理任務。通常而言,AI 訓練的核心是讓模型從海量數據中學習規律、迭代優化參數,最終生成可用模型;AI 推理則是讓訓練完成的固定參數模型 “學以致用”,通過處理新數據輸出結果。兩者目標的差異,直接決定了芯片在計算能力、精度、存儲性能、能效、延遲等維度的需求截然不同。
在應用拓展方面,阿里自研 AI 芯片將全面兼容英偉達 CUDA 生態。根據半導體分析公司 TechInsights 的最新報告,2023 年英偉達在數據中心 GPU 市場的出貨量高達 376 萬塊,市場份額佔比達 98%。儘管近兩年受禁令等因素影響,這一比例有所下滑,但英偉達 GPU 在國內市場的佔比仍超 50%,核心原因便是 CUDA 的生態壁壘。CUDA 並非單純的軟件框架,而是與英偉達 GPU 架構(如 SM 流多處理器、Tensor Core)深度綁定的共生體系。這種緊密關聯使得其他廠商即便複製硬件架構,也難以復刻 CUDA 的算子級優化能力。因此,兼容 CUDA 堪稱國產 AI 芯片實現突破的關鍵前提之一。對阿里自研 AI 芯片而言,通過兼容 CUDA 生態,開發者無需大規模修改代碼即可完成技術遷移,大幅降低了遷移成本。這一策略既解決了國產化替代的 “最後一公里” 難題,又保留了與國際主流生態的銜接能力,顯著提升了技術落地的可行性。
在產品供應環節,阿里自研 AI 芯片採用全國產供應鏈,由國內代工廠完成生產,徹底擺脱了對台積電的依賴。此前,國產 AI 芯片多依賴台積電代工,而台積電作為全球先進製程的主導者,其產能與供應受美國政策影響較大。轉向國內代產後,阿里 AI 芯片實現了從設計到生產的 “端到端” 國產化,供應鏈中斷風險顯著降低。
據悉,目前該芯片正在阿里內部進行緊密的測試。阿里之所以能實現這一突破,離不開其在 芯片自研領域的多年深耕。阿里旗下的平頭哥半導體有限公司(簡稱 “平頭哥”)擁有定製芯片研發傳統,先後推出含光 800、倚天 710、平頭哥 RISC-V 芯片等產品。其中,含光 800 是 2019 年發佈的 AI 推理芯片,採用 “自研架構 + 算法協同設計” 模式,在 ResNet-50 測試中性能卓越,峯值處理能力達每秒 78563 張圖片,較當時業界最優水平快 4 倍;倚天 710 是 2021 年發佈的基於 ARM 架構的自研雲芯片,採用 5nm 工藝,集成 600 億晶體管,擁有 128 個 Armv9 內核,主頻最高 3.2GHz,性能對標業界標杆產品,目前已大規模應用於阿里雲服務。
H20 留下一個大蛋糕
如前文所述,英偉達 AI 芯片採購受限後,中國 AI 算力市場出現巨大空白。2024 年,英偉達 GPU 在中國 AI 芯片市場的份額約為 66%;儘管 2025 年該份額降至 54%,但受限後國內仍面臨顯著的算力缺口。在監管部門釋放相關信號後,國內各大企業紛紛調整採購計劃,騰訊、百度、字節跳動等互聯網巨頭暫停或取消 H20 訂單,轉而尋求國產替代方案。
從今年世界人工智能大會(WAIC)的展示來看,國內瞄準英偉達 H20 替代市場的芯片產品不在少數,華為、寒武紀、摩爾線程、沐曦集成電路等企業均有相關產品佈局。以寒武紀為例,前文提及的寒武紀思元 370 芯片,其應用載體為寒武紀 AIDC MLU370 S4/S8 加速卡。該加速卡採用台積電(TSMC)7nm 製程,搭載寒武紀新一代人工智能芯片架構 MLUarch03,支持 PCIe Gen4,板卡功耗僅 75W;相較於同尺寸 GPU,其解碼能力提升 3 倍,編碼能力提升 1.5 倍。此外,MLU370-S4/S8 加速卡能效出色、體積小巧,可在服務器中實現高密度部署。同時,業界關於寒武紀思元 590 芯片的傳聞頗多。但是針對這一傳聞,寒武紀在最新的公司公告裏予以明確否認。公告稱“公司未有新產品發佈計劃”,網絡上的相關信息均為“誤導市場的不實信息”,呼籲投資者理性決策。
沐曦集成電路於 2025 年 7 月發佈的曦雲 C600 系列芯片,同樣被視為英偉達 H20 的潛在替代產品。該芯片基於沐曦自主知識產權的核心 GPU IP 架構,集成大容量存儲與多精度混合算力,支持 MetaXLink 超節點擴展技術,並內置 ECC/RAS 多重安全防護模塊,可為金融、政務等關鍵領域提供高可靠算力支撐,滿足下一代生成式 AI 的訓練與推理需求。儘管官方未披露該芯片的具體算力與能效參數,但曦雲 C600 採用 HBM3e 顯存,數據存儲容量從上一代 C500 的 64GB 提升至 144GB,結合發佈會信息可知,該芯片性能可對標國際旗艦 GPU 產品。
可能也有人會想起此前熱議的英偉達的B30,該款產品基於Blackwell架構,定價區間在6500至8000美元,相比H20的1萬至1.2萬美元價格區間有顯著優勢。因此,儘管B30的性能約為H20的75%,但市場需求依然強勁。不過,該芯片目前獲批的前景並不明朗,無論在美方還是中方皆是如此。
若阿里自研 AI 芯片最終如爆料所述正式發佈並全面部署,全球及國內 AI 芯片格局或將發生變化。從全球視角看,阿里 AI 芯片的崛起將推動全球 AI 算力供應鏈向多元化方向發展,削弱美國在高端芯片領域的壟斷地位;聚焦國內市場,阿里 AI 芯片的成熟可能帶動更多互聯網巨頭入局 AI 芯片賽道,形成 “頭部企業自研 + 中小廠商合作” 的產業格局。更重要的是,該芯片的國產製造模式及其技術突破,被視為國產芯片自主化進程中的重要節點事件,將為國產 AI 芯片的發展注入動力,加速國產化替代進程。
結語
從阿里雲闢謠 “採購寒武紀 15 萬片芯片” 傳聞,到其 “B 計劃” 清晰落地 —— 自研聚焦 AI 推理任務、採用全國產供應鏈的芯片,未來三年豪擲 3800 億築牢國產算力底座,這一系列動作既是阿里應對英偉達 H20 採購受限、填補算力缺口的務實舉措,更折射出國內科技企業在 AI 算力自主化賽道上的戰略覺醒。
阿里自研芯片的設計極具針對性:針對通義千問大模型優化架構以提升能效比,兼容 CUDA 生態以降低開發者遷移成本,依託國內代工廠實現 “端到端” 國產化 —— 每一步都精準破解了國產芯片 “落地難、斷供風險高” 的核心痛點。而平頭哥此前在含光 800、倚天 710 芯片上積累的技術沉澱,更為這一佈局奠定了紮實的落地基礎。

聲明:本文由電子發燒友原創