阿里放大招：自研AI芯片100%國產，不用台積電代工_風聞

歪睿老哥-芯片研发工程师-聚焦芯片行业的那些事，唯武侠与芯片不可辜负09-02 07:57

2025-09-02

電子發燒友網報道（文 / 吳子鵬）8 月 31 日晚間，有消息稱阿里雲通義千問大模型面臨算力缺口，阿里緊急追加寒武紀思元 370 芯片訂單至 15 萬片。然而，該消息隨後不久便被阿里雲相關人士闢謠。9 月 1 日凌晨，該人士表示：“阿里雲確實通過‘一雲多芯’模式支持國產供應鏈，但傳言中阿里採購寒武紀 15 萬片 GPU 的消息不實。”

實際上，就在 “阿里緊急追加寒武紀思元 370 芯片訂單” 這一消息傳出的同時，甚至更早之前，已有行業人士爆料：阿里巴巴正在自研一款 AI 芯片，以填補英偉達 H20 採購受限後留下的算力空白。同時，爆料人士透露，這款 AI 芯片將採用全國產供應鏈，不再選用台積電的代工方案，業界將其定義為阿里巴巴的 “B 計劃”。

豪擲 3800 億構建國產算力底座

據《華爾街日報》、36 氪等媒體報道，在 “B 計劃” 中，阿里制定了一項宏大規劃 —— 未來三年，將持續投入超 3800 億元用於雲計算與 AI 硬件基礎設施建設，進一步夯實國內算力底座。

在產品設計層面，阿里自研 AI 芯片採用全新自主研發路徑，針對通義千問大模型及 AI 推理任務進行架構優化，能效比與計算效率實現顯著提升。需要明確的是，這款芯片並非訓練芯片，而是專注於人工智能推理任務。通常而言，AI 訓練的核心是讓模型從海量數據中學習規律、迭代優化參數，最終生成可用模型；AI 推理則是讓訓練完成的固定參數模型 “學以致用”，通過處理新數據輸出結果。兩者目標的差異，直接決定了芯片在計算能力、精度、存儲性能、能效、延遲等維度的需求截然不同。

在應用拓展方面，阿里自研 AI 芯片將全面兼容英偉達 CUDA 生態。根據半導體分析公司 TechInsights 的最新報告，2023 年英偉達在數據中心 GPU 市場的出貨量高達 376 萬塊，市場份額佔比達 98%。儘管近兩年受禁令等因素影響，這一比例有所下滑，但英偉達 GPU 在國內市場的佔比仍超 50%，核心原因便是 CUDA 的生態壁壘。CUDA 並非單純的軟件框架，而是與英偉達 GPU 架構（如 SM 流多處理器、Tensor Core）深度綁定的共生體系。這種緊密關聯使得其他廠商即便複製硬件架構，也難以復刻 CUDA 的算子級優化能力。因此，兼容 CUDA 堪稱國產 AI 芯片實現突破的關鍵前提之一。對阿里自研 AI 芯片而言，通過兼容 CUDA 生態，開發者無需大規模修改代碼即可完成技術遷移，大幅降低了遷移成本。這一策略既解決了國產化替代的 “最後一公里” 難題，又保留了與國際主流生態的銜接能力，顯著提升了技術落地的可行性。

在產品供應環節，阿里自研 AI 芯片採用全國產供應鏈，由國內代工廠完成生產，徹底擺脱了對台積電的依賴。此前，國產 AI 芯片多依賴台積電代工，而台積電作為全球先進製程的主導者，其產能與供應受美國政策影響較大。轉向國內代產後，阿里 AI 芯片實現了從設計到生產的 “端到端” 國產化，供應鏈中斷風險顯著降低。

據悉，目前該芯片正在阿里內部進行緊密的測試。阿里之所以能實現這一突破，離不開其在芯片自研領域的多年深耕。阿里旗下的平頭哥半導體有限公司（簡稱 “平頭哥”）擁有定製芯片研發傳統，先後推出含光 800、倚天 710、平頭哥 RISC-V 芯片等產品。其中，含光 800 是 2019 年發佈的 AI 推理芯片，採用 “自研架構 + 算法協同設計” 模式，在 ResNet-50 測試中性能卓越，峯值處理能力達每秒 78563 張圖片，較當時業界最優水平快 4 倍；倚天 710 是 2021 年發佈的基於 ARM 架構的自研雲芯片，採用 5nm 工藝，集成 600 億晶體管，擁有 128 個 Armv9 內核，主頻最高 3.2GHz，性能對標業界標杆產品，目前已大規模應用於阿里雲服務。

H20 留下一個大蛋糕

如前文所述，英偉達 AI 芯片採購受限後，中國 AI 算力市場出現巨大空白。2024 年，英偉達 GPU 在中國 AI 芯片市場的份額約為 66%；儘管 2025 年該份額降至 54%，但受限後國內仍面臨顯著的算力缺口。在監管部門釋放相關信號後，國內各大企業紛紛調整採購計劃，騰訊、百度、字節跳動等互聯網巨頭暫停或取消 H20 訂單，轉而尋求國產替代方案。

從今年世界人工智能大會（WAIC）的展示來看，國內瞄準英偉達 H20 替代市場的芯片產品不在少數，華為、寒武紀、摩爾線程、沐曦集成電路等企業均有相關產品佈局。以寒武紀為例，前文提及的寒武紀思元 370 芯片，其應用載體為寒武紀 AIDC MLU370 S4/S8 加速卡。該加速卡採用台積電（TSMC）7nm 製程，搭載寒武紀新一代人工智能芯片架構 MLUarch03，支持 PCIe Gen4，板卡功耗僅 75W；相較於同尺寸 GPU，其解碼能力提升 3 倍，編碼能力提升 1.5 倍。此外，MLU370-S4/S8 加速卡能效出色、體積小巧，可在服務器中實現高密度部署。同時，業界關於寒武紀思元 590 芯片的傳聞頗多。但是針對這一傳聞，寒武紀在最新的公司公告裏予以明確否認。公告稱“公司未有新產品發佈計劃”，網絡上的相關信息均為“誤導市場的不實信息”，呼籲投資者理性決策。

沐曦集成電路於 2025 年 7 月發佈的曦雲 C600 系列芯片，同樣被視為英偉達 H20 的潛在替代產品。該芯片基於沐曦自主知識產權的核心 GPU IP 架構，集成大容量存儲與多精度混合算力，支持 MetaXLink 超節點擴展技術，並內置 ECC/RAS 多重安全防護模塊，可為金融、政務等關鍵領域提供高可靠算力支撐，滿足下一代生成式 AI 的訓練與推理需求。儘管官方未披露該芯片的具體算力與能效參數，但曦雲 C600 採用 HBM3e 顯存，數據存儲容量從上一代 C500 的 64GB 提升至 144GB，結合發佈會信息可知，該芯片性能可對標國際旗艦 GPU 產品。

可能也有人會想起此前熱議的英偉達的B30，該款產品基於Blackwell架構，定價區間在6500至8000美元，相比H20的1萬至1.2萬美元價格區間有顯著優勢。因此，儘管B30的性能約為H20的75%，但市場需求依然強勁。不過，該芯片目前獲批的前景並不明朗，無論在美方還是中方皆是如此。

若阿里自研 AI 芯片最終如爆料所述正式發佈並全面部署，全球及國內 AI 芯片格局或將發生變化。從全球視角看，阿里 AI 芯片的崛起將推動全球 AI 算力供應鏈向多元化方向發展，削弱美國在高端芯片領域的壟斷地位；聚焦國內市場，阿里 AI 芯片的成熟可能帶動更多互聯網巨頭入局 AI 芯片賽道，形成 “頭部企業自研 + 中小廠商合作” 的產業格局。更重要的是，該芯片的國產製造模式及其技術突破，被視為國產芯片自主化進程中的重要節點事件，將為國產 AI 芯片的發展注入動力，加速國產化替代進程。

結語

從阿里雲闢謠 “採購寒武紀 15 萬片芯片” 傳聞，到其 “B 計劃” 清晰落地 —— 自研聚焦 AI 推理任務、採用全國產供應鏈的芯片，未來三年豪擲 3800 億築牢國產算力底座，這一系列動作既是阿里應對英偉達 H20 採購受限、填補算力缺口的務實舉措，更折射出國內科技企業在 AI 算力自主化賽道上的戰略覺醒。

阿里自研芯片的設計極具針對性：針對通義千問大模型優化架構以提升能效比，兼容 CUDA 生態以降低開發者遷移成本，依託國內代工廠實現 “端到端” 國產化 —— 每一步都精準破解了國產芯片 “落地難、斷供風險高” 的核心痛點。而平頭哥此前在含光 800、倚天 710 芯片上積累的技術沉澱，更為這一佈局奠定了紮實的落地基礎。

聲明：本文由電子發燒友原創