擊碎摩爾定律！英偉達和AMD將一年一款新品，均提及HBM和先進封裝_風聞

歪睿老哥-芯片研发工程师-聚焦芯片行业的那些事，唯武侠与芯片不可辜负26分钟前

2024-06-04

電子發燒友網報道（文/吳子鵬）摩爾定律是由英特爾創始人之一戈登·摩爾提出的經驗規律，描述了集成電路上的晶體管數量和性能隨時間的增長趨勢。根據摩爾定律，集成電路上可容納的晶體管數目約每隔18個月便會增加一倍，性能也將提升一倍。過去很長一段時間，摩爾定律被認為是全球半導體產業進步的基石。如今，這一定律已經逐漸失效，延續摩爾和超越摩爾路線紛紛出現。

6月2日晚間，英偉達創始人兼首席執行官黃仁勳在台北國際電腦展（COMPUTEX）開幕前發表主題演講。他直言，英偉達承諾將以“一年一代”的節奏推出新的AI芯片。這一速度將明顯超越摩爾定律，因為英偉達每一代AI芯片的發佈，相較於上一代，都能夠帶來數倍的性能提升。

隨後在6月3日，AMD首席執行官蘇姿豐在主題演講中同樣表示，AMD將於2025年推出MI350系列，再過一年會推出MI400。大約一年發佈一款的速度與英偉達的計劃看齊。

一年一平台，一年一產品

在演講中，黃仁勳透露了英偉達後續兩年的平台路線，2025年英偉達AI芯片將基於Blackwell Ultra平台，2026年是Rubin平台，2027年則是Rubin Ultra平台。

今年GTC大會上，英偉達發佈了新一代的GPU架構平台Blackwell和B200芯片產品。從架構來看，Blackwell架構用於數據中心，針對當前火爆的AI大模型優化，訓練、推理性能和能效均大幅提升。基於Blackwell架構，英偉達B200芯片由兩個超大型Die封裝而成，內含超過2080億個晶體管，是前一代800億個晶體管的兩倍以上，推理速度提升30倍以上，成本和能耗降低高達25倍。

黃仁勳表示，“Blackwell計算能力的增長是驚人的。但更重要的是，每當我們的計算能力提高時，成本卻在不斷下降。基於Blackwell平台的芯片，用於訓練GPT-4模型（2萬億參數和8萬億Token）的能量下降了350倍。”

同時，黃仁勳稱，Blackwell芯片現已開始生產。不過，根據產業界的消息，量產上市的Blackwell芯片並不便宜，滙豐銀行分析師透露的數據顯示，GB200 NVL36/NVL72計算平台的定價分別為180萬美元和300萬美元，GB200的定價為6萬至7萬美元，B100的定價為3萬至3.5萬美元。

不過，黃仁勳依舊是相同的觀點：英偉達的芯片，買得越多就會越便宜！

按照英偉達的規劃，2025年該公司將推出Blackwell Ultra AI芯片，將繼續引領全球AI 芯片的發展。和Blackwell Ultra平台一起發佈的還有下一代頻譜交換機。

然後到2026年，英偉達將推出Rubin架構，2027年推出Rubin Ultra AI芯片。雖然Ultra可能只是擴展，不過就像這個詞所代表的意思，預計英偉達將會在Ultra代上顯著增加芯片的規模和能力。

和英偉達一樣，AMD雖然加快了創新速度，但是創新質量卻很有保障。AMD將於今年推出採用第四代高帶寬內存（HBM）HBM3E的MI 325X芯片，內存帶寬提高一倍，效能提升1.3倍。明年推出的MI 350X將會採用3nm工藝基於CDNA 4架構，預計同系列性能增幅將創造AMD歷史之最。

HBM芯片和先進封裝成為革新要點

既然英偉達和AMD的AI芯片迭代已經在速度上超越了摩爾定律，也就代表着先進製程對於英偉達AI芯片有用，但又不是那麼有用。能夠實現如此巨大的性能飛躍，有兩點是非常重要的：HBM顯存和先進封裝，前者突破了傳輸的限制，後者讓芯片規模超越了製程。無論是黃仁勳和蘇姿豐的演講，還是兩家公司近來的動作都體現了這一點。

上文提到，AMD將會在MI 325X芯片中使用HBM3E。根據黃仁勳的描述，英偉達將會在Rubin架構產品上首次支持8層HBM4高帶寬存儲，隨後在Rubin Ultra AI芯片上升級為12層HBM4。SK海力士總裁兼AI基礎設施負責人Justin Kim表示，該公司計劃和台積電合作，採用台積電的先進封裝技術，以打造出業界性能最佳的HBM4。

此前，作為AI芯片裏HBM內存的主要供應商，SK海力士基本是採用專有的技術。據悉，SK海力士已使用專有技術製造高達HBM3E的基礎芯片。從技術細節來看，以硅通孔技術（TSV：Through Silicon Via）、批量回流模製底部填充（MR-MUF：Mass Reflow-Molded Underfill）先進封裝工藝作為核心技術，通過MR-MUF技術，SK海力士能打造出性能穩定且層數領先的HBM內存。

如果SK海力士也採用台積電的先進封裝，那麼將有助於英偉達和AMD的AI芯片更好地融合HBM4內存。根據台灣媒體此前的報道，英偉達、AMD 兩家公司包下台積電今明兩年CoWoS與SoIC先進封裝產能。英偉達目前的主力產品H100芯片主要採用台積電4納米制程和CoWoS先進封裝，與SK海力士的高帶寬內存（HBM）以2.5D封裝形式提供給客户。目前，英偉達芯片主要採用的CoWoS技術具備提供更高的存儲容量和帶寬的優勢，是目前高端先進封裝的主流方案。

將InfiniBand的性能帶到以太網架構中

除了平台和芯片的劇透以外，此次英偉達黃仁勳演講還有一則值得關注的消息，那就是InfiniBand和以太網的融合。從生態來説，CUDA、NVLink和InfiniBand等多項私有方案的存在，也是英偉達和AMD等其他公司最明顯的不同，如今看來InfiniBand將率先擁抱開放。

英偉達的InfiniBand是一種高速網絡和輸入/輸出（I/O）技術，旨在連接數據中心和高性能計算（HPC）環境中的服務器、存儲系統和其他計算設備，具有低延遲、高帶寬、可擴展和高可靠等優勢。以太網則是一種廣泛用於局域網（LAN）的技術，基於IEEE 802.3以太網網絡標準，具有簡單性、靈活性和可擴展性。

可以説InfiniBand是英偉達專門為機器間信息傳輸打造的私有協議，屬於三類RDMA網絡其中之一，另外兩個是RoCE、iWARP。目前，英偉達已經在先進的芯片、超級計算架構和複雜的交換機方面形成產品體系，因此InfiniBand具有很高的價值。英偉達的InfiniBand技術來自邁絡思（Mellanox ），後者於2020年4月被英偉達收購。目前，英偉達提供全面的InfiniBand系統，包括InfiniBand交換機、InfiniBand網卡、InfiniBand以太網網關、InfiniBand線纜和光模塊、InfiniBand遙測和軟件管理以及InfiniBand加速軟件。目前，QUANTUM QM8700交換機單通道速度可達200Gb/s，整機的傳輸速度可達16Tb/s。

雖然InfiniBand技術性能強大，但是其兼容性並不好，以英偉達AI設備為主體的計算平台很難融入其他的設備，這讓高性能計算的用户很困擾，他們希望英偉達能夠支持更通用的協議——以太網。

目前，以太網技術已經支持RDMA，但是隻限於RoCE和iWARP。就像黃仁勳所言，InfiniBand想要和以太網融合並不容易。在協議棧方面，InfiniBand 擁有自己定義的1-4層格式（物理層、鏈路層、傳輸層和網絡層），是一個完整的網絡協議，這些核心底層和以太網存在很大的差異，兩者的融合確實不易。

不過，受迫於客户方的壓力，英偉達也在努力推進支持InfiniBand的以太網技術的發展，比如 Spectrum X。英偉達Spectrum以太網是一個端到端平台，包括交換機、DPU、SmartNIC、線纜、收發器和網絡軟件。目前，英偉達以太網交換機系列包括涵蓋1GbE至800GbE的全面交換機和軟件產品組合。英偉達首席財務官Collette Kress此前表示，“Spectrum-X的銷量正在不斷增長，客户包括多個客户，其中包括一個擁有100,000個GPU的大型集羣，Spectrum-X為英偉達網絡開闢了一個全新的市場，並使以太網數據中心能夠容納大規模 AI。我們預計Spectrum-X將在一年內躍升至數十億美元的產品線。”

對於InfiniBand和以太網的融合，黃仁勳介紹稱，英偉達的策略是將InfiniBand的性能帶到以太網架構中，“我們關注的焦點並非平均吞吐量，而是確保最後一個數據包能夠準時、無誤地抵達。然而，傳統的以太網並未針對這種高度同步化、低延遲的需求進行優化。為了滿足這一需求，我們創造性地設計了一個端到端的架構，使NIC（網絡接口卡）和交換機能夠通信。”

結語

過去很多年，摩爾定律都是芯片性能提升的主要手段，最新的工藝也會和頂級的芯片產品掛鈎。然而，隨着摩爾定律逐漸放緩和失效，目前英偉達和AMD等頭部廠商已經摸索出一條自己的更新路徑，這條路徑裏工藝製程只是助力之一，更多源於HBM技術和異構集成的系統級創新。

聲明：本文由電子發燒友原創