擊碎摩爾定律!英偉達和AMD將一年一款新品,均提及HBM和先進封裝_風聞
歪睿老哥-芯片研发工程师-聚焦芯片行业的那些事,唯武侠与芯片不可辜负26分钟前
電子發燒友網報道(文/吳子鵬)摩爾定律是由英特爾創始人之一戈登·摩爾提出的經驗規律,描述了集成電路上的晶體管數量和性能隨時間的增長趨勢。根據摩爾定律,集成電路上可容納的晶體管數目約每隔18個月便會增加一倍,性能也將提升一倍。過去很長一段時間,摩爾定律被認為是全球半導體產業進步的基石。如今,這一定律已經逐漸失效,延續摩爾和超越摩爾路線紛紛出現。
6月2日晚間,英偉達創始人兼首席執行官黃仁勳在台北國際電腦展(COMPUTEX)開幕前發表主題演講。他直言,英偉達承諾將以“一年一代”的節奏推出新的AI芯片。這一速度將明顯超越摩爾定律,因為英偉達每一代AI芯片的發佈,相較於上一代,都能夠帶來數倍的性能提升。

隨後在6月3日,AMD首席執行官蘇姿豐在主題演講中同樣表示,AMD將於2025年推出MI350系列,再過一年會推出MI400。大約一年發佈一款的速度與英偉達的計劃看齊。
一年一平台,一年一產品
在演講中,黃仁勳透露了英偉達後續兩年的平台路線,2025年英偉達AI芯片將基於Blackwell Ultra平台,2026年是Rubin平台,2027年則是Rubin Ultra平台。
今年GTC大會上,英偉達發佈了新一代的GPU架構平台Blackwell和B200芯片產品。從架構來看,Blackwell架構用於數據中心,針對當前火爆的AI大模型優化,訓練、推理性能和能效均大幅提升。基於Blackwell架構,英偉達B200芯片由兩個超大型Die封裝而成,內含超過2080億個晶體管,是前一代800億個晶體管的兩倍以上,推理速度提升30倍以上,成本和能耗降低高達25倍。
黃仁勳表示,“Blackwell計算能力的增長是驚人的。但更重要的是,每當我們的計算能力提高時,成本卻在不斷下降。基於Blackwell平台的芯片,用於訓練GPT-4模型(2萬億參數和8萬億Token)的能量下降了350倍。”
同時,黃仁勳稱,Blackwell芯片現已開始生產。不過,根據產業界的消息,量產上市的Blackwell芯片並不便宜,滙豐銀行分析師透露的數據顯示,GB200 NVL36/NVL72計算平台的定價分別為180萬美元和300萬美元,GB200的定價為6萬至7萬美元,B100的定價為3萬至3.5萬美元。
不過,黃仁勳依舊是相同的觀點:英偉達的芯片,買得越多就會越便宜!

按照英偉達的規劃,2025年該公司將推出Blackwell Ultra AI芯片,將繼續引領全球AI 芯片的發展。和Blackwell Ultra平台一起發佈的還有下一代頻譜交換機。
然後到2026年,英偉達將推出Rubin架構,2027年推出Rubin Ultra AI芯片。雖然Ultra可能只是擴展,不過就像這個詞所代表的意思,預計英偉達將會在Ultra代上顯著增加芯片的規模和能力。
和英偉達一樣,AMD雖然加快了創新速度,但是創新質量卻很有保障。AMD將於今年推出採用第四代高帶寬內存(HBM)HBM3E的MI 325X芯片,內存帶寬提高一倍,效能提升1.3倍。明年推出的MI 350X將會採用3nm工藝基於CDNA 4架構,預計同系列性能增幅將創造AMD歷史之最。
HBM芯片和先進封裝成為革新要點
既然英偉達和AMD的AI芯片迭代已經在速度上超越了摩爾定律,也就代表着先進製程對於英偉達AI芯片有用,但又不是那麼有用。能夠實現如此巨大的性能飛躍,有兩點是非常重要的:HBM顯存和先進封裝,前者突破了傳輸的限制,後者讓芯片規模超越了製程。無論是黃仁勳和蘇姿豐的演講,還是兩家公司近來的動作都體現了這一點。
上文提到,AMD將會在MI 325X芯片中使用HBM3E。根據黃仁勳的描述,英偉達將會在Rubin架構產品上首次支持8層HBM4高帶寬存儲,隨後在Rubin Ultra AI芯片上升級為12層HBM4。SK海力士總裁兼AI基礎設施負責人Justin Kim表示,該公司計劃和台積電合作,採用台積電的先進封裝技術,以打造出業界性能最佳的HBM4。
此前,作為AI芯片裏HBM內存的主要供應商,SK海力士基本是採用專有的技術。據悉,SK海力士已使用專有技術製造高達HBM3E的基礎芯片。從技術細節來看,以硅通孔技術(TSV:Through Silicon Via)、批量回流模製底部填充(MR-MUF:Mass Reflow-Molded Underfill)先進封裝工藝作為核心技術,通過MR-MUF技術,SK海力士能打造出性能穩定且層數領先的HBM內存。
如果SK海力士也採用台積電的先進封裝,那麼將有助於英偉達和AMD的AI芯片更好地融合HBM4內存。根據台灣媒體此前的報道,英偉達、AMD 兩家公司包下台積電今明兩年CoWoS與SoIC先進封裝產能。英偉達目前的主力產品H100芯片主要採用台積電4納米制程和CoWoS先進封裝,與SK海力士的高帶寬內存(HBM)以2.5D封裝形式提供給客户。目前,英偉達芯片主要採用的CoWoS技術具備提供更高的存儲容量和帶寬的優勢,是目前高端先進封裝的主流方案。
將InfiniBand的性能帶到以太網架構中
除了平台和芯片的劇透以外,此次英偉達黃仁勳演講還有一則值得關注的消息,那就是InfiniBand和以太網的融合。從生態來説,CUDA、NVLink和InfiniBand等多項私有方案的存在,也是英偉達和AMD等其他公司最明顯的不同,如今看來InfiniBand將率先擁抱開放。
英偉達的InfiniBand是一種高速網絡和輸入/輸出(I/O)技術,旨在連接數據中心和高性能計算(HPC)環境中的服務器、存儲系統和其他計算設備,具有低延遲、高帶寬、可擴展和高可靠等優勢。以太網則是一種廣泛用於局域網(LAN)的技術,基於IEEE 802.3以太網網絡標準,具有簡單性、靈活性和可擴展性。
可以説InfiniBand是英偉達專門為機器間信息傳輸打造的私有協議,屬於三類RDMA網絡其中之一,另外兩個是RoCE、iWARP。目前,英偉達已經在先進的芯片、超級計算架構和複雜的交換機方面形成產品體系,因此InfiniBand具有很高的價值。英偉達的InfiniBand技術來自邁絡思(Mellanox ),後者於2020年4月被英偉達收購。目前,英偉達提供全面的InfiniBand系統,包括InfiniBand交換機、InfiniBand網卡、InfiniBand以太網網關、InfiniBand線纜和光模塊、InfiniBand遙測和軟件管理以及InfiniBand加速軟件。目前,QUANTUM QM8700交換機單通道速度可達200Gb/s,整機的傳輸速度可達16Tb/s。
雖然InfiniBand技術性能強大,但是其兼容性並不好,以英偉達AI設備為主體的計算平台很難融入其他的設備,這讓高性能計算的用户很困擾,他們希望英偉達能夠支持更通用的協議——以太網。
目前,以太網技術已經支持RDMA,但是隻限於RoCE和iWARP。就像黃仁勳所言,InfiniBand想要和以太網融合並不容易。在協議棧方面,InfiniBand 擁有自己定義的1-4層格式(物理層、鏈路層、傳輸層和網絡層),是一個完整的網絡協議,這些核心底層和以太網存在很大的差異,兩者的融合確實不易。
不過,受迫於客户方的壓力,英偉達也在努力推進支持InfiniBand的以太網技術的發展,比如 Spectrum X。英偉達Spectrum以太網是一個端到端平台,包括交換機、DPU、SmartNIC、線纜、收發器和網絡軟件。目前,英偉達以太網交換機系列包括涵蓋1GbE至800GbE的全面交換機和軟件產品組合。英偉達首席財務官Collette Kress此前表示,“Spectrum-X的銷量正在不斷增長,客户包括多個客户,其中包括一個擁有100,000個GPU的大型集羣,Spectrum-X為英偉達網絡開闢了一個全新的市場,並使以太網數據中心能夠容納大規模 AI。我們預計Spectrum-X將在一年內躍升至數十億美元的產品線。”
對於InfiniBand和以太網的融合,黃仁勳介紹稱,英偉達的策略是將InfiniBand的性能帶到以太網架構中,“我們關注的焦點並非平均吞吐量,而是確保最後一個數據包能夠準時、無誤地抵達。然而,傳統的以太網並未針對這種高度同步化、低延遲的需求進行優化。為了滿足這一需求,我們創造性地設計了一個端到端的架構,使NIC(網絡接口卡)和交換機能夠通信。”
結語
過去很多年,摩爾定律都是芯片性能提升的主要手段,最新的工藝也會和頂級的芯片產品掛鈎。然而,隨着摩爾定律逐漸放緩和失效,目前英偉達和AMD等頭部廠商已經摸索出一條自己的更新路徑,這條路徑裏工藝製程只是助力之一,更多源於HBM技術和異構集成的系統級創新。
聲明:本文由電子發燒友原創