英偉達甩出三大“王炸”_風聞
半导体产业纵横-半导体产业纵横官方账号-赋能中国半导体产业,我们一直在路上。1小时前

黃仁勳戲稱,英偉達芯片買得越多、省得越多。
在今日凌晨的英偉達 GTC 2025 大會主題演講中,英偉達 CEO 黃仁勳再次身穿皮衣登場,兩個小時的時長被芯片架構、數據中心、自動駕駛、AI計算機以及機器人等關鍵分享塞得滿滿的。
演講的開篇,黃仁勳強調了計算和軟件的重要性,他表示:世界正在進行一場過渡——計算方式迎來變革、軟件的未來需要資本投資。
Blackwell Ultra芯片:推理性能較前代暴漲40倍
正如大家期待的那般,英偉達在GTC大會上宣佈推出Blackwell Ultra芯片,其包括GB300 NVL72機架級解決方案和NVIDIA HGX B300 NVL16系統。

其中,GB300 NVL72將72個Blackwell Ultra GPU與36個基於Arm Neoverse的Grace CPU相連,有效地充當一個大規模GPU來支持複雜問題解決並提高響應質量。基於現有Blackwell架構的Blackwell Ultra預計將比前代產品提供1.5倍的AI性能,顯著增加AI工廠的收入機會。
而HGX B300 NVL16是服務器級產品,搭載 16 個 Blackwell Ultra GPU,對比前代 Blackwell GPU,大語言模型推理速度提升 11 倍,計算能力提高 7 倍,內存容量增加 4 倍。
黃仁勳在演講中強調,Blackwell Ultra 是為 “推理和代理型 AI” 時代設計的平台,可高效支持大模型的預訓練、微調及即時推理,並稱其為英偉達 “最強大的芯片”,推動 AI 基礎設施向推理優化轉型。
黃仁勳表示,“在推理模型中,Blackwell 的性能是 Hopper 的 40 倍”。在展示中,傳統模型的代表是 Meta Llama 3.3,而推理模型是 DeepSeek 的 R1。
值得一提的是,GB300系列將於2025年5月啓動量產,B300系列計劃下半年交付,配套服務器系統同步上市。其中,台積電負責芯片製造,SK 海力士提供 HBM3e 內存,超微負責服務器集成,確保產能穩定。
據英偉達透露,全球四大雲巨頭部署的Blackwell芯片數量已達Hopper芯片的三倍,2024 年他們共採購了130萬片 Hopper架構芯片。2025 年又購買了360 萬Blackwell 芯片。考慮到每顆Blackwell芯片的售價高達數萬美元,這意味着數十億美元的市場規模。黃仁勳打趣道,在最新技術的加持下,搭建AI工廠的廠商“買得越多、省得越多”,總而言之就是掏錢吧。
英偉達新一代AI芯片Rubin於2026下半年推出
黃仁勳重磅公佈了新一代 AI 芯片 Rubin,也就是 Hopper、Blackwell 之後的下一代架構。Rubin的命名風格延續了英偉達一直以來以傑出科學家命名芯片架構的傳統,是為紀念“證實暗物質存在”的女性科學先驅薇拉・魯賓(Vera Rubin,1928–2016,婚前姓 Cooper)。

Vera Rubin和Grace Blackwell類似,集成了CPU和GPU。在Grace Blackwell中,Grace是CPU,Blackwell是GPU;而在Vera Rubin中,Vera是CPU,Rubin是GPU。
其中,Vera CPU是英偉達首次基於自主架構Olympus設計的處理。此前,英偉達一直使用Arm授權的通用CPU設計,這在某種程度上限制了其系統級優化能力。隨着AI計算負載的特殊性日益凸顯,通用CPU已難以滿足極致性能和能效比的要求。英偉達表示,Vera CPU的內存是Grace的4.2倍,內存帶寬是Grace的2.4倍。結合Vera的88個CPU內核,英偉達稱該芯片的整體性能將是前一代產品的兩倍。
而Rubin GPU的創新之處在於其雙GPU架構設計。與Blackwell一樣,Rubin也採用了多芯片封裝技術,但英偉達對這一技術的定義進行了重要調整。從Rubin開始,英偉達將多芯片模塊中的每個裸片視為獨立的GPU,而非整體一個GPU。這一定義變更不僅是技術表述的調整,更反映了英偉達對未來GPU架構發展的戰略思考。
在推理性能方面,Rubin實現了驚人的50 petaflops,是當前Blackwell芯片的2.5倍。同時,其288GB的超大內存容量,為處理超大規模AI模型提供了充足的空間。這意味着Rubin能夠更高效地運行如GPT-4等數萬億參數的超大模型,使即時推理和更復雜的推理任務成為可能。

英偉達還公佈了"Rubin Next"的開發計劃,Vera Rubin之後的一代芯片,名為Vera Rubin Ultra。將於2027年下半年上市的Vera Rubin Ultra將把Vera CPU和Rubin Ultra芯片結合在一起。每個Rubin處理器由兩個GPU組成一個單芯片,而Rubin Ultra則由四個GPU裸片組成,進一步將性能翻倍。這種"更多GPU"的集成策略,與行業的多芯片模塊(MCM)和芯粒(Chiplet)趨勢相呼應,代表了高性能計算芯片的未來發展方向。
黃仁勳展示了 Vera Rubin NVLink576 的外觀和參數,並宣稱Rubin 的性能可達 Hopper 的 900 倍,而 Blackwell 是 Hopper 的 68 倍。
Blackwell Ultra和Vera Rubin的發佈,標誌着英偉達已成功將芯片更新週期從兩年縮短至一年。
在本次發佈會,英偉達公開了其產品路線圖:Blackwell(2024年) → Blackwell Ultra(2025年) → Vera Rubin(2026年) → Rubin Next(2027年) → Feynman(2028年)。這一清晰的"雙芯雙代"發展路線(每兩代架構各兩款芯片),讓英偉達能夠在保持技術領先的同時,最大化每代架構的商業價值。

值得一提的是,在Rubin之後的下一代AI芯片架構,英偉達將其命名為Feynman,取自著名物理學家理查德・費曼。他是美國理論物理學家,以對量子力學的路徑積分表述、量子電動力學、過冷液氦的超流性以及粒子物理學中部分子模型的研究聞名於世。根據英偉達路線圖,Feynman架構將於2028年登場。
掀起小高潮的AI計算機與機器人
除了芯片,此次GTC大會的另一個小高潮就是黃仁勳介紹英偉達在AI計算機和機器人產線的突破。
英偉達推出了新款 DGX Spark 和 DGX Station 個人 AI 計算機,黃仁勳稱其為“AI 時代的超級計算機”。
據介紹,這兩款超級計算機均由 Grace Blackwell 平台支持,旨在“讓 AI 開發人員、研究人員、數據科學家和學生在桌面上對大模型進行原型設計、微調和推理”。
其中,Spark 搭載了 GB10 Blackwell 芯片,提供第五代 Tensor Core 和 FP4 支持,具有 128GB 統一內存和高達 4TB 的 NVMe SSD 存儲,可以提供“高達每秒 1 千萬億次運算的 AI 計算。”
而體積更大的 DGX Station 可以容納英偉達剛剛宣佈的功能更強大的 GB300 Blackwell Ultra 芯片,可提供“每秒 20 千萬億次運算的 AI 性能和 784GB 的統一系統內存”。
Spark 將於今日開始預訂,售價 3000 美元起。DGX Station 目前尚未定價。
在機器人領域,英偉達推出了全球首款開源人形機器人功能模型GR00T N1。
GR00T N1 基礎模型採用雙系統架構,其靈感來自人類認知原理。“系統 1”是一種快速思考的行動模型,反映了人類的反應或直覺。“系統 2”則是一種慢速思考的模型,用於深思熟慮、有條不紊的決策。
在視覺語言模型的支持下,系統 2 可以推理其環境和收到的指令,從而規劃行動。然後,系統 1 將這些計劃轉化為精確、連續的機器人動作。
目前,GR00T N1 可以實現常見任務,例如抓取、用一隻或兩隻手移動物體,以及將物品從一隻手轉移到另一隻手,或者執行需要技能組合的多步驟任務。開發人員和研究人員可以使用真實或合成數據對 GR00T N1 進行後期訓練,以適應特定的人形機器人或任務。
*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯繫後台。