黃仁勳定律再現,英偉達可以笑傲江湖了嗎?_風聞
智百道-昨天 22:32
文 / 道哥
英偉達每兩年更新一次GPU架構,進而實現性能的大幅提升,每一次都堪稱“震撼彈”。
3月19日凌晨,備受期待的英偉達GPU技術大會(GTC)上,黃仁勳發表主題演講《見證AI的變革時刻》,宣佈推出了Hopper架構芯片的繼任者、最新一代AI芯片架構Blackwell架構的B200芯片。其定位直指“新工業革命的引擎”,“把AI擴展到萬億參數”。
目前,英偉達Hopper架構的芯片H100和GH200 Grace Hopper超級芯片正在為世界上許多最強大的超級計算中心提供算力,為訓練大型語言模型提供了強大支持,推動ChatGPT等智能服務的爆火。
相較H100,B200的性能有望提升30倍,這將讓英偉達在整個行業中保持領先位置。
憑藉AI浪潮帶來的風口以及核心產品H100,英偉達已趕超谷歌和亞馬遜,成為價值超2萬億美元的科技公司。如今,隨着Blackwell B200和GB200的問世,英偉達的領先優勢還要繼續領先。而面對風頭正勁的英偉達,其它廠商尤其是中國廠商還有機會嗎?
“全球最強”的AI芯片
在兩個小時的演講中,黃仁勳圍繞五大板塊,介紹了英偉達的最新研發進展:新的產業發展、Blackwell平台、創新軟件NIMs、AI平台NEMO和AI工坊(AI foundry)服務,以及仿真平台Omniverse和適用於自主移動機器人的Isaac Robotics平台。
最為引人關注的,還是全新的Blackwell架構平台和B200芯片。
“Hopper很棒,但我們需要更大的GPU。”
黃仁勳很快就在現場展示了英偉達的首款Blackwell芯片B200,並稱將於今年晚些時候上市。
目前,英偉達升級GPU架構的頻率為平均兩年一次,進而對產品性能進行大幅提升。
2022年,英偉達發佈了基於Hopper架構的H100,現在又推出了基於Blackwell架構的B200,性能提高的同時,也更擅長處理AI相關任務。
從外觀來看,Blackwell GPU的體積明顯大於H100,採用台積電的4納米(4NP)工藝蝕刻而成,整合了兩個獨立製造的裸晶(Die),共有2080億個晶體管,提供高達20 petaflops FP4的算力。
與H100相比,B200的晶體管數量是其(800億)2倍多。
B200算力提升的關鍵是實現了多卡互聯。
從傳統意義上説,Blackwell架構的B200芯片並不是單一GPU,而是由兩個緊密耦合的芯片組成。根據英偉達的説法,兩個芯片通過 10 TB/s NV-HBI(Nvidia 高帶寬接口)連接進行連接,從而確保它們能夠作為單個完全一致的芯片正常運行。
在此基礎上,一個GB200芯片結合了兩個B200 GPU和一個獨立的Grace CPU,將能夠使大模型推理工作負載的性能提升30倍,同時提高效率。相比H100,B200可將生成式AI的算力“成本和能源消耗降至1/25”。
這就意味着,以前訓練一個擁有1.8萬億參數的模型需要8000個Hopper GPU 和15兆瓦的功耗,**現在只需要2000個Blackwell GPU,功耗卻只有4兆瓦。**同時,取決於各種Blackwell設備的內存容量和帶寬配置,工作負載的實際性能可能會更高。
在GPT-3(1750億參數)大模型基準測試中,GB200的性能是H100的7倍,訓練速度是H100的4倍。
算力越高,功耗越少,這樣的產品自然將獲得市場的歡迎。據英偉達透露,目前,亞馬遜、戴爾、谷歌、Meta、微軟、OpenAI、特斯拉都已經計劃使用Blackwell GPU。
黃氏定律,英偉達向平台提供商進化
在芯片的發展史上,有一條非常著名的摩爾定律:集成電路上可容納的晶體管數目,約每隔18個月便會增加一倍。但隨着CPU的發展,這條定律已經逐漸失效。
台積電在3nm製程上的突破,並沒有給芯片性能帶來突破代際的提升。2023年9月,蘋果A17 Pro問世,使用了台積電生產的首個3nm製程芯片,但CPU性能只有10%的提升。
但是,伴隨着摩爾定律失效的,是黃仁勳的黃氏定律:GPU的效能每兩年將增加一倍以上。
黃仁勳指出,“創新不僅僅是芯片,而是整個堆疊”。但是,他對於芯片本身性能的介紹不長,而是將重點放在了DGX(數據中心操作系統)。
根據他的介紹,在多卡互聯上,英偉達的NVLink和NVSwitch技術是其護城河。NVLINK是一種點對點的高速互連技術,可以將多個GPU進行直接連接,進而形成一個高性能計算集羣或深度學習系統。
此外,NVLink還引入了統一內存的概念,支持連接的GPU之間的內存池,這對於需要大型數據集的任務來説是一個至關重要的功能。
而NVSwitch 是一種高速交換機技術,可以將多個GPU和CPU直接連接起來,形成一個高性能計算系統。在這項技術的支持下,英偉達可以將72塊B200連接在一起,最終成為“新一代計算單元”GB200 NVL72。
像這樣的“計算單元”機櫃,FP8精度的訓練算力高達720PFlops,直逼H100時代一個DGX SuperPod超級計算機集羣(1000 PFlops)。而“打包批發賣卡”的方式也符合大模型公司的用卡需求,這也有望提升英偉達的營收水平。
據英偉達2023財年財報顯示,英偉達的數據中心業務有40%的收入來自超大規模數據中心與雲服務商。
所以,正如黃仁勳所説,Blackwell不再是一個芯片,而是一個平台的名稱。而英偉達也將不再是芯片供應商,而更像是微軟、蘋果這樣的平台提供商,可以讓其他公司在平台上構建軟件。
這樣一個英偉達,未來是不是將成為一個無敵的存在呢?
可以高枕無憂了嗎?
資本市場的興奮度,似乎並沒有科技圈那麼高。
19日當天,英偉達股價早盤一度上漲超過4%,但隨後回落,收於每股884.55美元,漲0.7%,總市值2.21萬億美元。總體來説,有些高開低走的態勢。
對於英偉達推出的新品,投資機構Plumb Funds的首席執行官兼投資組合經理Tom Plumb表示,Blackwell芯片並不令人意外,但他同時指出,這並不意味,AMD、高通、英特爾、微軟等其他公司無法進入這一市場。
Insider Intelligence分析師Jacob Bourne則表示,英偉達鞏固了其在AI領域的主導地位,但像AMD、英特爾這樣的競爭對手,以及一些初創公司,甚至是大型科技公司,都可能削弱英偉達的市場份額,特別是在那些注重成本的企業客户中的份額。
其實,在節點財經看來,英偉達的股價在過去一年已經翻了兩倍多,成為美股市值第三大的公司。資本市場對英偉達的期望值很高,這種情況下,英偉達面臨的壓力也越來越大。而另一方面,谷歌、亞馬遜和微軟等都在開發自己的生成式人工智能芯片,以減少對英偉達的依賴,並將客户更緊密地鎖定在自己的硬件和軟件系統中。
所以,雖然英偉達被推到了AI芯片老大的位置上,但那是建立在其它對手沒有全面發力的前提下。未來,英偉達必將面對日趨激烈的競爭。
更進一步來講,面對英偉達為代表的美國人工智能芯片業的領先,中國廠商面臨的挑戰同樣嚴峻。但是,AI時代的技術變革非常迅速,行業標準不斷發展,後來者雖然面臨着很大的挑戰,但同樣擁有空前的機遇。
AI時代方興未艾,一切還沒有定數。國產替代與其臨淵羨魚,不如退而結網,抓住機會迎頭趕上。只要努力自強,落後就是暫時的。