看完老黃演講,地球上已經沒有人可以阻止英偉達了_風聞
酷玩实验室-酷玩实验室官方账号-48分钟前
6月2日晚7點,黃仁勳在台北Computex 2024上,分享了英偉達在AI領域的最新研究。

從AI的底層技術,到生成式AI在各行各業的應用,將近兩個小時的主題演講,核心只用五個字就能概括:
英偉達牛X。
很多人把英偉達比作AI時代的「賣鏟人」。根據彭博社預測,2024年,英偉達在AI GPU領域的銷售額將達到驚人的400億美元。
要知道,英偉達2024財年的總營收,是609億美元。
如此強勢的業績,也讓英偉達憑一己之力,撐起了整個美股大盤。

但看完了黃仁勳的最新演講,我覺得英偉達不止是一個AI時代的「賣鏟人」,更是一個“未來世界”的「工程師」。
這個未來世界,就是以加速計算為基礎的人工智能大爆炸的世界。
加速計算時代
這是一張男人的臉,細節到眼部肌肉的細微跳動,清晰到每一個毛孔、細紋隨光影的變化。

這是一個工廠的流水線,井然有序的機械臂,忙碌的技術工人,一切有條不紊。

這是火焰。

這是雷電。

這是彈珠落地。

這是絲帶飄舞。

這是汽車轟鳴。

這是洋流形成。

所有這一切,都來自英偉達Omniverse的虛擬工廠。
而Omniverse能夠以假亂真的兩個技術基礎,是加速計算和生成式AI。
根據老黃的演講,過去60年,計算機行業只經歷了兩三次技術變革。
第一次是1964年,IBM System 360開創了計算機兼容性時代,從此,世界上所有的電腦,都有了一種共同的電腦語言。
第二次是2007年,iPhone引入移動計算,把計算機放進了我們的口袋,並實現了雲端鏈接。

但隨着CPU性能提升的明顯不足,與人類計算需求的指數增長之間的矛盾日益凸顯,計算成本將會顯著增加(數據中心電力消耗等),這將會導致**「計算通貨膨脹」**。
這個時候,英偉達帶着GPU和CUDA來了個“神兵天降”。
英偉達的異構計算,讓GPU和 CPU 並行運行,使計算速率最快提升了100 倍,但功耗只增加了大約3倍,成本只增加了約 50%。

一台1000 美元 PC 上加一個 500 美元 GeForce GPU,性能會大幅提升。
也就是説,你買得(GPU)越多,省得越多。

而CUDA則相當於一個軟件生態,可以最大限度地開發GPU的潛能,實現加速計算。

到目前為止,CUDA在全球擁有500萬開發者和不計其數的用户,這些龐大的用户基礎,進一步降低了計算成本,讓開發人員有機會去不斷探索邊界,從而開發出更多的應用。

但這些説到底,只是讓計算機更快一點的工具,相當於一個超算中心。
直到2017年,Transformer架構問世,需要更大的數據和算力來訓練大語言模型;再到2022年11月,ChatGPT問世,所有的圖像、表格、單詞、語音、視頻,都抽象成了成了一個又一個token。
而用於訓練ChatGPT的英偉達的GPU,就成了生產這些token的「AI工廠」。
理論上,這個「AI工廠」可以生成一切,也就是——
模擬一切。
超級AI工廠
構建這個超級AI工廠的基石,是地表最強芯片,Blackwell。
過去8年,從Pascal到如今的Blackwell,英偉達芯片的浮點計算能力,增長了1000倍,而摩爾定律在這八年內的增長大約是40~60 倍。

以GPT-4的模型訓練為例,8年前的Pascal所需能耗為1000GWh,這需要一個功率在100 MW 數據中心,耗時大約一年時間,才能訓練出一個GPT-4,根本不現實啊。
而Blackwell的能耗是3GWh,能耗僅為8年前的1/350,1萬個GPU訓練10天就搞定了。
同樣的,生成一個token,Pascal 消耗的能量,相當於2 個200W燈泡運行 2 天,而新的Blackwell只使用 0.4 焦耳。
你可以説,Blackwell芯片就是專門為訓練大模型而生的。

光芯片強大還不夠,搭載芯片的服務器,也得足夠強大。
簡單來説,就是先將兩塊Blackwell芯片這樣⬇️

再這樣⬇️

通過這樣的模塊化架構,將許多個Blackwell芯片整合起來,變成一個“超級加倍”的服務器。
目前,英偉達的MGX超級計算機已經同時集成了72個Blackwell GPU。

光把芯片塞到一起還不夠,還得讓它們之間正常“通信”。
英偉達又拿出了NVLink芯片,這種芯片擁有 500 億個晶體管,74 個端口,每個端口 400Gbps,橫截帶寬 7.2Tbps,內部還具有數學運算能力。
非常抽象對吧。
你也可以這麼理解——有了NVLink,你的GPU可以變得這麼大⬇️

這是電氣奇蹟,也是機械奇蹟。
這還不算,老黃還給自己上了個強度:
2025 年推出 Blackwell Ultra 芯片;
2026 年推出 Blackwell 的繼任者 Rubin 芯片;
2027年推出 Rubin Ultra,新一代基於 Arm 的 Vera CPU,以及 NVLink 6 Switch(3600GB/s)。

總之,依靠超強性能的芯片,加上足夠強大的服務器,以及不斷的技術迭代,英偉達在AI時代賣鏟人的地位,穩如老狗啊。
説了這麼多,實際上大家對AI芯片的能耗、算力,其實很難具體感知到。
老黃講了兩個案例。
第一個是地球2,AI這麼強大的算力,可以模擬任何一個token,也就是可以創建一個虛擬地球,即數字孿生地球。

這個地球上的一切,都和真實的地球一模一樣,如此一來,就可以通過在地球2上預演,來預測未來可能發生的一切,比如氣候變化、自然災害等等,讓人類可以更好地避免災難,提前適應極端氣候。
第二個案例,是AI機器人。
機器人在英偉達的虛擬平台Omniverse上,通過數百萬次的實驗和試錯,從零開始學習抓取物體、學會自主導航,學會我們在現實生活中可能嘗試的一切,然後將其零成本遷移到現實世界。

當算力足夠強大,配合大模型不斷生成環境參數和任務去刁難機器人,機器人在虛擬世界學習一天的技能,可能相當於人類在現實世界學習一年甚至10年的程度。
當這些AI驅動機器人被大規模運用到工廠、倉庫,運用到醫療、養老,運用到很多人類不願意從事的領域,各行各業,都將被徹底改寫。
黃仁勳説,“這不是未來,這正在發生”。
靠技術引領未來,並藉此賺到足夠的錢,這是英偉達的牛X之處。
而生成式AI能帶領人類走向何處,也許很快就有答案。