老黃重磅發佈5090,定價15000!22000元的世界最小AI超級計算機也來了_風聞
量子位-量子位官方账号-41分钟前
金磊 一水 發自 凹非寺
量子位 | 公眾號 QbitAI
就在剛剛,老黃穿着全新的皮衣,在CES上一波接一波放大招。
先是發佈了自家最新的GPU——RTX 5090。

直接來看下基於Blackwell架構的最新GPU主要性能:
擁有920億個晶體管
具備4000 AI TOPS(每秒萬億次操作)的性能
能夠實現380 RT TFLOPS(每秒萬億次浮點運算)的光線追蹤性能
具備1.8 TB/s 的內存帶寬,能夠快速地讀取和寫入數據
具有125 Shader TFLOPS 的着色器性能

這一50系列GPU的價格也直接一道公佈:
RTX 5090:1999美元(約14651元)
RTX 5080:999美元(約7321元)
RTX 5070 Ti:749美元(約5489元)
RTX 5070:549美元(約4023元)

而Blackwell架構關鍵的互聯技術也上了波新的——NVLink72。
依舊是快速來看下主要性能亮點:
72個Blackwell GPU具備1.4 ExaFLOPS TE FP4計算能力
晶體管數量達到130萬億
擁有2592個 Grace CPU核心
72個ConnectX - 8網絡接口卡
576個存儲芯片,總容量14TB,帶寬1.2PB/s
18個NVLink交換機,全連接帶寬130 TB/s

非常有意思的是,老黃現場還手持巨大的樣品,宛如一個盾牌,開始了整活兒:

除此之外,AI超算,現在迎來了PC時刻。
因為就在剛剛,老黃一道還發布全球最小的個人AI超級計算機——Project Digits。

有多強悍?
2000億參數的大模型,直接在你辦公桌上(自己的桌面系統)就能跑!

如果把兩台Project Digits一塊“食用”,那麼還可以跑4050億參數的大模型。

據瞭解,每個Project DIGITS配備了128GB統一、相干內存和高達4TB的NVMe存儲,僅需標準電源插座即可運行。
並且在桌面系統上對大模型搞完開發或推理之後,還可以無縫部署到加速雲或數據中心基礎設施裏。

正如老黃在現場所説的那樣:
AI將成為每個行業、每個應用的主流。
在每位數據科學家、AI研究人員和學生的辦公桌上都可以放置像Project DIGITS一樣的個人AI超級計算機,讓他們能夠參與並塑造人工智能時代。
而且Project DIGITS不用等太久哦,今年5月份就會開始提供,起售價3000美元(約21978元)。
那麼Project DIGITS又是如何做到又小又彪悍的呢?
搭載了全新的GB10超級芯片
Project DIGITS的關鍵,就在於它搭載的全新Grace Blackwell超級芯片(GB10)。
這個系列芯片想必大家並不陌生了,基於Grace Blackwell架構,是一款片上系統(SoC)。
在FP4精度下可以提供高達1千萬億次浮點運算的AI性能。

GB10包含了英偉達Blackwell GPU(具有最新一代 CUDA 核心和第五代 Tensor Cores),通過 NVLink-C2C 芯片到芯片互連連接到高性能 NVIDIA Grace CPU(採用 Arm 架構的 20 個節能核心)。
據瞭解,聯發科參與了GB10的設計,對提升能效、性能和連接性等方面起到了一定作用。

基於這樣的架構,企業和研究人員可以在本地運行Linux系統的Project DIGITS上進行模型原型設計、微調與測試,再部署到NVIDIA DGX Cloud等上面。
用户還可以訪問因為大的AI軟件庫,包括NGC目錄和開發者門户中的軟件開發工具包、編排工具、框架和模型等,可用NVIDIA NeMo框架微調模型、NVIDIA RAPIDS庫加速數據科學,運行PyTorch等常見框架。
還可利用NVIDIA Blueprints和NVIDIA NIM微服務構建智能AI應用;據瞭解,從實驗到生產環境時,NVIDIA AI Enterprise許可證提供企業級安全等支持。
允許商用的世界基礎模型Cosmos
與此同時,老黃還宣佈英偉達將開源允許商用的世界基礎模型——Cosmos。

Cosmos平台既包括用於生成物理世界合成數據的擴散及自迴歸Transfomer模型,還有視頻Tokenizer以及用來加速視頻處理的管道。
其中,Cosmos基礎模型在2000萬小時的駕駛和機器人視頻數據上訓練而成,主要用來加速自動駕駛和下一代機器人訓練研發。
開發者既可以用Cosmos生成物理合成數據,也可以用英偉達NeMo框架+私有視頻數據進行微調。
而如此發佈也是基於目前AI技術的發展大勢。

具體而言,本次CES大會上,老黃一共介紹了三類模型:
Nano:超低延遲的即時模型,優化用於邊緣部署;
Super:高性能基線模型,適用於開箱即用的微調和部署;
Ultra:最高準確度和質量,適合模型定製;

據介紹,這些模型的參數大約為40億~140億,任何企業無論規模大小,都可以自由使用Cosmos模型。
目前已公佈的第一批試用者包括機器人公司1X、Agility Robotics,以及自動駕駛領域的Uber、小鵬、比亞迪等。

對了,老黃這次特意官宣豐田將基於英偉達芯片和操作系統開發下一代新能源汽車。

從用法展示來看,Cosmos已經能夠幫助工業界和自動駕駛生成大量數據,從而加速相關AI技術研發了。

即日起,開發者可以在英偉達API目錄中預覽第一批Cosmos模型,並從NGC目錄和Hugging Face下載模型和微調框架。
另外,Cosmos也為進一步擴展Omniverse(英偉達工業數字化和物理AI仿真平台)提供了新的可能。
開發者可在Omniverse中構建3D場景,渲染輸出後用於Cosmos模型生成合成虛擬環境,最終用於物理人工智能訓練。


還有比較壯觀的場面,就是老黃站在一排機器人的中間,頗有具身智能boom時代的意味。

還有兩個新模型服務
除了非常fashion的世界模型之外,老黃這次還發布了兩個大方向的模型服務。
一個是AI基礎模型,主要適用於RTX AI PC,主打的就是輕鬆、靈活開發。
具體而言,通過連接到圖形用户界面(GUI)的NIM微服務,用户可輕鬆訪問和部署最新生成式 AI 模型。
英偉達發佈了來自Black Forest Labs、Meta等頂級模型開發者的一系列NIM微服務,涵蓋多種類型,如Llama Nemotron系列中的Nano模型可作為RTX AI PC和工作站的微服務,擅長智能體AI任務。
這些微服務包含在PC上運行AI的關鍵組件,並針對英偉達GPU進行了優化,可在Windows 11 PC(搭配 WSL)上快速下載、設置和運行,且與諸多AI開發和智能體框架兼容。

NIM微服務之外,AI藍圖(AI Blueprints)也即將在PC上可用。
AI藍圖是基於NIM微服務構建而來,主要為數字人類、內容創作等提供預配置參考工作流程。
例如PDF轉播客藍圖可提取PDF內容生成腳本及音頻,3D引導生成式AI藍圖能讓藝術家利用3D場景更好地控制圖像生成。
具體到產品,英偉達預覽了Project R2X,這是一個具有視覺功能的PC虛擬形象,可通過NVIDIA RTX Neural Faces算法渲染面部,並由新的Audio2Face - 3D模型驅動動畫,能連接多種AI服務和微服務。
據瞭解,從今年2月開始,NIM微服務和AI藍圖就可以使用了,多家PC製造商和系統構建商將推出支持NIM的RTX AI PC。
同樣是基於NIM微服務,英偉達這次還推出了Nemotron模型家族,包括:
Llama Nemotron大型語言模型
Cosmos Nemotron視覺語言模型
這兩個大模型則是更傾向於AI智能體方向。
Llama Nemotron是基於開源Llama基礎模型構建,採用英偉達最新技術和高質量數據集進行剪枝和訓練,優化了計算效率和準確性。
擅長指令遵循、聊天、函數調用、編碼和數學等,尺寸經過優化可在多種英偉達加速計算資源上運行。
尺寸方面同樣包含Nano、Super 和 Ultra三種大小:
Nano成本效益高,適用於低延遲即時應用和PC及邊緣設備;
Super在單個GPU上提供高吞吐量和高精度;
Ultra為數據中心規模應用設計,精度最高。

Cosmos Nemotron視覺語言模型則是結合了英偉達的NIM微服務,可以讓開發者構建能分析和響應圖像及視頻的智能體,應用於多個領域。
One More Thing
就在老黃登上CES之前,英偉達股價又又又創下了歷史新高!
漲幅超3%,收盤價為149.43美元(高於去年11月7日創下的每股148.88美元收盤紀錄),最新估值達到3.66萬億美元,成為僅次於蘋果的全球第二大上市企業。

**△**圖源𝕏 @YahooFinance
不知道這次發佈的東西是否符合大家的期待捏?

參考鏈接:
[1]https://www.youtube.com/live/k82RwXqZHY8
[2]https://x.com/YahooFinance/status/1876376522766024882