大模型廠商急尋PlanB:英偉達改良版芯片已調試 華為等國產算力供應不足_風聞
IT时报-《IT时报》官方账号-昨天 17:41

國內算力“漲價風暴” 期待產能上升
作者/ IT時報記者 毛宇
編輯/ 郝俊慧 孫妍
自10月24日美國針對人工智能(AI)芯片的出口管制禁令正式生效,已經月餘。
《IT時報》記者多方採訪獲悉,英偉達面向中國市場的改良版——HGX H20已與國內頭部服務器廠商在進行適配測試,由於具體的性能差異和優化程度掛鈎,目前還很難對其與高配版H800做性能對比,但是,預估HGX****H20的8卡服務器仍高達百萬級**。**英特爾則對Gaudi 2改良版本表示暫無相關回應。仍可以在國內銷售的AMD MI 210則被認為在大模型微調階段具有相當競爭力。
“最近算力漲價太多,我們確實感到很吃力。”一家大模型創業公司人士告訴《IT時報》記者,他們迫切希望有Plan B方案。
最好的Plan B當然是國產算力。目前能夠與英偉達一戰的華為昇騰910B已經在科大訊飛、多地智算中心落地商用,且從測試結果來看,某些性能已經與英偉達芯片相當。但突如其來的禁令,使得國內大模型廠商對華為芯片的需求直線上升。
春天來得太快,華為的供應鏈還需時間做好準備。

改良版:
訓練能力下降 綜合能耗上升
針對禁令,英偉達、英特爾、AMD等公司迅速做出反應,均放出消息正加緊研製改良版AI芯片。
**英偉達計劃推出最新改良版系列芯片——HGX H20、L20 PCle和L2 PCle,其中HGX H20被認為是此次被禁售的H800替代品。**一位英偉達經銷商告訴《IT時報》記者,“HGX H20正在適配測試中,説是改良版,但其實是‘縮水版’。據我瞭解,H20符合美國出口芯片的相關規定,性能上比H800會有不小差異,但拿貨最快也得下個月。”

據鈦媒體App此前報道,H20在帶寬、計算速度等方面均有所限制。理論上,整體算力要比英偉達H100(第一代被禁芯片)降低80%左右,即H20等於H100的20%綜合算力性能,但增加了HBM顯存和NVLink互聯模塊。
一份網傳的調研報告認為,H20設計工藝較為一般,甚至不如華為昇騰910B的算力設計工藝,但增加的顯存和網絡帶寬可能更適合訓練參數不多的模型,適合多卡堆疊與多個AI服務器的使用,“如果有足夠的買卡資源,並不考慮能耗,H20算力可以達到H100算力集羣算力。”
但一位雲計算業內人士認為,這種情況實現的可能性並不高,“H20是風冷,熱設計功耗為400W,和A100大體相當,雖然低於H100的700W,但靠堆疊達到H100的算力,可能實際功耗是H100的2倍甚至更高。到最後比拼的都是能源,根本沒有足夠的電力供應機房。”

國產算力性能對標
但供應不足
受限於禁令,這一個月來,算力市場風起雲湧。
11月初,包括中貝通信、優刻得等提供AI算力技術服務的國內上市公司均公開表示,受服務器供應緊張影響,租賃價格將會結合市場行情等因素進行相應調整。
英偉達A100芯片算力服務收費價格甚至最高上調100%。
《IT時報》記者從某雲商瞭解到,H800的算力資源非常緊俏,基本有價無貨,A100(A800)的算力租賃價格上漲幅度暫時只有20%左右,但庫存水位已經很低。
眾多目光聚焦於國產本土AI芯片,而熱度最高的自然是華為昇騰。此前《IT時報》曾獨家報道,昇騰910B已在國內不少智算中心落地,進入規模化商用前期,且從多個信源反饋,在某些指標上,910B已經可以對標英偉達去年被禁的A100。

“我們之前已經和華為團隊有深度合作,雙方研發人員聯手攻克了不少困難。”最近剛剛發佈千億參數大模型星辰的中電信人工智能科技公司副總經理劉翼告訴《IT時報》記者,測試中華為昇騰帶來不少驚喜。
通信高級工程師、戰略規劃專家袁博此前在接受《華夏時報》採訪時表示,華為昇騰芯片和英偉達GPU的適用場景不一樣,在AI機器學習訓練領域,其能力已經接近甚至部分超越英偉達的水平,但圖像圖形處理是弱勢,因此只能彌補英偉達的部分場景。
“基於華為昇騰910B的算力價格大概和英偉達A100差不多,”一名接近華為的業內人士告訴《IT時報》記者,儘管H20仍有生態優勢,但長遠來看,國內各大廠商仍將華為昇騰看作Plan B的最優解,“只是910B產能正在慢慢爬坡,目前暫時無法滿足這麼多需求。”
長期來看,美國禁令的進一步收緊,給了國產算力更充足的發展時間。
IDC最新報告指出,隨着政府支持,中國本土雲端AI加速芯片製造商也正在快速增長。2023年上半年,中國AI服務器使用了50萬塊本地採購/開發的AI加速器芯片。這一數量佔據了中國整個服務器市場的10%。顯然,這個數字在2024年將飛速躍升。

算力服務器價格翻倍
至少在目前,國內各大廠商仍離不開英偉達。百度CEO李彥宏此前回應,百度得益於之前開發文心一言,已保存不少AI芯片,能夠保證未來1~2年內不斷更新AI大模型。騰訊高層也回應,H800等芯片庫存水平較高,未來可支持幾代混元大模型的更新。
《IT時報》記者分別致電騰訊、阿里、百度公司,詢問AI芯片訂單問題,但均未得到正面回應。
在大模型帶來巨大算力消耗的紅利之下,英偉達迎來了收入、利潤暴增的三季度。11月22日,英偉達發佈2024財年三季度財報,財報顯示:英偉達三季度營收181.2億美元,同比增長205.5%。營業利潤104.2億美元,同比增長1633.7%。營業利潤率高達57.5%。
如此看來,算力芯片衝擊仍有一段緩衝期,能夠給到國內各大AI廠商一絲喘氣和補救的時間。但另一方面,各類AI芯片正處於漲價通道,“僧多粥少”的局面仍在持續,尤其對於資金力度不夠的中小AI企業來説,如今算力服務器和算力的價格並不友好。
“現在H800和A800服務器(不等同於算力租賃價格)的價格很高,一台已經飆升至350萬和200萬左右,比之前翻了一倍。”一名經銷商表示。記者發現,不少經銷商在各大社交平台發帖稱手中有少量現貨可以出售,並長期以市場行情價回收二手AI芯片。
“A800和H800價格比較亂,且不便宜。”一名江蘇的芯片經銷商告訴《IT時報》記者,隨着美國禁令突然加強,國內二手算力芯片市場又開始活絡,不少經銷商開始面向全國收售英偉達二手A800和H800芯片。
另一位上海經銷商告訴記者,他手上有少量現貨的H800,報價超310萬元,國產華為昇騰910B服務器的報價則為H800的一半,並稱保證最快可於12月初交付現貨,“越早訂貨可以越早交付。”
混戰仍將持續一段時間。
排版/ 季嘉穎
圖片/ 英偉達 IT時報
來源/《IT時報》公眾號vittimes