算力租賃市場爆發,H20遭瘋搶!小心掉坑_風聞
歪睿老哥-芯片研发工程师-聚焦芯片行业的那些事,唯武侠与芯片不可辜负1小时前
電子發燒友網報道(文/黃山明)從2022年起,美國開始持續收緊對華芯片的出口政策,而H20便是英偉達專為中國市場量身定製的AI芯片。今年以來,市場中的英偉達H20需求突然開始上漲。與此同時,市場中的算力服務器租賃需求也在爆發式的增長,更出現了“一機難求”的盛況。
AI服務器告急,H20芯片需求大漲
近期,許多上市公司紛紛發佈公告,計劃佈局算力租賃市場。隨着國產大模型的升級,算力租賃市場開始迎來高速增長,據某些算力中心人士預測,其今年的營收將比2024年增長三倍以上。
與此同時,不少公司正在加緊採購算力服務器,尤其是高性能的算力服務器更是需求旺盛。例如蓮花控股孫公司蓮花紫星智算科技向中建投租賃200台高性能服務器,為期三年。
有算力租賃分析師表示,從產業調研的情況來看,僅目前浮現的潛在大廠採購方可能接近300億市場規模,預計中國2025年算力租賃市場規模有望超千億。整體來看,2024年我國AI服務器整體市場規模190億美元,2025年預期將達到255億美元。
不僅是國內,海外市場中,算力租賃同樣火熱。前不久英偉達被爆出將收購Lepton AI,這是一家專門做搭載英偉達AI芯片服務器的公司,而此舉被視為英偉達進軍雲計算和企業軟件市場的一部分。巧合的是,就在這則消息被曝出不久後,近期市場中又傳來谷歌公司正在洽談租賃英偉達的AI服務器。
算力租賃市場的火爆,也帶動了市場中AI芯片的旺盛需求。以英偉達的H20為例,儘管該芯片作為英偉達專為中國量身定製的產品,並且其性能僅為H100的十分之一,但好在可以直接在中國售賣。
有接近新華三的產業鏈人士透露,目前141GB H20基本被銷售一空,而96GB版本也接近售罄,同時不知道未來何時能否再有供應,這需要取決於美國方面是否會放出相關禁令。
據財聯社報道,H20的短缺情況從今年2月份便已有端倪,其中算力資源信息共享平台稱H20諮詢量為年前3倍,8卡H20機器價格較年前漲價10萬,單價已經達到了110萬左右。市場中算力需求主要集中在英偉達的H20,同時具有一定性價比的4090也受到了市場的青睞。
而採購方主要來自於互聯網大廠,例如阿里巴巴、騰訊、字節跳動等,共向英偉達訂購了價值高達160億美元的H20服務器芯片。其中阿里在2月中旬確認了與蘋果AI進行合作,蘋果官網顯示,中文版Apple Intelligence將於4月上線,其採用的服務器支持便來自阿里。
而騰訊方面也有相關人士透露,騰訊雲已推出適配H20的四款面向不同場景的DeepSeek專屬資源部署方案,並表示H20為性價比最優的選擇。
AI算力市場,一時之間,好似又進入到了繁花似錦的階段,尤其是目前H20的需求大增。其背後的原因在於DeepSeek的出現,以算法創新重構AI算力邏輯,讓AI計算從訓練為主轉換到推理為主。雖然H20性能上有所下降,但做推理還是綽綽有餘,顯存足夠,適合跑大規模的參數模型,價格也更低。
租賃市場仍在,但不一定是H20
在過去,大模型的私有化部署成本昂貴,僅採購商業閉源模型這一項,就需要數百萬乃至上千萬。如果企業規模大,使用人數多,還需要採購多套模型,成本呈指數級上升。但隨着開源的DeepSeek出現後,企業可以直接免費下載,模型成本直接歸零,直接點燃了市場中做AI應用的熱潮。
同時,Deepseek主要的一個優勢就是計算成本大大降低,其語義識別能力和推理能力非常強大。有企業透露其匹配率提升了20%左右,成本降低超過50%。
當然,對於許多想要參與的中小型企業而言,自己建立數據中心可能需要數十億的投入,還不如直接採用租賃的方式,這也是為何近期算力租賃市場愈發火爆的原因。
但H20卻不一定能一直伴隨國內算力租賃市場的春風,自2022年起,美國先後將英偉達的A100、H100、A800、H800 等高性能 AI 芯片列入對華出口禁令,這才讓弱化版的H20被推出。而隨着前段時間,美國商務部再次將多箇中國企業納入所謂的“實體清單”,並進一步收緊H20的出口許可,未來甚至面臨全面禁售。
與此同時,中國發改委正在推行數據中心的能源效率新規,要求新建或擴建的數據中心採用PUE(能源利用效率)低於1.5和符合“能效/算力比”的芯片。H20的能效表現顯著低於華為昇騰、壁仞科技等國產芯片,例如壁仞科技的產品能效可以達到H20的2倍以上。
加上目前國內AI企業已經開始認可華為昇騰、寒武紀、壁仞等本土芯片產品,同時優化算法以降低算力消耗。此前,DeepSeek曾因算力不足暫停了API服務,也在倒逼行業加速構建自主算力生態。
據DeepSeek研究人員的測試結果,推理任務中,昇騰910C性能可以達到H100的60%。同時推理時代對於雲計算、AI Infra架構也有着全新的需求。
此外,目前已經明確2030年前持續提升能效,H20的高能耗特性使其在算力採購中被邊緣化,面臨被技術性淘汰的風險。
儘管目前有消息顯示,英偉達正在積極應對可能的禁令,同時計劃修改H20芯片以符合中國能效標準,但這樣一來性能可能會進一步下降,進一步推動企業採購國產AI芯片。雖然英偉達也可能通過租賃境外雲算力,來間接服務中國客户,但這樣成本較高。
因此,大摩預計,2025年中國本土AI芯片的市場份額將從2024年的15%提升至25%。而這種影響是深刻的,以騰訊為例,儘管仍然在採購H20,但騰訊也在加強芯片、模型、應用層的本土化協同,例如在其微信中集成DeepSeek模型時,還同步推進與本土芯片廠商的適配,減少對英偉達的長期依賴。
一方面是懸而未決的禁令風險導致供應鏈的不穩定,另一方面是中國能效政策下的驅動。顯然,DeepSeek的出現固然推動了算力需求的增加,但H20未來的日子未必好過。
總結
在DeepSeek出現後,小微企業開始乘着AI應用的東風,算力租賃訂單也呈爆發式增長。甚至一些企業還將大模型嵌入服務器中,降低企業的調試成本。H20作為目前唯一可以買到的英偉達AI芯片,也被市場拉抬炒作。但隨着中美雙方博弈持續,如今H20的爆火,更多像是一場絢麗的煙花表演。

聲明:本文由電子發燒友原創