2025年10個頂級GPU雲平台:Serverless+RL開啓AI普惠時代_風聞
美股研究社-57分钟前
近期,“AI新雲”(NeoCloud)概念在科技圈和投資圈引發熱潮。
今年3月,被業內稱作“英偉達親兒子”的AI基礎設施企業CoreWeave上市。這家依託英偉達GPU資源衝擊新雲市場的初創公司,上市不到3個月市值飆升359%,達881億美元。
CoreWeave的“身價暴漲”吸引了無數視線。對此,不少業內人士指出,大模型的訓練和推理應用都異常燒錢,高昂成本已是大模型規模化應用的關鍵挑戰之一。在此背景下,被稱為AI新雲的GPU專用雲服務平台迅速崛起。相較通用雲服務,此類平台更能精準解決AI真實場景落地的痛點。
2025年上半年的的產業圖景印證了這一趨勢。主流雲平台擁抱“無服務器架構(Serverless)+強化學習(RL)”的技術棧,不僅解決了傳統算力成本高企的行業痛點,更推動多模態創作、機器人訓練等場景效率實現指數級提升。
毫無疑問,這場由底層計算框架驅動的智能進化,為智能體邊界的拓展按下了快進鍵。全球GPU雲市場正在醖釀新的產業造富故事。
Serverless+RL,智算雲按下AI應用“快進鍵”
今年,“DeepSeek時刻”震驚全球,大模型廠商紛紛加速模型迭代,智能體大規模部署應用的元年開啓。而在全球智能體掘金熱潮中,提供底層算力的AI新雲悄然成為最重要的“賣水人”。
自2013年起便深耕中國人工智能基礎設施領域,有着豐富行業經驗的九章雲極董事長方磊指出,“從移動互聯網‘帶寬式應用’到AI時代‘計算密集型應用’的結構性變革,亟需新型雲架構支撐。”
海外市場,以CoreWeave為代表,包括Crusoe、Lambda Labs等AI基礎設施服務商正加速擴張。而國內同樣參與者眾多,比如2025年第二季度,阿里雲、九章雲極等企業先後發佈新一代AI基礎設施服務,如阿里雲的FlashMoE和九章雲極基於Serverless+RL架構的九章智算雲Alaya NeW Cloud。
AI基礎設施廠商快速發展的背後,是企業正在加速部署AI規模化應用。有機構認為,AI常因高昂的算力成本和複雜的部署被視為“極客的遊戲”,而非企業的“生產工具”,但隨着GPU雲的快速普及,讓AI快速成為企業的一個“新生產力”。
聚焦AI雲計算和基礎設施建設的廠商開始探索各種新技術路線,解決AI應用落地的痛點。
在此背景下,**“Serverless+RL”**技術組合逐漸脱穎而出。這兩項技術並非全新概念,但它們的深度融合正悄然改寫智能應用的開發邏輯,並重塑AI產業的成本結構與創新效率。
Serverless的核心價值在於“按需使用、按量付費”。企業無需預置服務器,只需關注業務邏輯,雲服務商會自動完成資源分配。而強化學習(RL)則是一種通過“試錯-反饋”機制優化決策的算法,推動智能體能力從“對話問答”(聽話)向“任務執行”(聰明)躍遷。
強化學習的核心價值在於,讓AI從人類反饋中學習。這樣做的好處是,不僅可以調優推理行為,還實質性的增強模型的推理能力,讓模型聽話,也可以讓模型更聰明。
這意味着企業能以更低的成本、更快的速度迭代智能應用,加速AI技術的落地,引發從“參數競賽”到“場景落地”的產業轉向。因此,Serverless+RL的融合不僅是技術層面的進步,更是AI產業商業化的加速器。
從“技術炫技”到“商業落地”,也必然帶來新一輪產業發展的紅利,全球GPU雲廠商正站在關鍵拐點。在這場變革中,誰能率先掌握技術融合的紅利,誰就能在未來的競爭中佔據先機。
智能時代加速演進,三大趨勢揭示技術紅利
2025年上半年,技術降本和創新效率成為人工智能、機器人產業發展的關鍵詞,也正因此,Serverless與RL兩大技術路線的組合受到了業界廣泛的關注,有望成為推動智能體商業化爆發的重要技術路線。我們從GPU雲廠商、大模型公司和機器人等多個領域觀察到這一趨勢。
關鍵趨勢一:GPU雲廠商加速技術降本和AI開發服務升級
1、九章雲極:發佈九章智算雲Alaya NeW Cloud 2.0,開創中國Serverless+RL技術路線。
6月16日,作為國家算力互聯網試驗網建設的重要成員,AI獨角獸九章雲極DataCanvas發佈了新一代全棧智能計算雲平台——九章智算雲Alaya NeW Cloud 2.0,並同步啓動全球首個強化學習智算服務,為中國近百萬的AI應用開發者和科研機構提供普惠性智算雲服務。
該平台深度融合Serverless架構與強化學習技術,實現子算成本革新:獨創“1度算力”按實際消耗計費模型,顯著降低使用門檻。實測顯示,其多模態訓練推理成本僅為行業均值40%,多場景拍攝效率提升35%,虛擬場景製作耗時從2小時減少至20分鐘,動畫電影製作成本降低60%。
相比海外以CoreWeave為代表的資源型企業,九章雲極展現出中國廠商更關注技術“用處”的不同思路。九章智算雲Alaya NeW Cloud 2.0集成了豐富的AI開發框架和工具,如TensorFlow、PyTorch等,支持多種編程語言,方便開發者快速構建和訓練AI模型。
與海外平台圍繞資源佈局不同,九章雲極增加AI技術權重,圍繞智能計算中心算力調度這一國際頂尖能力,連續突破AIDC智能體的技術門檻,形成算力調度智能技術專利護城河——本季內,九章雲極先後發佈了“智能體調試智能體方法”、“大模型函數調用優化方法“、”生成多智能體協作系統方法“、”智能體開發工具函數方法“等多個專利,發佈“國內首個智算調度Agent“。
2、CoreWeave:成為ClusterMAX™評級體系鉑金級GPU雲服務商
CoreWeave整體用户體驗和性能表現優秀,已達到ClusterMAX™評級體系的鉑金標準。CoreWeave技術路線深度綁定NVIDIA生態,在AI訓練領域具備先發優勢,是AI算力基礎設施領域的專業化服務商代表之一。
3、Lambda Labs:完成D輪融資,成本與客户體驗是GPU雲平台關鍵方向
Lambda labs,宣佈成功完成了4.8億美元的D輪融資,使其總股本達到了8.63億美元。據悉,此次融資由Andra Capital和SGW共同主導,NVIDIA、ARK Invest等投資者參與其中。
據Lambda Labs聯合創始人兼首席執行官,Stephen Balaban自述,因為AWS 的GPU 雲實例極其昂貴,Lambda Labs決定自己組建GPU 服務器集羣,然後為客户提供更具性價比的解決方案。
此外,Lambda正在積極開發託管Slurm服務,這將大幅提升客户體驗。
4、Google Cloud:Next 25大會上發表多項AI創新,成本性能雙突破
Google Cloud 通過提供搭載 NVIDIA B200 和 GB200 GPU 的 A4 和 A4X 虛擬機,為客户提供更多 AI 硬件選擇。Google 也將成為首家提供 NVIDIA 新一代 Vera Rubin GPU 的雲提供商。
Cloud Wide Area Network(Cloud WAN)針對應用程序性能進行優化,可提供超過40%的性能提升,同時降低高達40%的總體持有成本。
趨勢一小結:無疑,成本和開發者體驗成為雲GPU廠商競爭的兩大價值錨點,而Serverless+RL的優勢凸顯,有望成為AI新雲發展的核心技術驅動力。
關鍵趨勢二:大模型部署與推理應用聚焦成本
1、聚焦雲上部署Deepseek,國內雲廠商大幅降低部署成本。
DeepSeek-R1的問世讓低成本的模型訓練變得可行。方磊就此提出,能否為數千萬開發者提供普惠算力服務,將成為決定AI雲企業競爭力的重要考核維度。
然而,以DeepSeek-R1大模型來看,權重顯存達700GB,需16張96GB顯存GPU多機部署,依然面臨高昂硬件成本與跨機傳輸效率挑戰,雲端部署方案破解瓶頸勢在必行。
近期,國內科技巨頭紛紛針對DeepSeek雲上部署作出優化。比如,阿里雲支持一鍵部署DeepSeek系列模型,提供彈性算力與自定義環境,按需付費模式大幅降低硬件投入;九章智算雲結合Serverless與強化學習(RL)技術復現DeepSeek- R全參數微調,在 AIME 2024 基準上取得了81.70%準確率(採樣),超越了DeepSeek-R1滿血版,部署成本降至40%。
這些信息説明。AI普惠的進程在GPU雲廠商推動下正在持續加速。
2、OpenAI:模型加速迭代,成本持續優化。
再看大模型廠商,同樣在迭代大模型能力的同時,持續改進降本。比如,近期OpenAI新上線的o3-pro不僅有更強的能力,可以訪問一系列工具,包括網頁瀏覽、文件分析、視覺推理、基於內存的個性化響應等,更有更低的花費,輸入的價格為20美元100萬tokens,輸出則是80美元100萬tokens,較這一模型所取代的o1-pro降低了87%。100萬tokens相當於75萬個單詞。
趨勢二小結:隨着模型使用成本持續優化,AI Agent將爆發式發展,帶來更多算力需求,GPU雲廠商將從中受益。
關鍵趨勢三:Serverless+強化學習成機器人產業“關鍵技術”
1、宇樹科技:強化學習代碼全面開源。
宇樹科技開源培訓訓練了其機器人訓練的所有源代碼包括了強化學習(RL)代碼、從模擬到模擬(Sim-to-Sim)和從模擬到現實(Sim-to-Real)的源代碼。該項目可以幫助開發者或研究人員在虛擬環境中模擬和機器人,然後把結果轉移到機器人上。既降低試錯成本,又保障訓練安全。
2、特斯拉擎天柱:完全通過強化學習(RL)在模擬環境中訓練。
特斯拉公佈了機器人擎天柱的訓練方式:用強化學習(RL)+模擬器來機器人的方法,讓擎天柱看互聯網上的視頻,學動作,然後在模擬器裏,用強化學習提升可靠性。擎天柱的發展已經進入快車道,未來的進步速度很可能會非常嚇人。
總結:強化學習(RL)已深度融入生成式AI的對齊優化與機器人自主進化流程,而Serverless架構則通過重塑資源供給模式,為智能體提供彈性算力基座。未來,Serverless+RL有望成為驅動智能體規模化落地的核心技術路線。
結語
Serverless與強化學習(RL)的技術組合正在讓AI開發從“參數競賽”變成“場景落地”,新的投資機會正在湧現。
歷史經驗表明,最具商業價值的企業,往往通過重塑客户成本結構實現爆發式增長。
不像想象,GPU雲平台在新的技術路線加持下,將激發指數級增長的智能場景需求,成為智能體時代的超級潛力股。
來源:美股研究社