華為雲徐強:迎接AI推理時代,大模型混合雲煥新升級
guancha

6月21日,在華為開發者大會(HDC 2025)期間,“華為雲Stack,智能時代更懂政企的雲”高峯論壇成功舉行。華為混合雲副總裁、產品管理部部長徐強發表題為《大模型混合雲,解鎖政企智能應用無限可能》的演講。會上,他分享了華為雲Stack在大模型混合雲領域的進展與成果,深度解讀了華為雲Stack大模型混合雲6大煥新升級能力,並重磅發佈《政企AI平台架構及應用實踐》白皮書。

華為混合雲副總裁、產品管理部部長徐強
大模型混合雲持續進化
當前,技術變革日新月異,大模型以其獨特的技術與應用優勢,已成為推動各行業智能化轉型的核心引擎。然而在邁向智能化的征程中,政企仍面臨着諸多挑戰。徐強指出,一方面,政企存在大量敏感數據需要妥善保護,“數據不出域”成為剛性要求;另一方面,構建和運行大模型所需的龐大算力與高昂成本,讓許多企業望而卻步。同時,不同行業的業務場景千差萬別,如何定製化打造貼合自身需求的智能應用,也是擺在政企面前的一道難題。
基於此,華為雲Stack打造大模型混合雲方案,通過堅實算力底座、使能百模千態、賦能千行萬業三大能力,幫助企業一站式建設自己的專屬大模型,加速邁向智能化。
去年6月,華為雲Stack發佈大模型混合雲十大創新技術,迭代基礎設施、算法架構和工程能力多維度根技術,讓AI技術不難用;同時定義了AI平台標準化的8大能力板塊,支撐百模千態和多樣化的開發場景,讓AI創新變簡單;9月,華為雲Stack面向5大行業發佈80+場景地圖,幫助客户快速訓好模型,讓AI落地更高效。
推理需求爆發式增長
今年以來,以 DeepSeek、Qwen3為代表的新一代大模型加速湧現,推動AI產業在多個維度發生深度變革。
首先,MoE架構興起,逐步打破大模型性能、成本與易用性的“不可能三角”,在實現高效推理的同時降低了使用門檻,使AI技術真正走向普惠化。
其次,CoT(思維鏈)將Scaling Law從訓練階段延伸到推理階段,在訓練算力保持相對穩定的情況下,將催生新的算力需求,同時還讓模型推理過程打破黑箱,更具可解釋性,加速AI在企業核心業務場景的落地。
第三,模型訓練的範式也不斷演進,從單一的預測學習向強化學習遷移,從預訓練逐步走向後訓練,使模型對齊人類偏好,更具“個性化適配能力”。
第四,AI的應用生態逐漸轉向開源,產業創新的重心從封閉的模型本體轉向業務驅動的應用創新,推動AI從“技術突破”邁向“價值創造”。
在這樣技術變革和推理需求快速增長的背景下,算力底座和調度面臨新挑戰。需要軟硬件系統級協同優化,結合模型架構實現分佈式彈性調度;通過PD分離實現資源解耦;以訓推一體提升資源利用率,滿足系統低時延、高吞吐,全面提升推理效率。
同時,AI開發的工具鏈也亟待適配全新的後訓練所需要的一站式數據、模型和應用開發能力,並能與開源生態無縫對接,提升AI應用的開發效率與落地速度。
打造政企更優AI平台
迎接推理時代挑戰,華為雲Stack大模型混合雲全面煥新升級6大能力,通過極致推理和精細化的運營運維實現大規模算力高效調度和管理,提供一站式模型後訓練和Agent開發工具加速模型天級調優、分鐘級部署和應用,並預置政企專屬行業使能套件和全流程專業服務,全方位加速智能應用規模落地,加速AI場景價值閉環。
在極致推理方面,華為雲Stack致力於推動平台軟件與算力硬件的深度適配,打造大規模集羣“算力省”“上線快”“體驗好”的極致推理服務。針對資源錯峯複用場景,利用訓推共池技術,算力閒置時長可下降50%;極致彈性伸縮場景下,藉助推理部署加速技術,推理服務5分鐘即可上線;而在規模並行推理場景,應用大規模專家並行推理與PD分離技術,優異的吞吐與時延特性支持達成99%+SLO推理體驗指標。
在精細化運營方面,華為雲Stack首創行業標準化AI算力度量指標體系,提供40+算力度量指標和120+全棧資源性能指標,可以管理萬卡AI算力集羣,同時支持客户CXO評估算力使用價值和投入產出比、運維人員分鐘級快速定界故障,以及運營人員實現安全合規的算力全生命週期管控,讓算力管理更高效、更可靠。
在模型後訓練方面,面向數據和模型開發工程師,華為雲Stack構建了一站式的後訓練工具鏈,覆蓋數據、訓練和評測階段,幫助企業打造專屬深度思考模型。
在Agent開發方面,面向應用落地最後一公里,華為雲Stack提供Agent開發平台,具備一站式知識中心、多智能體協作和低門檻開發多重優勢,讓企業智能應用開發像搭積木一樣簡單。
在行業使能套件方面,基於華為深入行業的實踐積累,華為雲Stack圍繞7大行業沉澱了40+開箱即用的Agent模板,助力業務分鐘級上線;同時提供工業AI引擎,聚焦視覺質檢、工藝優化、預測性維護和生產計劃4大核心領域打造了18個場景化工作流,使能政企更快速、更精準地應對複雜工業場景的挑戰。
在專業服務方面,面向模型供數、模型開發、到模型應用全流程需求,華為雲Stack提供7大類30多項專業服務、自研AI工具鏈以及在實際交付項目中沉澱的服務經驗,助力政企加快各行業場景大模型應用的創新和迭代,讓大模型從可用到好用。