京東雲曹鵬:“有多少工作是AI完成的,決定了企業未來能跑多快”
周毅是故意的还是不小心?

國內大模型競爭,加速轉向深度應用。
5月20日,京東雲城市大會在上海舉行。會上,京東雲發佈JoyScale AI算力平台、JoyBuild大模型開發計算平台、JoyAgent智能體2.0等九大產品,以及醫療、工業、金融三大垂直行業一體機,助力企業全面重構AI基礎設施,生成企業專屬數字員工,加速邁向深度應用。
京東集團技術委員會主席、京東雲事業部總裁曹鵬表示,“**隨着深度應用加速來臨,數字員工的上崗率將成為衡量一個企業先進性的標準。有多少工作是AI完成的,決定了企業未來能跑多快。**新一代Agent成為深度應用的代表,京東雲JoyAgent2.0正在幫助企業生成專業數字員工。同時,大規模應用爆發,也將推動AI基礎設施邁向標準化,AI Infra1.0已經具備。”

如何讓大模型全面走向企業的深度應用?京東雲提出了三個觀點:
其一,作為最快速部署大模型的方式之一,一體機是嚐鮮企業級AI的最佳路徑。京東雲透露,過去三個月,“開箱即用”的京東雲大模型一體多省市全面鋪開,全國規模化落地突破500台。
其二,深度應用時代全面開啓,智能體是深度應用方面最具代表性的方向。京東雲認為,雖然“超級應用”還有距離,但聚焦企業端的“深度應用”已奔湧而至,正在加速滲透到需要投入大量人力進行重複勞動的場景。隨着大模型及智能體技術的持續升級,行業正加速邁向深度應用階段。
數據顯示,近三個月京東大模型服務調用量爆發式增長,環比提升200%;超1.4萬個智能體在京東內部運行,解決超18%的工作內容,各類大模型應用已深入到京東零售、物流、醫療等細分業務場景,為超50萬商家、超38萬快遞小哥、超5萬副主任以上級別醫生、超2萬採銷運營、超1萬研發提供助力。
京東雲宣佈,成長於京東自身業務系統的JoyAgent 智能體 2.0全新升級, 基於混合代理模型(Mixture-of-Agents,MoA),融合大小型模型的優勢,通過規劃推理構建動態DAG執行引擎,大幅提升任務執行效率。
其三,技術棧迎來全面重構,AI基礎設施將走向標準化。
京東雲認為,隨着大模型應用的深入,以CPU為中心的架構在支持AI原生應用上面臨挑戰,需要以GPU為中心重塑基礎設施;此外,面對激增的推理需求,計算資源持續增加,企業需要思考資源投入產出的問題,都指向需要一套AI Native的基礎設施。
在大模型開發應用方面,JoyBuild支持多類模型的調優開發,內置20餘種開源模型和豐富的數據集,提供100餘種算法和工具鏈。圍繞開源模型蒸餾需求的不斷增加,可以幫助客户根據自身業務特徵,用自有數據進行大模型的蒸餾,快速開發專屬大模型。
京東大模型開發計算技術相關論文被Nature收錄,為國內首次系統性解決開放環境下大模型開發效率難題,這套技術也支撐了JoyBuild應用。此外,JoyBuild推理引擎基於大規模專家並行推理集羣技術,提升高併發下並行度,實現單Token推理成本降低80%。

在計算方面,京東雲發佈全新的JoyScale AI算力平台——以GPU為核心,高效異構計算,強大推理性能。其具備兩大核心優勢:一是算力性能,一是靈活的異構算力管理。
公開資料顯示,JoyScale支持單集羣萬卡調度、全局超10萬卡調度能力,支持跨智算中心橫向擴展,通過軟硬件協同優化,將大模型算力利用率MFU從45%提升至75%。它全面適配十餘家國產算力,支持異構算力統一納管、精細化運維,通過集羣算力池化調度,提升集羣利用率70%。
在存儲方面,雲海AI存儲基於京東全自研的引擎,對AI訓練語料的隨機訪問達到1000萬級,單集羣支持TB級超大帶寬,能有效支持千億級參數AI大模型的訓練。雲海針對性地提供了原生 KV Cache 特性,支持主流推理框架,以存代算的模式顯著提升了推理性能,長文推理成本下降 40%,長文/多輪對話響應延遲降低 60%。
本文系觀察者網獨家稿件,未經授權,不得轉載。