擴大機器人“朋友圈”後,京東首次闡述具身智能背後的思考
周毅是故意的还是不小心?

中國人工智能,再一次成為世界焦點。
7月26日—28日,2025世界人工智能大會(WAIC 2025)在上海舉行。今年展覽面積首次突破7萬平方米,吸引800餘家企業參展,集中發佈3000餘項前沿展品,包括40餘款大模型、50餘款AI終端產品、60餘款智能機器人及100餘款“全球首發”或“中國首秀”新品。
智能機器人,再一次成為“燃爆”全場的明星產品。
作為大會的“老朋友”,今年京東帶來了全新升級大模型品牌JoyAI,並全方位展示了京東在多場景的智能化解決方案,助力產業加速走向深度應用。從能高情商交互的人形機器人到企業高定的時尚數字人主播,從重塑企業工作流程的智能體搭子到低門檻、高可用的智能編碼助手,深度應用正在重塑人工智能生產力。

尤其是在今年熱門的機器人賽道上,京東動作頻頻。例如7月21日,京東被曝在智能機器人領域連下三城,完成三傢俱身智能領域頭部企業的投資,包括千尋智能、逐際動力和眾擎機器人等。京東正在不斷加碼,積極投入這一賽道。
“現在每家都有一輛車,以後也許每家都會有一個人形機器人或者其他更多形態的機器人。”在今年大會上,京東集團高級副總裁、京東集團探索研究院副院長何曉冬對觀察者網等媒體表示,具身智能機器人正在從傳統意義上的工業場景,走向陪伴、服務等生活場景,規模上將擴大一兩個數量級,對用户體驗影響也是最大的。
“未來的空間幾乎是無限的。”
具身智能應具備三大核心能力
早在2023年世界人工智能大會期間,何曉冬就在與觀察者網對話時表示,未來通用人工智能有兩個方向要走,一個方向是多模態,大模型必須具有視覺能力,未來甚至可以更進一步延伸向嗅覺、觸覺;另外一個方向是走向具身智能,包括機器人、機械臂、無人車等,讓通用人工智能走向物理世界。
這些趨勢判斷,今天基本都成為了現實。
那麼何為具身智能?
在何曉冬看來,從廣義上來講,智能和物理機器的結合,包括兩足人形、四足狗或其他形態,都屬於具身智能的範疇。但如果要更確切地定義它,那麼具身智能需具備三個核心模塊:
其一是擁有可控制運動的“小腦”,可以在物理世界行動——因為機器的運動能力,非常影響其體驗;其二是智慧的“大腦”,只擁有運動能力的機器仍是單調的,但有了“大腦”以後,它的感知能力、交互能力就會提升很多,可體驗性也會上升不少。
“第三點大家關注的比較少,但是很重要:I/O(輸入/輸出)交互能力。具身智能機器人,它涉及三個體系的交互:機器人、(客觀物理)世界和用户。用户的命令、需求、體驗要能夠讓機器人感受得到,機器人還能給出回饋,這就需要I/O交互能力。它和‘小腦’、‘大腦’共同構成了具身智能的核心模塊。”

在何曉冬看來,未來具身智能的應用場景會非常廣闊。何曉冬指出,以前人們説得比較多的,是具身智能偏工業場景的應用——包括京東自己做物流、倉儲,這些場景應用了很多。現在人們看到具身智能已經開始走入更通用的生活場景,包括人形機器人、機器狗,從工業應用走上了陪伴,家庭服務等領域。
“這塊空間我認為是會比原來大更多的,可能會大一到兩個數量級都不止,對用户體驗也是最直接的。”
“京東非常看好具身智能這個賽道和方向”
這是被曝密集投資機器人企業後,京東首次談論其動作背後的思考。
何曉冬對觀察者網等媒體表示,一方面,大力投資機器人企業是因為“看好這個方向”;另一方面,京東希望跟合作伙伴一起用最快的速度把整個這個行業發展起來——這也是京東提出“附身智能”背後的原因。
“京東對具身智能的觀念是開放的,不侷限在人形機器人,所有在物理世界能夠跟用户交互、還有一定情商智商的機器人,都是京東合作的方向。”何曉冬説,京東有自己的應用場景,包括物流、工業,以及對普通消費者的家庭服務,比如家政、金融。有大量的應用場景是京東想做的。

“我們想通過附身智能這種合作方式,能夠給更多的合作伙伴增加能力,加快整個行業的發展。”
何曉冬透露,京東對具身智能的投入和戰略性認知是長遠的。首先,具身智能是未來一個很重要的賽道,是戰略性的,京東對此有很大的投入;再者,具身智能是京東整個服務生態的一部分,京東整體生態會從中具身智能的發展上受益;最後,京東的視野是開放的,具備“大腦”+“小腦”+“I/O”能力的,都在京東具身智能的範疇之內。
在發展中解決問題,樂觀看待中國具身智能
談到今年WAIC的“機器人熱”,何曉冬表示,公眾對前沿技術的技術的期望是非常高的,所以很容易在世界人工智能大會這樣一個全球性的節點上引爆。
不過他也同時指出,真正的生活和實際應用上,具身智能要走入尋常人家庭,還有很多問題需要解決。
“比如説,我們現在比較關注的是機器人的手部能力。機器人要做服務的話,很多手部的操作必須要解決。雖然手很小,但手的關節很多,關節靈活度要求比腳多很多。我們也能看到:機器人前滾翻、後滾翻各種動作很流暢,但是看自由度難度的話,其難度比不過一隻手。這塊其實是我們要關心的,還有很多工作要做。”
在何曉冬看來,另一個問題在於,大模型現在還沒有充分跟機器人結合。很多人經常談到“空間智能”,讓機器人能夠有感知空間和思考判斷的能力。“比如,我們能不能讓機器人進入房間,看一圈就知道誰在什麼地方?再比如,我讓機器人把桌上的水杯拿過來,他能不能知道我説的是哪個水杯,精準定位?都還有很多問題需要解決。”

不過,何曉冬坦言,他本人對中國具身智能的發展持樂觀態度——任何產業只要開始走入用户以後,特別是C端用户以後,它的迭代速度就會非常快——這正是發生在中國各行各業的事情。
“就像自動駕駛,早期大家有很多討論,到底是應該先做L2還是先做L3?先用模擬數據還是真實數據?最後你看特斯拉先上L2,用上攝像頭,開始大量收集數據。數據上來以後,這兩年技術的進步是非常明顯的。所以我估計機器人可能也會走類似的路徑。”
(發言由現場錄音整理,未經當事人審訂)