擴大機器人“朋友圈”後，京東首次闡述具身智能背後的思考

周毅是故意的还是不小心？

2025-07-28

中國人工智能，再一次成為世界焦點。

7月26日—28日，2025世界人工智能大會（WAIC 2025）在上海舉行。今年展覽面積首次突破7萬平方米，吸引800餘家企業參展，集中發佈3000餘項前沿展品，包括40餘款大模型、50餘款AI終端產品、60餘款智能機器人及100餘款“全球首發”或“中國首秀”新品。

智能機器人，再一次成為“燃爆”全場的明星產品。

作為大會的“老朋友”，今年京東帶來了全新升級大模型品牌JoyAI，並全方位展示了京東在多場景的智能化解決方案，助力產業加速走向深度應用。從能高情商交互的人形機器人到企業高定的時尚數字人主播，從重塑企業工作流程的智能體搭子到低門檻、高可用的智能編碼助手，深度應用正在重塑人工智能生產力。

尤其是在今年熱門的機器人賽道上，京東動作頻頻。例如7月21日，京東被曝在智能機器人領域連下三城，完成三傢俱身智能領域頭部企業的投資，包括千尋智能、逐際動力和眾擎機器人等。京東正在不斷加碼，積極投入這一賽道。

“現在每家都有一輛車，以後也許每家都會有一個人形機器人或者其他更多形態的機器人。”在今年大會上，京東集團高級副總裁、京東集團探索研究院副院長何曉冬對觀察者網等媒體表示，具身智能機器人正在從傳統意義上的工業場景，走向陪伴、服務等生活場景，規模上將擴大一兩個數量級，對用户體驗影響也是最大的。

“未來的空間幾乎是無限的。”

具身智能應具備三大核心能力

早在2023年世界人工智能大會期間，何曉冬就在與觀察者網對話時表示，未來通用人工智能有兩個方向要走，一個方向是多模態，大模型必須具有視覺能力，未來甚至可以更進一步延伸向嗅覺、觸覺；另外一個方向是走向具身智能，包括機器人、機械臂、無人車等，讓通用人工智能走向物理世界。

這些趨勢判斷，今天基本都成為了現實。

那麼何為具身智能？

在何曉冬看來，從廣義上來講，智能和物理機器的結合，包括兩足人形、四足狗或其他形態，都屬於具身智能的範疇。但如果要更確切地定義它，那麼具身智能需具備三個核心模塊：

其一是擁有可控制運動的“小腦”，可以在物理世界行動——因為機器的運動能力，非常影響其體驗；其二是智慧的“大腦”，只擁有運動能力的機器仍是單調的，但有了“大腦”以後，它的感知能力、交互能力就會提升很多，可體驗性也會上升不少。

“第三點大家關注的比較少，但是很重要：I/O（輸入/輸出）交互能力。具身智能機器人，它涉及三個體系的交互：機器人、（客觀物理）世界和用户。用户的命令、需求、體驗要能夠讓機器人感受得到，機器人還能給出回饋，這就需要I/O交互能力。它和‘小腦’、‘大腦’共同構成了具身智能的核心模塊。”

在何曉冬看來，未來具身智能的應用場景會非常廣闊。何曉冬指出，以前人們説得比較多的，是具身智能偏工業場景的應用——包括京東自己做物流、倉儲，這些場景應用了很多。現在人們看到具身智能已經開始走入更通用的生活場景，包括人形機器人、機器狗，從工業應用走上了陪伴，家庭服務等領域。

“這塊空間我認為是會比原來大更多的，可能會大一到兩個數量級都不止，對用户體驗也是最直接的。”

“京東非常看好具身智能這個賽道和方向”

這是被曝密集投資機器人企業後，京東首次談論其動作背後的思考。

何曉冬對觀察者網等媒體表示，一方面，大力投資機器人企業是因為“看好這個方向”；另一方面，京東希望跟合作伙伴一起用最快的速度把整個這個行業發展起來——這也是京東提出“附身智能”背後的原因。

“京東對具身智能的觀念是開放的，不侷限在人形機器人，所有在物理世界能夠跟用户交互、還有一定情商智商的機器人，都是京東合作的方向。”何曉冬説，京東有自己的應用場景，包括物流、工業，以及對普通消費者的家庭服務，比如家政、金融。有大量的應用場景是京東想做的。

“我們想通過附身智能這種合作方式，能夠給更多的合作伙伴增加能力，加快整個行業的發展。”

何曉冬透露，京東對具身智能的投入和戰略性認知是長遠的。首先，具身智能是未來一個很重要的賽道，是戰略性的，京東對此有很大的投入；再者，具身智能是京東整個服務生態的一部分，京東整體生態會從中具身智能的發展上受益；最後，京東的視野是開放的，具備“大腦”+“小腦”+“I/O”能力的，都在京東具身智能的範疇之內。

在發展中解決問題，樂觀看待中國具身智能

談到今年WAIC的“機器人熱”，何曉冬表示，公眾對前沿技術的技術的期望是非常高的，所以很容易在世界人工智能大會這樣一個全球性的節點上引爆。

不過他也同時指出，真正的生活和實際應用上，具身智能要走入尋常人家庭，還有很多問題需要解決。

“比如説，我們現在比較關注的是機器人的手部能力。機器人要做服務的話，很多手部的操作必須要解決。雖然手很小，但手的關節很多，關節靈活度要求比腳多很多。我們也能看到：機器人前滾翻、後滾翻各種動作很流暢，但是看自由度難度的話，其難度比不過一隻手。這塊其實是我們要關心的，還有很多工作要做。”

在何曉冬看來，另一個問題在於，大模型現在還沒有充分跟機器人結合。很多人經常談到“空間智能”，讓機器人能夠有感知空間和思考判斷的能力。“比如，我們能不能讓機器人進入房間，看一圈就知道誰在什麼地方？再比如，我讓機器人把桌上的水杯拿過來，他能不能知道我説的是哪個水杯，精準定位？都還有很多問題需要解決。”

不過，何曉冬坦言，他本人對中國具身智能的發展持樂觀態度——任何產業只要開始走入用户以後，特別是C端用户以後，它的迭代速度就會非常快——這正是發生在中國各行各業的事情。

“就像自動駕駛，早期大家有很多討論，到底是應該先做L2還是先做L3？先用模擬數據還是真實數據？最後你看特斯拉先上L2，用上攝像頭，開始大量收集數據。數據上來以後，這兩年技術的進步是非常明顯的。所以我估計機器人可能也會走類似的路徑。”

（發言由現場錄音整理，未經當事人審訂）