劉少山:引領具身智能的中樞引擎——粵港澳大灣區具身智能數據產業構想_風聞
大湾区评论-大湾区评论官方账号-事实、洞见、影响。08-28 08:29

摘要**· 2025.08.27**
在具身智能逐步成為全球戰略技術制高點的當下,數據資源正從“訓練材料”躍升為支配產業主導權的核心要素。本文指出,全球已進入具身智能數據基礎設施的戰略窗口期,而粵港澳大灣區憑藉其獨特的產業多樣性、制度彈性與場景密度,具備爭奪全球具身智能數據產業高地的必要條件和現實能力。
然而,多模態數據的結構複雜性也對現有治理模式構成挑戰。為破解當前“集中難通用、垂直難流通”的治理瓶頸,本文提出構建“統一數據底座+行業採集節點+通用標準體系”的新型數據基礎設施,並結合AIRSPEED技術平台和廣東“1+1+N”試點實踐,提供了一條可推廣、可演化的數據治理範式。這一模式不僅回應了當前數據通用性與專用性、集中與效率的結構性矛盾,更有望推動我國在全球具身智能產業中取得制度引領與價值主導的核心地位。
具身智能數據基礎設施
**建設加速,**窗口期已至
具身智能數據產業正在成為全球下一個萬億級制高點。據預測,到具身智能機器人廣泛普及後,全球具身智能數據市場將超過10萬億美元:包括多模態交互數據、任務行為數據、物理場景數據、系統對抗數據等。這些數據不僅是訓練具身智能基礎模型的“燃料”,更是支撐其在真實世界中感知、理解、決策與行動的底座。
正因如此,全球範圍內正在掀起一輪“具身智能數據中心”建設熱潮,各地紛紛搶佔高地,力求在這一戰略資源佈局中佔得先機:在中國,多個前沿城市已經敏鋭察覺到這一窗口期的戰略意義,並展開具身智能數據基礎設施的系統性佈局。2025年,上海發佈《具身智能產業發展實施方案》,提出到2027年形成100個典型應用場景、100家龍頭企業、100款產品的“百百百工程”,並將構建與具身智能應用高度適配的多模態數據採集、共享與驗證體系,明確將數據作為具身智能產業鏈的核心資源納入頂層設計。這一行動標誌着全國首個將“數據基礎設施”納入具身智能系統性部署的城市誕生,具有示範意義。
深圳則在技術平台方面走在前列,由深圳人工智能與機器人研究院推出的“AIRSPEED”多模態數據平台,集成真實場景與仿真系統,構建了一個具備自動標註、跨模態對齊、訓練樣本生成等功能的開源系統。該平台以開放架構服務於不同機器人形態的數據生成與建庫工作,是我國少數可支持具身智能閉環訓練的底層數據基礎設施之一。
北京在高端智力資源與前沿研究能力方面具備優勢,雖尚未以“具身智能數據中心”名義設立專項項目,但海淀區、經開區等區域已開展智能交互數據平台、城市級數字人場景採集系統等先導項目,並通過智源研究院等機構推動多模態數據在大模型與機器人訓練中的基礎作用研究。
在國際方面,特斯拉是具身智能數據運營模式的典型代表,其數百萬輛配備FSD功能的車輛持續上傳高頻感知數據,並通過自研的Dojo超算系統進行大規模模型訓練。雖然這體現了對數據資源的極致重視,但其模式仍以企業自有閉環為主,未能形成共享機制,也未採用聯邦學習等數據治理創新技術。
波士頓動力、日本川崎重工等企業則分別在運動控制與工業機器人數據積累方面有所佈局,但未見構建開放數據中心的報道,全球具身智能數據治理仍處於探索階段。
因此,**當前正處於數據基礎設施構建的戰略窗口期。各地爭相佈局,目標不僅在於儲備數據,更在於主導標準、定義接口、掌握未來智能系統的演化方向。**就如同石油之於工業經濟,具身智能數據正成為智能經濟時代最關鍵的燃料和潤滑劑,誰控制了數據的生產與流通體系,誰就掌握了整個具身智能產業鏈的價值制高點。

波士頓動力採用液壓方案的產品“大狗”
(圖源:波士頓動力)
粵港澳大灣區具備成為
全球具身智能數據中樞的基礎
粵港澳大灣區作為中國經濟活力最強的區域之一,廣東省內部形成了高度多樣化的產業結構,從高端製造、醫療健康、消費電子、家電、汽車,到教育、物流、養老服務等多個具身智能關鍵應用場景全面覆蓋。特別是在人工智能與實體產業深度融合的趨勢下,**廣東各地正呈現出“產業即數據源”的結構性優勢,**為構建多模態、跨場景、跨任務的具身智能數據體系提供了最豐富的土壤。未來,隨着具身智能在各行業中的深度滲透,該區域有望率先建立從數據採集、場景驅動、模型訓練到規則輸出的完整閉環,成為全球具身智能數據產業的制度策源地與技術創新中樞。
深圳是我國科技創新與智能產業最集中的城市之一,其在服務機器人、智能穿戴、醫療器械、消費電子和智能家居等領域形成了完整的產業生態。隨着多家企業在機器人端側感知、交互決策、智能控制方面的不斷突破,深圳已積累海量與人類真實交互相關的數據資源。具身智能的進一步滲透將使這些機器人從“任務執行”走向“情境理解”,大幅提升其在教育、養老、康復、陪伴等高複雜度任務中的應用深度,推動深圳從硬件之都向“數據智能中心”轉型。
廣州在醫療健康、汽車與智慧城市方面具備雄厚基礎。南沙生物島、廣州國際生物醫藥創新區已佈局手術機器人、康復機器人和遠程診療系統,積累了多模態人體行為、語音、生理信號與醫療動作數據。同時,廣汽集團積極推進L4級別自動駕駛與智能座艙,在城市道路、家庭充電、維修保養等場景中部署具身AI代理。未來,具身智能的應用將使醫院和智慧車聯從信息集成走向主動服務,大幅優化醫療資源調度效率與城市出行體驗。
東莞長期定位為“世界工廠”,3C電子、精密製造、家電裝配形成高密度機器人協作網絡。具身智能的引入將使這些系統具備自適應能力,不再依賴靜態路徑規劃或固定動作模板,可根據人類操作行為、產品形態、任務優先級自主調整動作策略,從而推動“柔性製造”向“智能自調度”演進。
中山、佛山則在廚房機器人、家用智能設備與家電領域形成集羣效應。美的、格蘭仕、九陽等企業的產品部署進入全球上億家庭,其設備中日常交互行為(如物體識別、抓取、煮食、整理)正是訓練高魯棒性家用具身智能系統最寶貴的資源。具身智能的嵌入將推動這些設備從“自動化執行”向“語義理解+情緒響應”躍遷,形成新一代兼具情境感知與社交能力的家居智能終端。
惠州作為新興的新能源汽車電子、智能充電樁和儲能系統生產基地,聚焦智能硬件與人機協同運維數據的採集。以比亞迪電子、億緯鋰能等企業為核心的生態,將因具身智能的介入實現能源管理系統的預測性維護、故障自診斷以及與用户行為的適配優化,顯著提升系統穩定性與能效。
江門、肇慶等地在自動化物流系統、電商倉儲機器人與工業配套物流上佈局加深。例如順豐、京東、韻達等已在該地區部署無人搬運車、協作機械臂與智能監控系統,採集的大規模物流路徑、多工位交互、動態協同行為數據是多智能體具身系統不可替代的訓練資產。未來具身智能的滲透將加速人—機—物三者的精準協調,大幅降低物流成本並提升履約效率。
香港作為國際數據規則中心與金融樞紐,不直接生成具身數據,但其制度能力在數據確權、跨境流通、估值定價方面至關重要。香港數碼港和科技園已部署“開放數據平台”和“數據通證試點”,在金融、健康、交通、地產等領域推進數據資產化實驗。具身智能數據作為新興的高維動態資產類型,未來可在香港探索標準化標註、加密脱敏、跨境調用等機制,為大灣區數據價值流動提供製度錨點。

香港數碼港(圖源:界面新聞)
多樣性之利與數據之困:粵港澳大灣區具身智能,數據融合的挑戰與機遇
總體來看,廣東省在具身智能涉及的製造、交通、服務、醫療、家電、智慧城市等多個關鍵領域中具備全國最廣泛的產業分佈和最密集的真實場景資源。然而,廣東也正面臨一項特殊的系統挑戰:如何在龐大產業異構性與數據資產化效率之間取得結構性平衡。目前,廣東各地普遍將“數據中心”建設作為數字經濟發展重點,但主流模式普遍存在結構性偏差:
一方面,一些地區採用“全景歸一”的模式,試圖將多種行業、多類場景的數據統一歸集至一個區域性大數據中心。這種方式雖有利於資源集中管理和算法統一調用,但由於行業差異過大,導致數據標籤體系碎片化、處理流程複雜化,難以針對具體任務進行有效建模,最終反而降低了數據的實際訓練效率與可交易性。
另一方面,也有地區傾向於建設“行業垂直型”的數據中心,例如專注於工業視覺、物流路線、家庭交互或醫療場景的數據倉庫。雖然這樣能對接具體需求、滿足行業應用,但容易造成數據孤島化,即不同中心間的標準不互通、標籤體系不兼容、模型複用性差,難以構建統一底座,也不利於數據流通和市場估值,進一步抑制了數據的價值兑現能力。
這帶來了粵港澳大灣區構建具身智能數據生態的根本性難題:**既要兼顧數據的通用性與專用性,又要平衡標準化與管理效率。**通用性有助於統一模型接口、支撐底層架構擴展,而專用性則決定了任務精度與反饋效率;標準化有利於跨平台流通與資產化定價,而靈活管理則對接實際產業場景、提升採集效率。
更進一步,具身智能所需的數據不僅是結構化表格或靜態圖像,而是涉及時序性強、上下文複雜、帶有行為邏輯的數據流,如連續運動、跨模態反饋、狀態轉移路徑等,遠超傳統數據治理模式所能處理的複雜度。這也意味着廣東若要引領具身智能數據產業標準,必須在採集機制、標籤體系、存儲邏輯、平台接口等多個層級上推進技術與制度並重的創新。
**因此,廣東的挑戰並非“是否建數據中心”,而是如何建構一個既能承載多場景、又支持模塊化、具備高適配性與流通性的具身智能數據基礎設施體系。**唯有如此,才能真正把散落在各地的多模態數據資產化、結構化,併為基礎模型訓練和數據交易提供穩定、高效、可拓展的底座。
廣東具身智能數據,管理模式創新建議
在多模態數據成為具身智能系統核心驅動力的今天,傳統的數據治理模式已難以適應機器人、智能體和複雜人機協作場景下的採集、融合與流通需求。我們建議,粵港澳大灣區應率先構建**“統一底座+行業採集+通用標準”**的具身智能數據治理新體系,為全國提供製度設計和工程實踐的範式支撐。該體系主張以可擴展、高即時性的數據平台為底座,聯通多個行業主導的數據採集節點,建立統一的數據標準與協議體系,實現多源異構數據的結構化治理與高效流通。
**技術實現方面,如下圖,以AIRSPEED為底層核心平台,構建具備分佈式部署能力的數據治理基礎設施。**AIRSPEED具備軟總線架構、事件驅動機制和多模態數據流調度能力,可廣泛部署於邊緣、端側及雲端節點之間,實現機器人視頻流、音頻、觸覺、環境感知等多通道數據的同步採集與清洗。平台支持標準化的數據接入協議與設備驅動層接口,能夠屏蔽設備異構性,降低開發複雜度,並通過模塊化中間件實現語義對齊、任務歸類與動態任務調度,從而為不同場景的下游模型訓練與數據資產化提供高質量數據基礎。

關於AIRSPEED具身智能數據工程的具體描述
(圖源:作者)
**在採集側,應根據行業特徵部署輕量型邊緣採集節點。**這些節點應嵌入製造、醫療、交通、政務等典型場景中,支持本地即時數據預處理、語義標註與隱私保護機制,並通過與AIRSPEED底座的數據接口進行同步上傳。所有數據須經過統一的標籤體系、權限控制與溯源管理進行治理,確保結構一致、來源可查、質量可控。通過引入數據可信度打分機制和模態完整性評估方法,可自動標識可交易的數據單元,並按需生成適配不同模型或使用方的數據子集,提升數據的可用性與經濟價值。
該體系對當前面臨的核心挑戰給出了結構性回應。在“多場景強行統一導致治理失衡”問題上,通過“統一底座+分佈採集”的分層模式實現橫向解耦與縱向協同,提升系統彈性;在“行業數據中心形成孤島”問題上,通過AIRSPEED統一接入協議與標籤體系實現不同行業間數據的語義聯通與跨域融合;在“通用與專用性矛盾”問題上,通過標準接口適配各類場景採集單元,在統一之上構建差異化採集邏輯,實現行業精度與平台通用性的兼顧。
朝着這個方向,廣東省由廣晟集團牽頭,率先推進“1+1+N”具身智能數據治理架構的落地部署。該架構中的**第一個“1”,代表一個統一的數據治理底座,**由省級運營專班統一規劃、調度與支撐,承擔全省數據資源的歸集、處理與治理能力的建設任務,支撐通用標準的實施和跨行業能力的抽象;**第二個“1”是一個專業示範型訓練場,聚焦在關鍵區域或重點行業建立可複製的標準化範式,作為通用平台與場景實際之間的樞紐,確保制度傳導與數據流動的雙向暢通;“N”則代表嵌入多個典型場景的數據採集與應用節點,**分佈在智慧製造、醫療健康、智慧交通、政務服務等領域,與業務流程深度耦合,實現數據的即時採集、語義標註與反饋閉環。整個體系通過制度統一、技術通約與場景協同,既解決了“泛收集、難治理”的數據碎片化問題,又打通了“重採集、輕複用”的流通障礙,提升了數據的標準化程度和可交易價值。
這一制度體系的構建,標誌着數據治理從碎片化、行業自洽向標準化、跨域協同的關鍵轉變。其推廣有望帶來若干實質性改進:一是在制度上明確數據流通路徑與治理責任,提升政策執行的透明度與可操作性;二是在技術上推動數據接口與標註體系的統一,為跨場景的數據融合與模型訓練提供結構化支撐;三是在產業上促進數據資源的規範流通,降低重複採集與存儲的成本,提升數據的複用效率與潛在經濟價值。長遠來看,該制度有望形成可複製、可推廣的具身智能數據治理範式,為大灣區乃至全國具身智能基礎設施和數字要素市場的建設提供製度保障與工程路徑。
結論
**具身智能時代的競爭,本質上是數據體系能力的競爭。**粵港澳大灣區在產業場景、制度基礎與技術儲備方面具備全球領先的綜合條件,完全有能力在這場產業變革中率先建立具有廣泛適配性和可複製性的具身智能數據治理範式。廣東提出的“統一平台+標準接口+場景節點”的模式,不僅是對當前數據治理困境的結構性回應,更是一次面向未來的制度性創新嘗試。抓住這一窗口期,將數據視作真正的基礎設施與戰略資源,有望使大灣區率先構建起全球具身智能產業的數據價值體系,推動我國在智能經濟時代取得標準制定權、規則解釋權與價值分配權的多重領先地位。
本文作者
**劉少山:**現任深圳市人工智能與機器人研究院(AIRS)具身智能中心主任,國家高層次海外人才。
GBA Review 新傳媒
校對 | 詹藴第
排版 | 許梓烽
初審 | 周宇笛
終審 | 馮簫凝