王凡、劉少山：中國如何引領全球具身智能？DeepSeek的戰略啓示｜AI觀察_風聞

大湾区评论-大湾区评论官方账号-事实、洞见、影响。9小时前

2025-02-12

　　編者按**· 2024.02.10**

　　在人工智能領域的迅猛發展浪潮中，一個名為DeepSeek的新興AI大模型應用異軍突起，以超乎想象的速度躍居全球科技舞台的中心。在極短的時間內，其每日活躍用户數量便超越了先前的熱門平台ChatGPT，並在此後的日子裏持續激增，成功觸及2000萬日活躍用户的里程碑，彰顯了驚人的成長動能。

　　這一非凡成就不僅令OpenAI與NVIDIA等業界巨頭深感驚訝，同時也激起了國內AI企業的熱烈反響。阿里雲、騰訊雲等國內科技領軍企業迅速表態，宣佈對DeepSeek提供支持，此舉標誌着中國AI企業在全球範圍內的競爭力邁上了一個嶄新的台階。

　　AI大模型應用Deepseek（圖源：經濟參政報）

　　本文通過借鑑DeepSeek的發展經驗，探討中國如何構建自主創新、開源、可落地的具身智能技術路線，並引領全球發展。DeepSeek通過自主創新和開源，不僅提升了中國在AI領域的技術獨立性，也推動了產業升級，增強了中國在國際AI競爭中的發展信心。**沿着這一思路，未來我國具身智能的發展需要具備幾個關鍵特徵：開源、可落地、適應多個應用場景，並能夠成為國際標準的基礎模型。**最近發佈的具身智能開源項目OmniRL突破了上下文強化學習的上限，展示了上下文強化學習這一技術路線的可行性。作為開源項目，OmniRL展現了可賦能多個產業的巨大潛力。與DeepSeek類似，OmniRL為中國在全球具身智能標準的制定中提供了技術支持，幫助中國在國際AI競爭中佔據有利位置。

　　DeepSeek的突破

　　對具身智能的啓示

　　最近，DeepSeek的橫空出世讓人們看到了中國在通用人工智能（AGI）領域突破技術壁壘、擺脱國際依賴、構建本土生態的巨大潛力。作為一家專注於AGI研發的公司，DeepSeek在自然語言的複雜推理訓練上取得關鍵性突破，打破了長期以來西方科技巨頭在大模型領域的壟斷格局。DeepSeek的成功不僅推動了中國AI產業的自主創新，還在國家安全、國際競爭、數據主權等方面提供了戰略支撐，使中國在全球AI競賽中佔據了重要地位。

　　然而，DeepSeek的變革侷限於語言智能領域，人工智能的終極目標不僅僅是處理文本、生成語言，而是具備理解、推理、決策和執行的能力，能夠在複雜的物理世界中自主學習並適應變化。**真正的通用智能需要超越語言模型，邁向具身智能（Embodied AI）。具身智能不僅需要理解世界，還要能夠在物理世界中感知、決策並行動，具備自適應能力，在不斷變化的環境中自主學習。**如何構建具備通用學習能力的具身智能，將成為下一代人工智能發展的關鍵。

　　DeepSeek：

　　推動中國AGI領域自主創新

　　DeepSeek的崛起代表了中國在大語言模型領域的一次重要突破。它不僅在技術層面挑戰了國際科技巨頭，也在戰略層面打破了中國對西方技術的依賴。DeepSeek推出的大模型（如DeepSeek-R1）在自然語言的複雜推理中展現了卓越的性能，特別是在中文語境下，部分表現甚至優於國際競品。這一技術突破標誌着中國在AGI領域的崛起，打破了過去在關鍵技術領域的依賴局面。

　　DeepSeek在產業升級方面也作出了重要貢獻。通過自主研發底層框架和訓練方法，DeepSeek不僅降低了中國在人工智能技術上的外部依賴，還推動了中國AI產業的全面升級。現在DeepSeek的技術已經深度滲透到金融、醫療、教育、製造等多個行業，賦能這些行業的數字化轉型並提升效率。以金融領域為例，DeepSeek的模型在金融風控中提供了更精準的數據分析，幫助企業更好地預測風險並做出決策。

　　在國際競爭中，DeepSeek增強了中國在全球AI話語權爭奪中的籌碼。隨着中國在人工智能領域的崛起，DeepSeek讓中國能夠與美歐等科技大國平起平坐。**通過技術輸出、開源模型等方式，**DeepSeek為中國爭取到了在AI倫理、安全等領域的更多話語權，逐步扭轉了國際AI標準長期由西方主導的局面。

　　2024世界人工智能大會暨人工智能全球治理高級別會議在上海開幕（圖源：新華社）

　　具身智能：人工智能

　　從虛擬世界****走向物理世界

　　儘管DeepSeek在語言智能領域取得了突破，但人工智能的終極目標遠不止於此。具身智能是下一階段發展的關鍵，它的目標是讓人工智能不僅侷限於基於共性知識的信息處理和語言推理，還能夠像人類一樣感知和適應陌生環境，理解新任務，並做出自主決策。具身智能的挑戰在於如何讓AI具備理解、感知、推理、決策和執行的能力，同時能夠在複雜、多變和非共性的物理環境中自主學習並適應新的任務。

　　例如，工業機器人不僅需要理解不斷調整的生產任務，還需要在變化環境中持續改進技能；自動駕駛系統不僅要處理一些常識範圍內的問題，還需要處理長尾的，超越共性知識的複雜突發問題,這也正是目前自動駕駛落地最大瓶頸之一。因此，具身智能要求AI系統具備比語言模型更高的複雜度，包括本體異構、長時記憶、即時決策和即時自主學習。當前的強化學習方法雖然在多個領域取得了成功，但在具身智能的實現過程中仍然面臨許多挑戰。傳統強化學習方法依賴大量的訓練數據，並且通常只能在固定任務環境下進行學習，缺乏對未知任務的泛化能力。同時，傳統模型往往依賴梯度優化，導致它們在任務切換時容易發生“災難性遺忘”，無法像人類一樣進行終身學習。要突破具身智能的瓶頸，必須構建出既能適應當前任務又能在新環境中進行自我進化的智能體。

　　上下文強化學習：

　　具身智能的發展方向

　　隨着具身智能的不斷發展，上下文強化學習（In-Context Reinforcement Learning, ICRL）為這一領域提供了新的研究方向。傳統的強化學習方法通常依賴於特定環境中訓練好的策略，這些策略對於任務和環境變化的適應能力較差，限制了智能體的泛化能力。在面對新任務或變化環境時，傳統強化學習方法往往需要重新進行大量訓練，而不能像人類一樣快速適應。

　　上下文強化學習正是為了解決這一問題。ICRL通過結合上下文信息（如環境的動態變化或外部輸入）來調整學習策略，使得智能體能夠更加靈活地應對任務變化和環境的不確定性。這種方法不僅可以在已知環境中優化策略，還能在新的、未知的環境中迅速調整和學習，而無需從頭開始訓練。在具身智能的背景下，上下文強化學習能夠幫助智能體在多樣的物理環境中做出適應性決策，增強了智能體的靈活性和自主學習能力。

　　智能素描設備，該設備可通過現場拍攝畫出素描圖（圖源：新華社）

　　OmniRL進一步突破了上下文強化學習效果和泛化能力的上限。 OmniRL基於馬爾可夫決策鏈假設生成產生了百萬級別的環境和任務，以及百億時間步的強化學習過程數據。利用大規模元訓練（Meta-training）方法，OmniRL使智能體不再只針對特定任務或一類任務，而是學會在廣泛任務中“如何學習”的能力，突破了傳統強化學習方法的限制。這使得OmniRL能夠以很好的表現適應完全沒有訓練過的強化學習任務。

　　**OmniRL另外一個核心貢獻是證明了任務多樣性而不是數據量對於智能體學習能力的重要性。**OmniRL證明隨着任務數量增加，模型能夠從掌握任務本身，轉變為掌握更 “如何學習”的能力，這種能力對比前者泛化性更強。同時還證明了，這種自主學習能力，對於上下文長度會提出更高要求，從根源上證明了長序列推理的重要性。為了區分以掌握任務本身為目標的“預訓練”方法，OmniRL凸顯了以“如何學習”為目標而不以掌握具體任務為目標的“元訓練”的潛力。

　　OmniRL採用的大規模高效線性注意力機制，提升了模型在長序列任務中的表現和長期記憶能力，使得智能體能夠像人類一樣在長期交互過程中進行學習，並具備更強的環境適應性。

　　儘管OmniRL在研究領域中展現出較高的潛力，但它仍處於探索階段，尚未實現大規模應用。我們應當保持謹慎態度，認識到具身智能的成熟仍需要克服諸多技術挑戰，特別是在複雜高維繫統、本體異構、即時決策等方面。

　　具身智能的應用前景

　　與行業變革

　　**具身智能的廣泛應用將帶來深刻的行業變革，特別是在智能製造、自動駕駛、智能醫療等領域。**具身智能能夠使工業機器人在生產線自主適應不同任務，提升生產線的柔性化程度，減少對人工干預的依賴。例如，在自動駕駛領域，OmniRL的自主學習能力將有助於系統適應全新的交通規則，陌生的室外和停車場環境，以及完全不同的硬件條件。在智能醫療領域，具身智能可以輔助醫生針對個體病患提供長期跟蹤的，精準的個性化健康管理服務。

　　**此外，具身智能將在教育、物流、農業等多個行業帶來革命性的變革。**它不僅提升了生產力和效率，還能夠改變傳統行業的運作模式，推動產業升級和新經濟模式的形成。通過具身智能的應用，企業能夠實現更加智能的自動化生產，提供更加高效的個性化醫療方案，以及更靈活的城市交通管理。

　　登上蛇年春晚舞台的人形機器人宇樹H1“福兮”（圖源：新華社）

　　政策建議：開源發展、標準化

　　和產業化落地

　　隨着全球對具身智能技術的日益關注，中國在這一領域的加速發展需要政策層面的強力支持。為確保中國在全球AI競爭中的領先地位，政策可以從以下三個方面着手，推動具身智能的技術突破、產業化應用和社會融合。

　　**一是支持開源發展，促進技術創新和全球合作：****開源是加速具身智能技術創新的關鍵。**政府應鼓勵科研機構和企業積極參與具身智能的開源項目，推動核心技術、算法和平台的共享與合作。通過資助開源平台建設和資源共享，政府能促進技術創新、降低研發成本，並增強中國在全球AI開源社區的影響力。

　　**二是制定具身智能標準，確保技術可控性和安全性：****具身智能的快速發展離不開標準化的引導。**政府應主導制定符合中國需求的具身智能技術標準，以涵蓋數據安全、倫理規範和行業應用等方面。這不僅能保證技術的可控性、可靠性和安全性，還能增強中國在國際標準化工作中的話語權，推動全球技術競爭中佔據主動地位。

　　**三是推動具身智能的產業化應用：**政府應通過專項資金支持和税收優惠政策，推動具身智能技術在智能製造、醫療健康、自動駕駛等行業的應用落地。通過設立示範基地和產業園區，加速技術從實驗室到市場的轉化。同時，應鼓勵跨行業合作，推動實際應用的試點和商業化，幫助企業降低技術應用的風險和成本。

　　結論：把握技術機遇，

　　領導未來****的全球AI競爭

　　推動各行業發展的核心驅動力。政策制定者應當高度關注具身智能的發展趨勢，抓住這一戰略機遇，加速技術的進一步突破和產業化應用，確保中國在全球人工智能競賽中的長期領先地位。

　　未來，具身智能的廣泛應用不僅將改變人類的工作和生活方式，還會成為全球科技競爭中的新方向，推動人工智能技術發展進入一個全新的時代。

　　本文作者

　　**王凡：**現任深圳市人工智能與機器人研究院（AIRS）具身智能中心研究員，在人工智能產業和研究方向上有超過15年經驗，曾獲得吳文俊人工智能科技進步獎特等獎。

　　**劉少山：**現任深圳市人工智能與機器人研究院（AIRS）具身智能中心主任，ACM科技政策委員會成員、IEEE國際設備和系統路線圖（IRDS）機器人計算方向主席。研究方向為具身智能、計算系統、科技政策。

　　***免責聲明：**本文所闡述觀點僅代表作者本人立場，不代表大灣區評論或IIA機構立場。

　　***原創聲明：**本文版權歸微信訂閲號“大灣區評論”所有，未經允許任何單位或個人不得轉載、複製或以任何其他方式使用本文部分或全部內容，侵權必究。公眾號授權事宜請直接於文章下方留言，其他授權事宜請聯繫[email protected]。

　　GBA Review 新傳媒

　　校對 | 朱胤霖

　　排版 | 許梓烽

　　初審 | 楊芸淞

　　終審 | 馮簫凝

　　●