工業場景是具身智能極具潛力的大市場?對話智元機器人姚卯青
胡祥熙

2025年10月16日,智元機器人舉行線上直播發佈會,正式發佈新一代工業級交互式具身作業機器人智元精靈G2。
據官方介紹,精靈G2以工業標準打造,搭載高性能運動關節、高精度力矩傳感器,集成空間感知系統,支持快速學習部署,擁有多模態語音交互能力,具備工業、物流、導覽等多場景通用能力。
據悉,精靈G2目前已獲來自均勝電子、龍旗科技等企業的數億元訂單,並同步開啓首批商用交付,在汽車零部件製造、消費電子精密裝配等場景中進行應用落地。
同時,在精靈G2發佈當天,智元機器人合夥人、高級副總裁、具身業務部總裁姚卯青也與觀察者網等一眾媒體展開了一場對話,總的來看,本次對話中的大多問題聚焦在商業化上,並回答了此前外界對智元及具身智能行業的質疑。
從觀點上看,姚卯青認為,工業場景是“極具潛力的大市場”,機器人應先落地室內簡單場景,靠真機數據驅動迭代,佈局工業與海外市場,重視落地實效與ROI。
相關資料顯示,姚卯青畢業於清華大學電子工程系,曾在Waymo、蔚來汽車等智駕部門擔任重要職務,更是見證了智駕行業的商業化落地過程。2024年,看好具身智能的他加入智元,擔任具身研究院執行院長,負責AI技術開發及軟件研發工作。

姚卯青個人簡介 智元官方
據介紹,精靈G2的前置系列,精靈G1已於2023年11月發佈,精靈G2繼承了G1的生態優勢,圍繞G1落地之後,在實際的部署過程中發現的侷限性所做的優化與調整,以“工業標準打造+多場景適配”為核心設計理念,在硬件配置與智能系統上實現全面升級。
現場也舉出了設計上的相關案例,比如機械臂使用的力控方案,每個單關節都有力矩傳感可以去做阻斷控制,這一升級應對的就是工業裏面一些插接類、需要柔性控制的場景。
事實上,針對擬人化這一行業方向,姚卯青表示,智元團隊的判斷是,人形機器人將更廣泛地融入人類生產與生活場景。
這一判斷也體現在產品中。
資料顯示,精靈G2搭載的高性能運動關節與高精度力矩傳感器,結合全球首款十字腕力控臂,能賦予機器人擬人化的靈活作業能力。具體來説,通過全臂扭矩傳感器與柔順控制算法,精靈G2可感知外界細微力變化並動態調整響應,現場演示中甚至能用生雞蛋推動機械臂而保持蛋殼完好,體現了其精準的力控精度。

機器人正在推雞蛋
據悉,此前,機器人使用的更多會像是協作臂的SRS的構型(一種機械臂關節結構)。而智元在精靈G2的腕部第六,第七關節採用的設計則能更像人類:團隊在腕部採用的“十字腕”關節有兩個自由度,是垂直正交在一起的,可以更靈活地進入狹小空間。
在超市上貨等場景中,貨架與貨架之間的距離很小,每一層之間的空間也很有限,那麼一個短且靈活的手腕,就可以快速地夠到每一層的空間。
精靈G2的擬人化設計,除了手腕之外,還包括可旋轉腰部與可摺疊下肢:腰部能夠前後彎腰、左右搖擺,主要面向導覽講解等場景;下肢則針對機器人運輸場景設計,可摺疊的特性使其更便於安裝、包裝和運輸。
現場還透露,相關設計已獲得對應客户的認可與肯定。
目前,在具身智能行業中,圍繞機器人的落地方向,業內爭論不休,分歧相當明顯。
整體來看,有一派堅持“工業優先”,以美的、特斯拉等廠商為代表,認定工業場景的落地是第一選擇,並強調其ROI(投資回報率)清晰;另一派則主張以場景細分為核心,認為輪式、四足或情感陪護等針對特定場景的形態,能更快實現商業化。
對於種種爭論,姚卯青也從個人角度分享了對於機器人行業落地路徑的思考。
他表示,縱觀行業,從場景應用來看,全尺寸人形機器人用於高負載、持續續航、高節拍的作業,目前概念性成分更多。
數月前,雙足機器人在車廠搬箱子等場景的應用被熱議,但如果真正實地開展行業調研、瞭解客户需求就會發現,這其實是不太合適的方案,在續航、穩定性、速度等方面,目前的機器人都難以勝任工廠的高強度作業要求。
其次,室外場景對當前的人形機器人而言也頗具挑戰。
從IP防護等級(一種電氣設備安全防護的評判標準)來看,它們大多無法滿足防塵、防水的需求,很難勝任室外環境;不過像高防護等級的四足機器人,用於巡檢、巡邏等場景是可行的。
人形機器人更適合先在室內環境、任務明確的場景中更快實現部署。如果任務過於複雜、流程冗長繁瑣,中間可能出現差錯,還需要進行復雜規劃、重啓等操作,以當前的技術成熟度來看,這類場景還未到真正落地的階段。
所以,從簡單、固定的需求入手推進,會更為切合實際。
在選定需求的基礎上,具體到智元本身的戰略,姚卯青表示,從可行性上看,首先,工業場景是極具潛力的非常大的市場,儘管大眾印象中工業自動化率已較高,但現實是仍有大量產業工人在崗,且諸多崗位面臨用工量不足、人員穩定性差等挑戰,這為機器人部署創造了諸多機會。正如此前訪談所提,工廠環境相對可控、任務明確,更利於機器人落地應用。
除此之外,其他場景也存在廣闊機遇:例如安檢、巡檢等服務類場景,以及機房等需機器人自主執行與遠程操控相結合的“巡檢+操作”類場景;同時,展廳講解接待、展館導覽等偏向人機交互的文娛類場景,目前也已接近落地狀態。
據介紹,在商業化探索中,智元並非隨機對接客户,而是會深入評估場景價值與技術匹配度、成熟度,選定合作場景主要基於工站是否與當前技術匹配度和成熟度適配、合作客户及合作伙伴是否對新技術抱有接納熱情、場景本身是否具備規模化複製的商業化潛力三點核心考量。
當前,智元旗下產品主要圍繞科研、教育,部分交互服務以及工業作業領域展開,每個領域都存在相對大額的客户訂單,較為均衡。

智元旗下精靈系列產品
海外也是智元高度重視的市場:一方面,海外的用工成本、用工難度、人員管理複雜度及穩定性挑戰,均高於中國;另一方面,不少發達國家面臨老齡化加劇、出生率低迷的問題,這嚴重影響了其勞動人口基數。
因此,這些海外市場對相關產品的需求明確,且整體定價空間與最終能實現的利潤率都較為可觀。
基於此,智元今年已啓動全球市場佈局:一是正在推進全球經銷網絡的建設;二是在全球主要市場,聯合當地合作伙伴開展產品的聯合設計、研發、生產與銷售,通過本地化運作,更快、更好地理解並滲透當地市場。
對於明年的計劃,姚卯青透露,公司期望海外市場收入佔比能達到整體收入的30%甚至更高。
值得注意的是,精靈G2機器人專注於工業場景,而在工業場景中,非標自動化的技術方向一直受到行業關注。所謂非控自動化,就是指根據客户的特定需求進行定製化設計、開發和生產的自動化形態。
目前,非標自動化存在兩個核心難點:首先,仍有大量工序未通過非標自動化解決,對人工的依賴度依然很高。
其次是,自動化產線的投入成本高,且複用性差,如果代工廠需要更換生產的產品品類,原有產線基本無法適配,只能重新搭建新線,這對於品類較多的代工廠而言,不僅代價高昂,部署週期也很長。

自動化產線內部 視頻截圖
因此,智元推出人形機器人,就是希望它能像人類員工一樣靈活接入產線,而非像傳統自動化方案那樣是定製化適配。
智元人性機器人的核心優勢在於其具備通用具身智能:更換生產產品時,無需更換硬件設備,只需像培訓人類員工一樣進行短暫培訓,就能讓它適配新的工作內容,避免了原有投資的浪費。
此外,人形機器人並非要平替或替代傳統機械臂,對於那些已經能通過自動化方案高效解決的工序,無需再做改造。
目前來看,智元的產品更多是和人類員工對比ROI(投資回報率),同時彌補傳統機械臂不可複用的短板,為多品類生產的代工廠提供更具性價比的解決方案。
精靈G2的單台定價在50萬-60萬元之間,介於高端協作機器人與重型工業機器人之間。雖然初期採購成本較高,但官方表示,考慮到人力成本、福利、以及人員流動性等因素,機器人有望在2-3年內收回成本。
在某些特定行業,當前面臨的痛點是人員穩定性與用工難題。
消費電子產線的工作場景較為特殊,工人需在固定時間點重複同一勞動數百遍,休息時間也有嚴格限制,整體工作枯燥甚至壓抑,人員被高度機械化要求。

電子廠內部 視頻截圖
這種高強度、重複性的工作模式,使得年輕工人難以長期堅持,人員流動性極大。而對於消費電子這類需要大批量出貨的行業而言,人員的頻繁流動,既影響產品質量的一致性,也會干擾產能的穩定性。
姚卯青認為,機器人完全可以解決這一問題,所有機器人共享統一程序,不僅沒有情緒波動,也不會出現跳槽等情況,能夠持續穩定地執行工作,從而有效保障產能與產品品質的雙重一致性。
值得一提的是,自動駕駛算法與人形機器人的具身智能技術路徑高度重合,許多人認為,自動駕駛算法的經驗可以完全複用到具身智能行業中來。
當前自動駕駛領域的新概念包括VLA(向量邏輯架構)和世界模型等,客觀上看,它們和車輛上實際部署、用户真正在使用的系統關聯度其實不高。
這些技術可能僅在一些輔助環節中偶爾被觸發使用,而在即時執行的核心繫統環節,依然以原有方案為主。畢竟受限於即時性要求和算力瓶頸,VLA與世界模型暫時難以應用到即時執行場景中,這一點也可以通過行業調研去證實。
姚卯青認為,具體到機器人領域,肯定還是要循序漸進,不能急於求成。
具體來説,首先需要在可控性強、相對簡單的單一作業環境中,通過多種技術的融合,實現快速應用與落地,真正到真實的客户現場去證明自己,而不是僅僅頻繁發佈相關成果。過去有不少公司熱衷於這類發佈,但最終沒有拿出真正落地的案例,這樣的情況並不少見。
所以,他表示,智元更看重實際效果:發佈最新成果固然重要,但能讓這些成果真正落地到客户現場,轉化為訂單、形成收入,才是最有力的證明。
總的來看,姚卯青表示,機器人要發展,還是需要一個從本體到數據、算法、應用,再回歸到本體的飛輪去迭代。
這其實也是他一直以來想要表達的觀點,在此前舉辦的2025世界機器人大會上,他曾在公開演講中對這一概念進行了解釋,原話如下:
首先,你需要一個優秀的機器人本體,就像人類需要強健的體魄才能完成多種多樣的任務。有了機器人好的本體,才能生產出穩定、一致性強且高質量的數據。對於人工智能大模型,無論是語言模型還是物理智能,數據質量決定了模型的上限。我們經常講“garbagein,garbageout”,只有高質量的數據才能有優秀的智能體。髒數據對模型訓練是有害的。

姚卯青在發表講話
有了海量、優質的數據之後,這些算法也必須圍繞實際應用場景進行落地試錯,而不是憑空想象。我們常説“人工智能通用”是一個美好的願景,但不能脱離實際去思考,必須結合場景。最終,在場景中的摸爬滾打(更多時候可能是慘痛的教訓),會為本體設計、數據採集方法論以及大模型架構思考帶來新的指引,讓這個“飛輪”進入新的迭代。
活動中,他也在繼續闡述這一觀點,他提到,目前,在數據應用方面,真機數據依然佔絕對主導,佔比在90%以上,這一點和自動駕駛領域比較相似。
事實上,無論是實際落地的自動駕駛車企,還是相關供應商的方案,基本都以98%、99%以上的真實數據為核心,僅搭配少量仿真數據來覆蓋一些極端邊緣場景(corner case)。對於機器人而言,用於提升環境泛化性的仿真數據,佔比可能也在10%以內。
對於行業來説,現在最重要的,就是能夠讓機器人儘可能多的進入真實場景,然後在真實場景中獲取高質量的數據,他認為,這是對機器人公司當前選擇深耕的技術路徑來説最關鍵的一步。
而真機數據的獲取,其實也就是智元一直在強調的迭代飛輪。
儘管智元目前已經對行業落地與ROI有着清晰的規劃,但當下具身智能領域仍有諸多疑問待解。
一方面,今年不少具身公司雖手握訂單,但真正能算清賬目、切實解決生產生活核心需求的落地場景並不多見,一年之內,具身智能究竟能在哪些場景實現規模化“真落地”?智元G2的訂單又將在汽車零部件製造、消費電子精密裝配等場景中攻克哪些具體痛點?這些細節仍需市場給出答案。
另一方面,工業場景的成本賬始終繞不開,精靈G2單台採購價高達50萬-60萬元,加之後續工程師維護等費用,官方所説的2-3年收回成本,是否真的已充分考量過了不同工廠的產能需求、產線適配調整成本以及機器人的實際故障率等因素?其真實ROI又能否如預期般達成?
這些問題也都還需要更多來自一線生產的實際數據來佐證,畢竟,商業化的最終檢驗標準,永遠是市場的真實反饋與可持續的盈利模式。