具身智能火了,但規模落地還需時間_風聞
洞见新研社-洞见新研社官方账号-专注商业与科技,在没人思考的地方,再深思五分钟。昨天 23:38
作者 | 辰紋來源 | 洞見新研社“人工智能下一個浪潮是具身智能,即能理解、推理並與物理世界互動的智能系統”, 英偉達CEO黃仁勳去年在ITF World 2023半導體大會上的預測正在成為現實。5月份,日本橫濱召開的國際頂級機器人學術會議(ICRA2024)上,人形機器人扎堆亮相。7月份,上海世界人工智能大會(WAIC 2024)展出人形機器人“十八金剛”是整個大會“最靚的仔”。8月份,在北京閉幕的世界機器人大會中,人形機器人成為當之無愧的“C位”主角,官方表示,這是人形機器人數量最多的一屆大會,並且,現場有超過一半的觀眾都集中在人形機器人公司的展台。很顯然,和大模型一樣,作為具身智能最重要的實體形態,人形機器人正在走向人工智能的舞台中央。以上展出的各類機器人“能文能武”,會寫字,會洗衣,做家務更是十項全能;能打詠春,能做拳擊陪練,也能成為貼身保鏢。從場面上看,很熱鬧,但深入內裏,這麼火的具身智能,亦或是人形機器人,距離“憑本事吃飯”還有多遠呢?01 大模型帶火機器人在進行我們的討論之前,首先要明確,什麼是具身智能?根據具身智能的英文翻譯(Embodied artificial intelligence,EAI)可以發現,“本體”和“智能體”是兩個非常重要的構成,具有“感知決策、物理實體、環境交互”的特徵。直白一點的理解就是,具身智能可以感知並理解周圍環境,在物理環境中執行具體任務。事實上,早在60多年前,自動化技術的先驅者歐姆龍公司就提出了“機器能做的事情讓機器去做,人類應該從事富有創造性的活動”的觀點,但終因技術尚未成熟,空有美好想法卻難以落地。從2022年開始,具身智能迎來了新一輪的發展期,背後的核心變量是大模型的發展。8月2日,初創公司Figure AI發佈人形機器人Figure02,在與OpenAI合作開發的AI模型的支持下,Figure02的對話交互更具實時性、常識推理能力也更加到位。很顯然,大模型技術為人形機器人實現更優的感知、決策、交互能力提供了技術基礎,同樣也為機器人實現大腦感知決策,小腦運動控制的泛化性帶來了非常大的想象空間。另外一面,人形機器人的硬件技術方面也有了長足的進步,2023年末特斯拉發佈的Optimus Gen2搭載自研執行器,足部採用鉸鏈式連接並配備力傳感器,使得Gen2的行走速度較Gen1提升30%並具備更好的平衡性。更加重要的是,特斯拉發佈Optimus後,帶動公司股價連續11個交易日收高,馬斯克的身價也在這段期間膨脹了約670億美元,進一步驗證了市場對人形機器人商業化的前景,從而將科技圈的關注焦點又重新拉回到具身智能。這裏主要體現在三個方面。一是全國各國政府在政策層面的引導。其中,中國政策的短期目標在於實現核心零部件的技術突破,長期目標在於豐富產業應用和生態;海外的政策更多集中在前沿技術的攻關以及重要場景的落地等方面。中國人形機器人重要政策梳理 資料來源:各政府網站,中金公司研究部二是下場的玩家多元,且競爭愈發激烈。除了像優必選、波士頓動力、傅里葉智能這類以做本體、硬件見長的老牌機器人公司和一批近期湧現專注機器人產業的初創公司,比如智元機器人、銀河通用機器人、星動紀元、逐際動力等之外,還有兩派玩家。其一是以科大訊飛、百度、騰訊、谷歌等為代表的科技大廠攜帶着感知認知的算法優勢而來;其二則是以小鵬汽車、小米、追覓、特斯拉這類為代表的跨界廠商,這類玩家往往擁有比較確定的應用場景,以及可以共享的產業鏈。三是資本對具身智能賽道的熱情,畢竟真金白銀投出去是為了有更多的回報。據不完全統計,2023年國內有9家人形機器人企業獲得累計超19億元融資,今年上半年,國內有13家人形機器人企業融資總金額超25億元,成立僅一年的銀河通用機器人,在 6 月甚至獲得超7億人民幣天使輪融資,估值達到數十億人民幣,被稱為“年度最大天使輪”。而以“先進製造-機器人”為標籤,截至今年8月初,則發生了135筆融資。02 機器人的手和腳,人類都還沒“想”好雖然行業很熱鬧,但是在研發和應用層面,人形機器人還是有諸多問題待解。首當其衝的就是技術路線的收斂。北航機器人研究所名譽所長,中關村智友研究院院長王田苗在“2024世界機器人大會”期間發表觀點時就表示,“當前人形機器人還面臨兩大難點,一是機器人目前的‘軟’件端,適合機器人的通用大模型和垂直專業模型,還在攻堅階段;此外,靈巧手目前在技術和成本上都有需要攻克的難點。”所謂的“軟件“,指的是將複雜任務拆分為無數個子任務,各種子任務在現實的物理空間中相融合,其中就需要大模型技術的賦能,從而實現人機交互。通俗的説,就是要讓機器人擁有泛化能力,比如,家庭服務機器人,不用主人發號指令,就能主動安排自己的工作,將房屋清掃、做飯炒菜、物品收納等家務能夠按照輕重緩急的順序逐一完成。行業普遍認為,人形機器人在硬件上不存在壁壘,雖然目前不同廠商之間機器人在移動速度、負載能力等機械性能上存在不小的差距,但是這些差距並非不可逾越,時間和成本最終會抹平一切。最終決定人形機器人能力高低的還是以軟件為基礎的泛化能力,只有擁有強大的泛化能力,人形機器人才能適應各種任務場景,才具備真正的“可用性“。由機器人的泛化能力進行延伸,機器人的本體形態,末端執行器的選擇,也就是人形機器人的腳和手的技術方向,行業的技術路線尚未有比較統一的共識。關於機器人的移動能力,行業的主要分歧為雙足和非雙足的區分。如果執着於具身智能所強調的“人形“,雙足是不二之選,可是在當前的技術條件下,雙足機器人的實用性、穩定性和開發成本等方面都要弱於輪式底盤為主的非雙足方案。兩種方案都有各自的簇擁,前者認為,就像L4級自動駕駛一樣,雙足就是人形機器人的最終形態,從長遠來看,雙足的算法研究意義重大;後者認為,從商業化落地的視角來看,非雙足方案的適用性更強,也符合“沿途下蛋“的思維。相於腳的選擇,手指方案的選擇就更多了。有的企業選擇“一步到位“,對照着人類在機器人身上也安上了五根手指,如戴盟機器人的 Sparky 1 配備基於光學觸覺傳感器的五指靈巧手。有的企業則先從二指夾爪、三指手出發,如星塵智能S1的雙機械臂搭配二指夾爪,銀河通用G1採用右夾爪和左吸盤組合,以及 UniX AI 家庭場景機器人 Wanda 的三指手。技術路線之所以會出現百花齊放的現象,很大一個原因就是在沒有形成統一標準之前,廠商們都想自己來定義這項技術。事實上,相比手和腳的選擇,更讓人形機器人廠商們頭疼的是數據的收集問題。提升機器人的“軟件”泛化能力,是需要訓練數據的。自動駕駛採集數據,只需在測試車輛上安裝傳感器就好了,機器人的訓練數據,更多要採集人類的行為數據,這也是説,需要在從事具體工作的人類身上或者工作場景中安裝傳感器,當需要人類參與到數據收集時,這個事情就變得複雜了。智元機器人公佈了公司的數據採集計劃,預計9月底建成一個有100台左右機器人的採樣廠,對應150個工人,其目標是一個工人生產1000條數據/天,將數據採集的效率如何放在一旁先不談,這種數據採集的模式是否可行,還有待後續觀察。03 人形機器人如何賺錢?一個值得關注的細節,目前很多人形機器人企業已經進入到小批量量產階段,部分產品的價格也被廠商們打到了10萬以內。例如,宇樹科技G1人形機器人自5月發佈以來,9.9萬元定價引發熱議。在2024世界機器人大會上,宇樹科技宣佈G1迎來量產版,設計更適應大規模生產。智元機器人合夥人兼營銷服副總裁姜青松在接受媒體採訪時表示,智元雙足人形機器人今年10月份開始量產,後期預計一個月生產100台,今年預計出貨量200台左右,輪式機器人預計出貨100台左右。此外,EX機器人CEO李博陽向媒體透露,公司已實現量產盈利,今年內會有500台左右的生產數量,明年的出貨量將進一步增加。特斯拉方面也透露,明年將小批量生產人形機器人,計劃在工廠部署超千台以輔助工作。好消息很多,可是人形機器人距離真正的商業落地還是很遠。王田苗表示,現階段無論15萬還是10萬或更便宜,主要還是面向科研平台展示,類似於自動駕駛行業中的線控底盤,目前的人形機器人產品更多是行業內的內部消化,同行們買來進行相關研發來用。有行業人士分析表示,對應着自動駕駛的商業機會,具身智能,也就是人形機器人的發展過程中也有着三類機遇。首先是像L4級自動駕駛一樣,機器人本地的開發,瞄準人形機器人的終局提前佔位,只要能夠熬到具身智能時代的真正到來,自然能夠爽吃一把。其次是像自動駕駛在礦山、封閉園區、環衞清掃這樣的特定場景中的應用,人形機器人的場景開發也有不少機會,只是現在階段行業的探索尚未有明確的結果。最後是上下游的產業機會,有時候賣鏟子遠比挖礦更賺錢。這裏的上游包括智算中心的建設、算力芯片和端側模型等方面的關鍵技術;下游則涉及到各種傳感器、關節模組等,類似於自動駕駛中的各種雷達、智能座艙等。對照着以上,人形機器人產業的發展路徑其實已經非常清晰了。雖然目前行業對於人形機器人在智能機器人領域的佔比有不同觀點,樂觀派認為人形機器人的市場份額最高將超過60%。另一部分產業觀察者則認為,人形機器人只解決了一部分需求,而其他類型的機器人,如臂式、輪式、履帶式等機器人的適用場景更加豐富,因而人形機器人只會佔據30%左右的市場份額。真正的市場競爭與坐在辦公室裏的“兵棋推演”還是會有不同,人形機器人的具體形態取決於應用場景和客户需求,取決於客户願意為哪種服務成本和產品功能買單,最終還是要看技術的創新能力和發展程度。來自國際機器人協會預測顯示,2021年至2030年,全球人形機器人市場規模年複合增長率將高達71%。中國電子學會數據則稱,到2030年,我國人形機器人市場規模有望達到約8700億元。