智平方亮相WAIC 2025:愛寶多場景多任務演示秀出中國具身智能硬實力
guancha
7月26日,2025世界人工智能大會(WAIC 2025)在上海盛大開幕。作為全球人工智能領域最重要的年度盛會之一,今年的WAIC以“智能時代 同球共濟”為主題,吸引了800多家國內外領先企業參展,帶來了3000餘款智能科技展品。在現場,一片108平米的展台人潮湧動,格外熱鬧,——這是中國具身智能的代表企業智平方(AI² Robotics)的展區。
智平方的通用智能機器人AlphaBot(愛寶)系列無疑是展區的焦點。它憑藉一個硬件形態和一個基座大模型Alpha Brain,在現場真正上演了多場景、多任務的“技能秀”——打冰淇淋/咖啡/飲料、2X2碼垛、打架子鼓。三場看似簡單的演示,不僅將愛寶在生活、工業、娛樂三大場景背後的空間感知、長程柔性、全域全身、快速學習等技術底色展現得淋漓盡致,更是智平方對機器人通用性這一理念的踐行。
觀眾一邊拍攝視頻,一邊驚歎:“這已經不像是一台普通的機器人,而是一個真正的‘智能夥伴’。”

(現場圖片)
打冰淇淋/咖啡/飲料:空間感知與長程柔性的實力秀

在生活服務體驗區,智平方搭建了一個對標特斯拉餐吧的全場景軟飲吧,讓愛寶秒變“全能店員”。現場觀眾可以自由選擇自己喜歡的口味和配料,無論是香醇的咖啡、清甜的冰淇淋,還是特調飲料,愛寶都能精準製作。其中,一杯咖啡或冰淇淋的製作時間大約在1分半到2分鐘,而飲料則更快,1分鐘左右就能完成。
以打冰淇淋為例,當愛寶收到類似“愛寶,我想要一杯冰淇淋”的觀眾需求時,它就會抬起左手手臂,拿起紙杯,放置到冰淇淋出口下方,右手精準地握住冰淇淋機的手柄,緩緩壓下,冰淇淋開始順滑地旋轉落進杯子。等杯子裝滿後,愛寶立即鬆開手柄,將冰淇淋遞給觀眾。整個過程動作行雲流水、毫無頓挫。
其實,這不只是場簡單的機械運動。愛寶依靠智平方自研的全域全身VLA(GOVLA)大模型,能夠迅速完成複雜的空間感知與控制:杯子的位置、手柄的角度、冰淇淋旋轉的高度都在它的掌控之中。而且,它不僅能學會這一台冰淇淋機的操作,還能通過快速學習,迅速適配不同品牌和型號的設備,這種“舉一反三”的能力正是它智能大腦的優勢所在。
更重要的是,愛寶的每個動作不是由單獨指令驅動,而是大模型賦予其長程柔性能力的體現。從識別觀眾的需求開始,它就可以自主規劃,進行拿杯子、按下冰淇淋機手柄、遞冰淇淋等一系列操作,像一位經驗豐富的店員一樣,從容不迫、可靠地完成整套服務流程。
2X2碼垛:“全域全身”的工業硬實力

在工業演示區,愛寶展示了其“全域全身”的碼垛搬箱技能。只見愛寶來來回回,在展區裏準確抓起箱子,將它們穩穩碼放到托盤上。不到60秒,愛寶就能完成一次碼垛,穩定性和效率讓圍觀者連連稱讚。
這背後更是智平方在GOVLA大模型上的突破。愛寶能夠像人類一樣在工廠環境中自由移動,而不是侷限於固定工位,自主規劃最優路徑,靈活搬運不同種類、大小、角度、顏色的箱體。它通過多模態感知精準識別箱體狀態,像熟練工人一樣把垛碼放得整整齊齊。當垛形不規範時,它會智能調整抓取策略;遇到突發狀況也能自動糾錯,確保作業流程持續運行。
相比傳統的工業機器人只能在固定工位完成重複動作,愛寶的優勢在於它的全域行動、全身協同的工作能力。愛寶全身擁有34+自由度,可連續工作6小時,單臂負載最高可達10公斤,作業高度最高可達2.4米。這種穩定性和高效性,使它成為製造業當下在“招工難、用工貴”困境下的理想補充。
打架子鼓:快速學習,實現速度與精準的默契配合

最讓現場觀眾興奮的,莫過於愛寶在娛樂區的架子鼓表演。隨着經典曲目《We Will Rock You》節奏的起伏,愛寶的手臂在鼓面上快速而準確地擊打,每0.375秒就能完成一次敲擊,鼓與鼓之間的切換僅需0.75秒,堪比一個經過專業訓練的鼓手。
愛寶之所以能做到這樣快而準,靠的是融入“異構輸入+異步頻率”創新架構設計的GOVLA大模型。模型架構借鑑了人類的“雙系統”思維模式,且把“雙系統”模塊中的“快系統”嵌入“慢系統”:慢系統負責整體樂曲理解和節奏把控,而快系統則專注於快速、精準的動作執行。它們相互協作,讓愛寶既能“聽懂”鼓譜,又能毫秒級完成複雜的鼓擊動作。
此外,GOVLA大模型的高幀率控制能力(可達200-1000Hz)讓整個演奏過程如絲般順滑,沒有延遲。對愛寶而言,樂譜只是一串數據,它可以通過搭載的大模型快速學習掌握新曲目,未來甚至能挑戰120 BPM以上的快節奏演奏。據介紹,本次曲目的演示,愛寶只學習了大約24小時。
這場“鼓點秀”讓人看到,具身智能不僅能做標準化作業,還能學會需要速度與精準度配合的藝術表現。同時,機器人打架子鼓這一藝術演示,也是智平方探索機器人從實用價值向情緒價值延伸的一種嘗試。
自研具身大模型發揮關鍵力量
三場演示的背後,智平方自主研發的端到端具身大模型Alpha Brain是關鍵。GOVLA作為Alpha Brain的核心技術,不同於傳統機器人分模塊控制的方式,它通過統一的模型架構,將多模態信息整合處理,實現了從感知到動作的“端到端閉環控制”。
GOVLA大模型讓愛寶擁有全域行動和全身協同能力,突破了傳統機器人“固定工位”的侷限,以及從簡單任務到長程複雜任務的推理能力。而且,GOVLA大模型快慢系統融合的創新設計,有效解決了複雜推理與快速行動難以兼得的難題,讓愛寶機器人能夠實現即想即動零延遲。
智平方在VLA技術上的突破並非一日之功。作為中國最早提出並系統性研發端到端VLA技術範式的創企,早在2024年,它與北大等頂尖機構聯合發佈的RoboMamba模型,不僅比Pi的OpenVLA更早公開應用,還在未見任務的泛化能力上顯著超越當時SOTA的Google RT 系列模型。今年聯合頭部高校發佈的FiS-VLA,則進一步提升了機器人在複雜環境中的響應速度和泛化能力。這些成果不僅讓智平方躋身國際前沿,更讓全球看到了中國具身智能的技術厚度。
從展會舞台走向產業落地
WAIC上的三大演示只是愛寶能力的縮影。作為中國具身智能的“產業派”,智平方從不止步於技術展示,而是將核心技術真正投入到高強度的產業場景中。
在汽車製造領域,智平方與東風柳汽的合作是一個標誌性案例。搭載GOVLA大模型的愛寶進駐到東風柳汽的工廠,在上下料、物流轉運、貼標籤、收納保護布等環節中進行應用探索。這標誌着國產具身大模型首次獲得汽車製造全場景驗證,是領先技術獲得頂級工業場景深度打磨的里程碑。
生物科技領域同樣是智平方的重要突破口。今年4月,智平方與華熙生物攜手,正在合作部署愛寶執行無菌車間的物料轉運、智能拆包和視覺檢驗等操作,替代人工在高風險區域的重複性勞動,有效降低交叉污染風險,並通過大模型的快速學習能力適應多變的工藝流程。
在半導體制造中,愛寶已進入吉利科技旗下晶能微電子生產基地,通過超強的跨任務泛化性能,高效執行上下料、產線間物料轉運等任務。今年,智平方也將和晶能微電子一起,推動愛寶在半導體制造場景的大規模使用。
除了工業場景,智平方還將業務拓展到公共服務領域。今年第三季度,愛寶將首次進入國內一線城市的機場,展現其在開放複雜環境下的自主行動和多任務處理能力。
這些落地案例背後,凸顯了智平方一貫的務實精神:不追求噱頭,而是紮根行業需求,通過真實應用不斷打磨機器人性能與可靠性。它用一個又一個驗證場景告訴市場,通用智能機器人並非遙不可及的概念,而是一項能夠切實改變生產方式與服務模式的新質生產力
智平方成立於2023年4月,短短兩年多時間,公司已經成為國際媒體和行業關注的焦點。CNN、CNBC等全球頂級媒體相繼報道其突破性進展,在剛剛結束的第三屆鏈博會上,首次參展的英偉達更是邀請愛寶亮相其核心展區。
智平方創始人兼CEO郭彥東博士曾説:“通用智能機器人會像智能手機和智能汽車一樣,成為人們生活中不可或缺的智能終端。”如今,這一願景正在一步步走進現實。