騎車抖腿撓屁股,還會縫葡萄,像人類幼崽一樣的機器人來了
连政guanchazhewanxgun

像人類幼崽一樣,“華為離職天才少年”稚暉君帶着他的新機器人來了。
3月11日,上海智元機器人聯合創始人、B站UP主@稚暉君(彭志輝)突然更新視頻,正式發佈智元雙足智能交互人形機器人“靈犀X2”。據介紹,該機器人搭載情感計算引擎,集齊運動、交互和作業三方面智能。
首先,在運動方面,視頻中的靈犀X2機器人展示出了諸多絕活。它可以踩滑板車、玩平衡車,甚至騎自行車,而這據稱來自智元運控算法層面的突破。

作為一個孩子,X2學習使用各種人類代步工具
稚暉君介紹,X2的運動控制已從傳統模式轉向learning驅動的強化學習,再結合深度強化學習和模仿學習算法優勢,讓X2學會了多種人類的動作。雖訓練過程有波折,但它學會了使用人類代步工具,並持續學習進化,通過數據驅動算法範式解決運動瓶頸。為此,智元還為靈犀X2開發了一套基於Diffusion的生成式動作引擎,這使得機器人不僅四肢發達,頭腦也並不簡單。
而在交互方面,靈犀X2號稱是第一台真正具備複雜交互能力的靈動機器人。除了基於語言大模型發展帶來的溝通技能和機體材質的硬件突破,該機器人還有一個特別引人注意的地方,就是可以人類一樣有呼吸起伏的動態,待機還會時不時扭頭觀察周圍,如同人類幼崽一樣可愛。稚暉君稱,在語音和視覺之外,智元已經把動作模態也集成到了模型當中,因此才讓X2有了生命感。

靈犀X2會閒着沒事抖腿,走路會撓屁股…
“它會有呼吸的韻律,會有跟人類一樣的好奇心和注意力機制,有很多可愛的小動作,也有他自己的肢體語言”。稚暉君認為,真正的交互變革永遠是以理解人性為座標系,未來的機器人還將會擁有更多情緒表達的能力。
這裏需要注意的是,稚暉君稱目前正在嘗試在人機交互方面引入一些全新的體驗,比如遠程裸眼3D交流。而根據視頻顯示,引入的裸眼3D指的是機器人頭部顯示技術,可以實現不建立物理層面的實物模型,僅通過顯示就可以從不同角度看到機器人的擬人臉部細節。但從觀感上,着實有點恐怖谷效應。另外,該機器人暫時使用了稚暉君本人聲源,即一名成年男性聲音進行對話交流,這與童趣可愛倒相去甚遠。

裸眼3D技術在機器人外觀定製方面提供了一個選擇,但…
靈犀X2動作靈巧,還具備高度交互功能能提供情緒價值,但並非只能做人類的趣味夥伴,它在實際作業方面也是頗有建樹。稚暉君稱,其終極期待是希望機器人能夠成為構建社會生產力的重要分母。
視頻中,靈犀X2展示了收納的能力,還重現了三年前稚暉君用機械臂“縫葡萄”的神技。通常情況下,良好的縫合是外科手術成功的關鍵,而葡萄的果肉脆弱,果皮薄的不到一毫米,如何縫葡萄一直是許多外科醫生們修煉技術的項目之一。

靈犀X2展示縫葡萄。2021年10月,稚暉君曾因使用機械臂縫葡萄成功破圈,當時他還沒有離開華為自主創業。
稚暉君表示,在過去一年裏,智元已經初步找到了通往泛化作業智能的路徑。基於這些成果,最終將操作智能的能力也遷移到了X2上。X2的本體支持很好的柔性阻抗控制,因此可以裝配包括靈巧手在內的各種末端,當然也具備精細操作的能力。
“最終,我們希望機器人的生產力價值能夠外溢到日常生活,讓機器人的‘吉祥三寶’成為現實,也就是所謂的保安、保姆和保潔”,稚暉君説。
本文系觀察者網獨家稿件,未經授權,不得轉載。