新技能get!人形機器人學會連續後空翻統共需幾步?揭秘
上個月,人形機器人做前空翻的視頻上了熱搜,一台人形機器人以矯健身姿完成了一個乾淨利落的前空翻,落地時甚至比許多人類運動員還要穩。

這兩天,人形機器人的技能又提升了。北京一家機器人研發團隊,對外展示了可以連續後空翻的人形機器人。
*總枱央視記者 張春玲:*機器人又迭代了!我身旁個子比較矮小,只有1米3的人形機器人,它剛剛實現了多個連續後空翻的高難度動作,它的名字叫N2。

*團隊技術負責人 姜哲源:*後空翻相比前空翻難的地方在於人一般後腳掌比前腳掌要短,後空翻的時候順着慣性更容易往後倒,後腳掌短的話更容易掀過去,前空翻的話前腳更長,更不容易被掀過去。因此後空翻相比起來難度會稍微更大一點。

為了實現機器人後空翻的穩定性,團隊在硬件結構上進行了創新設計。他們儘可能將重量較大的關節向胯部集中,從而讓機器人在翻轉過程中使的力氣最小。同時,他們採用了功率更為強勁的電機以及更為輕的材料,讓機器人具有更大的爆發力。
三個禮拜學會後空翻
機器人如何做到?
雖然後空翻的動作難度大,但是記者在採訪中瞭解到,機器人團隊僅用了三週,就讓機器人學會了這個特殊技能。
問題來了
讓機器人學會後空翻
如何做到?
需要幾步?

1.首先,團隊在數字世界中,通過一系列動力學計算優化,得到一個翻跟頭的最優軌跡。
2.隨後,他們在虛擬仿真中,通過強化學習的方法,讓成百上千的機器人模仿這個翻跟頭的最優軌跡,不斷試錯。
3.由於後空翻是一個相對較難的動作,團隊還在訓練中加入了一種課程學習的方法,讓機器人像人去上課一樣,從易到難,一點點完成精準的軌跡復刻。
4.隨後,再將訓練好的算法遷移到機器人本體上,通過不斷的反覆測試,在仿真世界和機器人真機裏不斷進行系統優化,讓真實的機器人也能具備復刻後空翻的能力。

*團隊算法工程師 李勝濤:*我們通過給它一些關節角度的跟蹤獎勵,如果它跳得高了或者矮了,我們會給他一些懲罰,通過這樣一套方法,然後讓它不斷去貼合專家數據。

專家介紹,不論是爬台階、還是後空翻,甚至做出一些更加高難度的動作,最近機器人的動作技能變強的“武林秘籍”,離不開一個叫做“強化學習”的人工智能學習範式。它可以讓機器人在未知的數字世界裏,通過給機器人一個標準,讓它像人類一樣“試錯成長。”讓機器人通過“試錯”和“懲罰”自主進化。

*北京人形機器人創新中心首席技術官 唐劍:*強化學習有一個很大的問題,就是訓練很難,如果它是個小白,讓機器人在真實環境訓練很可能把機器人撞壞,因為它經常會做出一些錯誤的操作,會失敗。要在虛擬環境裏訓練,虛擬環境和真實環境可能又有誤差。