谷歌(GOOGL)推出搭載Gemini技術的新型機器人AI模型——彭博社
Julia Love, Davey Alba
Alphabet公司旗下人工智能實驗室推出兩款專注於機器人技術的新模型,將幫助開發者訓練機器人應對陌生場景——這是該領域長期存在的挑戰。
研究部門Google DeepMind週二宣佈將發佈Gemini Robotics,這是其旗艦AI模型的新分支,旨在開發更靈活、更具交互性的機器人。另一款模型Gemini Robotics-ER專攻空間理解能力,將藉助Gemini的推理功能幫助機器人制造商開發新程序。
DeepMind工程師Kanishka Rao在媒體簡報會上表示,通過將Gemini應用於機器人,谷歌正朝着開發能處理多種任務的"通用機器人"邁進。“我們的世界極其混亂、動態且複雜,我認為通用智能機器人需要能夠應對這種混亂。”
延伸閲讀:Meta計劃重金投資AI驅動的人形機器人
硅谷打造與人類能力相當的機器人之夢正重新獲得關注和投資。Meta Platforms公司、特斯拉公司和OpenAI已加強機器人研發工作,初創企業正以天價估值洽談融資。
在週二預先錄製的演示中,谷歌研究人員展示了搭載其技術的機器人如何響應簡單指令。一個站在字母積木前的機器人在訓練師要求拼寫單詞後,拼出了"Ace"。
工程師們還在實驗室裏搭建了一個迷你玩具籃球場。當另一個機器人被要求完成扣籃動作時,它將一個小塑料球壓進了籃筐。
“團隊第一次看到機器人扣籃時非常興奮,“Rao表示,“因為這台機器人從未接觸過任何與籃球相關的事物。它通過Gemini理解了籃球網的外觀和’slam dunk’這個詞的含義,並將這些概念與現實世界中的任務聯繫起來。”
谷歌在機器人領域的發展歷程頗為曲折。十多年前,該公司收購了至少八家機器人公司,旨在聯合創始人拉里·佩奇和謝爾蓋·布林的願景——藉助機器學習開發面向消費者的機器人。經過多年發展,這些努力最終整合到Google X(Alphabet的登月實驗室),並於2021年分拆出Everyday Robots部門,專注於開發執行垃圾分類等日常任務的機器人。約兩年後,Alphabet宣佈作為2023年全面預算削減計劃的一部分,將關閉該部門。
不過Alphabet從未完全退出機器人業務。當時公司表示會將部分技術和團隊整合到現有機器人項目中。如今,該公司似乎正以生成式AI為旗幟重啓這些計劃。
在簡報會上,谷歌強調這項工作處於"早期探索"階段。DeepMind研究科學家Vikas Sindhwani表示,Gemini模型在開發時已具備"對物理環境常識性安全的深刻理解”。他稱谷歌計劃逐步部署這些機器人,初期將與人類保持安全距離,隨着安全性能提升,未來將實現更多互動協作。
谷歌表示將開始與包括Apptronik在內的該領域企業共同探索Gemini的機器人能力,雙方正合作開發人形機器人。其他正在測試其Gemini Robotics-ER模型的合作伙伴還包括Agile Robots和波士頓動力公司——後者於2013年被Alphabet收購,後又被出售給軟銀集團