AI機器人在迷宮遊戲中取得突破性進展,超越了人類-彭博社
Saritha Rai
迷宮遊戲。來源:蘇黎世聯邦理工學院計算機已經在撲克、圍棋和國際象棋等遊戲中戰勝了人類。現在它們可以學習物理技能,以在基本的靈巧遊戲中表現出色。
蘇黎世聯邦理工學院的研究人員創建了一款名為CyberRunner的AI機器人,他們稱其在流行的迷宮遊戲中超越了人類。他們表示,該機器人通過傾斜表面,避開迷宮中的洞,僅用了六個小時就掌握了這個玩具。
蘇黎世聯邦理工學院的研究人員拉斐爾·丹德里亞和托馬斯·比表示,CyberRunner標誌着AI首次在直接的物理應用中擊敗人類。在實驗中,他們的機器人使用兩個旋鈕來操縱遊戲表面,需要精細的動作技能和空間推理。遊戲本身需要實時的戰略思維、快速決策和精準的行動。
這對雙人組在週二發表了一篇學術論文,分享了他們的工作。他們基於最近在一種稱為基於模型的強化學習的領域的進展構建了他們的模型,這是一種機器學習的類型,其中人工智能通過反覆試驗學習如何在動態環境中行為。
“我們將我們的工作放在一個開源平台上,以展示這是可能的,分享如何完成這項工作的細節,並使繼續工作變得廉價,”共同創立了Kiva Systems並將其出售給Amazon.com Inc.的D’Andrea説。“很快將會有成千上萬這樣的人工智能系統進行協作實驗,交流並分享最佳實踐。”
Raffaello D’Andrea來源:ETH Zurich工業機器人幾十年來一直執行重複、精確的製造任務,但像CyberRunner展示的那樣即時調整是下一個層次,研究人員表示。該系統可以思考、學習並在物理任務上自我發展,這在以前被認為只能通過人類智能實現。
CyberRunner通過攝像頭俯視迷宮的方式通過經驗進行學習。在這個過程中,它發現了一些“作弊”的意外方式,通過跳過迷宮的某些部分。研究人員不得不介入並明確指示它不要走捷徑。
這對雙人組的開源項目現在可以在他們的網站上獲得。以200美元的價格,它可以幫助用户使用CyberRunner平台協調大規模實驗。
“這不是一個需要花費大量資金的定製平台,” D’Andrea説道。“令人興奮的是,我們是在一個對所有人開放並且幾乎沒有成本的平台上進行工作的。”