“阿法星”在“星際爭霸”中比肩頂尖人類玩家
科技日報北京10月30日電 (記者張夢然)著名的人工智能公司英國“深度思維”(DeepMind)最新推出了一款主體增強學習算法“阿法星”(AlphaStar)。目前,這款人工智能程序已進入戰略遊戲《星際爭霸II》前0.2%排名的人類玩家之列。根據英國《自然》雜誌30日發表的一篇論文,該算法代表了機器學習的一大重要成就,經過改造,將有助於解決其他應用領域的複雜問題。
《星際爭霸II》遊戲已經成為人工智能研究領域的一項巨大挑戰。據介紹,這是一款科幻主題的策略遊戲,有全球性的專業比賽,也是全球最賺錢的專業電子競技之一。該遊戲中有三個特徵和能力截然不同的種族,玩家控制其中一個種族,相互對抗。
而在之前的比賽中,即使簡化了遊戲規則,人工編制特定動作序列或依賴超人類的功能(如每分鐘執行上萬次動作),人工智能體也無法與頂尖人類玩家抗衡。
此次,“深度思維”公司奧里奧·維亞爾斯及同事,展現了最新的多主體增強學習算法——“阿法星”。在該算法中,若干深度神經網絡主體相互競爭,生成大量的持續適應性策略和對策。之後,“阿法星”在一系列在線遊戲中與人類玩家比賽,無論玩《星際爭霸II》的哪一個種族,“阿法星”都達到了大師級水平。這標誌着人工智能體首次在沒有簡化遊戲的情況下,在專業電子競技中達到了頂尖人類玩家的水平。
“深度思維”公司2016年憑藉“阿法狗”程序與人類圍棋世界冠軍之戰大獲全勝而成名;其後該程序升級為“阿法元”(AlphaGo Zero),能夠從空白狀態起,不需要任何人類棋譜輸入的條件下自學圍棋;下一代“阿法零”(AlphaZero)則接連擊敗了國際象棋、將棋、圍棋三個世界冠軍級的電腦程序,成了全能棋王。隨後,公司宣佈這一程序不再主攻棋法,而是“投身”醫療、能源以及新材料等領域。
總編輯圈點
在AI領域,“阿法狗”是個囂張的名字,該程序妙手迭出,刷新了不少世界紀錄。但再厲害的AI算法,最終仍要落地於應用。“深度思維”早已宣佈將重心從人機大戰中抽出來,轉而投向能“提供疾病治療方案”的AI、能“降低能源消耗”的AI、能“發明出革命性新材料”的AI……因此,笑傲一個曾被認為AI很難戰勝人類的遊戲,也必然不是“阿法星”的訴求,那只是它甫出茅廬、抓住你眼球的方式罷了,這個多主體增強算法,未來所施展的才華必將超過它的前輩。