騰訊發表論文介紹AI如何擊敗99.81%《王者榮耀》玩家_風聞
胡侃海-太阳能维修 月亮可更换 星星不闪包退换2019-12-24 15:40
文章來源丨VGTIME
AI 一天的訓練量頂人類不吃不喝不睡練 500 年。
關注人工智能新聞的讀者也許還記得,騰訊在今年 8 月公佈了一個名為「絕悟」的人工智能,能夠在《王者榮耀》 5v5 比賽中擊敗職業戰隊。而在近日,騰訊 AI Lab 和天美工作室聯合發佈了一篇論文,回顧了「絕悟」的技術細節,詳細介紹了「絕悟」是如何擊敗 99.81% 的人類對手的。

研究人員指出,與傳統的棋盤遊戲和雅達利遊戲相比,MOBA 這種即時的策略遊戲需要高度複雜的動作控制,而且其環境也往往更加複雜。
以《王者榮耀》為例,單單是 1v1 的情況下,玩家隨時要面臨 10^600 種可能狀態,以及 10^18000 種可能行動。AI 不僅要學會計劃、攻擊和防禦,還要學會使用技能組合、誘導或欺騙對手,同時還要應對場景中的各種危險,如野怪和防禦塔。

騰訊研究人員的系統對圖像特徵和遊戲狀態信息進行了編碼,令每個單位和敵方目標都轉化為數字形式。該框架在總共 60 萬個處理器核心和 1064 張顯卡(包括英偉達 Tesla P40s 和英偉達 V100s)上運行,處理了 16000 個包含非隱藏的單位屬性和遊戲信息。
訓練一名英雄需要用到 48 塊顯卡和 18000 個處理器核心,以 80000 個樣本每秒的速度進行訓練。系統一天的訓練量,就相當於人類花費 500 年所積累的經驗。

論文的合著者指出,「絕悟」的 Elo 等級分(一個衡量各類對弈活動水平的評價方法)來自於一個計算零和遊戲中玩家相對技能水平的系統,在預料之內隨着訓練而穩步上升。
「絕悟」每 133 毫秒執行一次操作,相當於一個頂級業餘選手的響應時間。根據研究人員的説法,它在 80 小時內變得相對穩定,不到 30 小時就已經能夠擊敗排位前 1% 的《王者榮耀》玩家了。
「絕悟」最早在今年 8 月在吉隆坡舉辦的《王者榮耀》最高規格電競賽事上亮相,當時「絕悟」在比賽特設環節與職業選手的 5v5 對戰中獲勝,而且在同一天的 ChinaJoy 上,也在首日創造了 504 場測試僅輸一場的戰績。
在 ChinaJoy 上,「絕悟」也與五位職業選手進行了對戰。儘管對手都是極強的職業選手,但「絕悟」當時做到了場均 5 殺,而場均死亡次數僅有 1.33。在 ChinaJoy 為期四天的公開挑戰中,「絕悟」與現場玩家的 2100 場比賽中,勝率為 99.81%,AI 控制的 8 名英雄中,有 5 名獲得了 100% 的勝率。
騰訊的研究人員表示,他們計劃在不久的將來把他們的框架和算法都開源,以促進 MOBA 這樣的複雜遊戲的研究。
文章出處丨VB