遊戲AI三大難:樣本大、成本高、靈活性差_風聞
竞核-竞核官方账号-电竞游戏媒体2021-06-23 21:42

DeepMind“入侵”安卓遊戲了
繼攻克圍棋、《星際爭霸》後,DeepMind開始瞄準手遊了。
5月初,DeepMind推出 AndroidEnv後,開始密集測試諸多手遊。最新加入體驗挑戰的是安卓版《The Battle of Polytopia》,它由瑞典開發商Midjiwan 製作併發行,是一款回合制文明策略遊戲。
遊戲故事背景設定在一個奇異而又平坦的“方塊”星球。玩家可領導 12 個不同文明中的一個,擴張帝國、研究科技併成為整個星球的統治者來最終取得勝利。
遊戲擁有單人和多人模式,最多可支持 12 名玩家。
目前,Midjiwan 正跟DeepMind合作,將《The Battle of Polytopia》集成到AndroidEnv中,成為後者一項常規任務。
大爆炸,變革性體驗要來了?
“我們發現這款遊戲是一個特別有趣的挑戰,因為它有許多功能,如處理長期規劃、不完善信息、多樣化 UI 元素和非確定性。”DeepMind 評論説。

針對本次合作,Midjiwan 總經理Christian Lövstedt則表示,DeepMind 是人工智能領域巨人般的存在,能擁有這樣強大的合作伙伴,併成為平台一份子,我們感到非常自豪和興奮。
在Polytopia玩家羣體中,不乏資深玩家。融入人工智能後,想必也會給玩家體驗帶來不一樣的變化。
AndroidEnv作為一個AI平台,允許AI代理在遊戲中自定義任務,比如尋找公園的方向、預定航班甚至於獲取最高分。
AI代理主要依據屏幕上顯示的圖像做出決策,它能像人類一樣通過觸摸屏和手勢進行操作。
理論上,AI能夠幫助開發者實現內容快速生成、自動生成劇情,乃至促進NPC智能化和多風化。
以騰訊AI Lab為例。在競技博弈AI方面,騰訊AI Lab推出了絕藝跟覺悟。前者主要涉及棋牌項目中的圍棋和麻將,完成從完全信息博弈到非完全信息博弈的拓展。
後者主要涉及到MOBA類手遊《王者榮耀》及體育類的足球,分別在異構分佈式multi-agent和更多智能體+長配合方面進行探索嘗試。
筆者獲悉,《王者榮耀》項目組一直在嘗試各種新玩法,但效果往往不盡如人意。意外的是,AI人機對戰參與率極高,超過10%的玩家。
這意味着,日活用户達到大幾百萬。官方披露的數據顯示,AI覺悟挑戰共吸引超過數千萬玩家參與。
此外,基於AI對於遊戲理解的專業策略分析和聲音文本的綜合體現,騰訊也推出了王者榮耀虛擬主播。
在美術資源方面,騰訊AI Lab涉及虛擬人和3D動作生成。據悉,內部團隊正在着手嘗試在動作生成方面得到更真實的遊戲表現,使其適配各類動作、地形和突發情況。
機遇與挑戰並存
看似變革性體驗背後,其實需要耗費大量成本。
一位兼具遊戲跟AI背景的資深人士告訴筆者,AI的確可以有效提升遊戲體驗。掣肘在於,樣本大、訓練成本高。
像《王者榮耀》這類大DAU,高流水競技性產品,固然可以一試。對於中型體量產品而言,往往不太划算。
一位創業遊戲公司高層説,小樣本模型效果不錯的話,拿幾千萬嘗試也不是沒有可能。換言之,大樣本模型,讓企業望而卻步。
眼下業界常討論AGI(通用人工智能),可產品靈活性仍是一大難題。
DeepMind遇到成本、靈活性困境,無疑最具代表性。

據估算,AlphaGo整體訓練成本高達3500萬美元,消耗能量足以支持12760個人類大腦在三天內不眠不休地工作。
在備受關注的《星際爭霸》項目上,DeepMind也遭遇了類似難題。
2019年2月28日凌晨,DeepMind旗下游戲AI AlphaStar,以5比0大比分,擊敗了世界上最強大的職業星際爭霸玩家之一。當時它被視為突破人類智力的最後陣地。
通常情況下,訓練AlphaStar需要使用Google v3 TPU,用以支撐數千個《星際爭霸II》協同運行。
AlphaStar共對戰14天,每個代理使用16個TPU。在培訓期間,每個智能體都經歷了長達200年的實時遊戲。
粗略估算下來,訓練成本達到數百萬美元。拋開成本不談,AlphaStar靈活性亦備受質疑。
紐約大學心理學系教授Gary F. Marcus認為,上述方案限制重重。在單一地圖上使用同一“種族”進行對戰時,其成績確實優於人類。
不過一旦在其它地圖使用不同“種族”時,表現就要差很多。要想切換操作風格,必須得從頭開始重新訓練AlphaStar。
簡言之,即系統缺乏足夠的靈活性。這一特性會讓DeepMind訓練成本迅速放大。
數據不會説謊。根據去年年底DeepMind向英國公司註冊局備案提交的最新財務報告。
報告顯示,近三年DeepMind虧損額分別為4.77億英鎊(2019);4.702億英鎊 (2018);3.02億英礡(2017)。
營收方面,2019年DeepMind收入達2.66億英鎊;2018年達到1.03億英鎊;2017年營收為5442萬英鎊。
綜合近三年業績表現,不難發現DeepMind營收確係穩步增長,虧損敞口逐步收小。不過需要指出的是,DeepMind大部分客户依賴於母公司Alphabet旗下關聯公司。
某種程度上,這也説明DeepMind商業化還有非常高的提升空間。AI龍頭企業尚且如此,國內AI遊戲廠商估計也大差不差。
只有有效解決樣本、成本、靈活性等問題,AI遊戲才會真正大爆發。