十幾位高手慘敗於AI選手:人類失守撲克牌最後一塊陣地_風聞
Science_北京-不惧过往,不畏将来!2019-07-16 14:17
人工智能已經跨過了掌握撲克的最後一個里程碑——六人德州撲克。
人工智能已經跨過了掌握撲克的最後一個里程碑——六人德州撲克。
對人工智能(AI)來説,像撲克這種有着隱藏牌面和虛張聲勢的對手的遊戲是非常大的挑戰。過去的幾年中,電腦已經成為日益複雜的一對一撲克遊戲中的佼佼者,但多人遊戲將這種複雜性提升到了一個新的水平。
研究人員於7月11日在《科學》雜誌網絡版上發表報告稱,如今,一個名為Pluribus的撲克高手AI在德州撲克(Texas Hold ’em)的六人遊戲中擊敗了十幾位精英專業人士。而這種能夠利用零散信息對多個對手進行密謀的算法,可能會成為精明的商業談判代表、政治策略師或網絡安全監管機構。
最開始時,Pluribus通過與自身的副本競爭,從零開始學習並逐漸掌握了那些有助於贏牌的行為。之後,它會在每手與五名人類玩家進行第一輪投注時,利用這種直覺決定何時持有和何時棄牌。
在隨後的投注過程中,Pluribus通過想象如果採取不同的行動,遊戲將會如何發展來微調自己的策略。
與為雙人撲克而訓練的人工智能不同的是,Pluribus並沒有一直推測到遊戲的最後,原因是面對更多玩家時,這將需要太多的計算。相反,它設想了未來的幾個步驟,並根據這些假設的未來以及玩家可以採用的不同策略來決定該怎麼做。
在德州撲克錦標賽的10000名選手中,Pluribus與來自13名專業選手中的5人進行了比賽,這些人都曾贏得超過100萬美元的撲克獎金。結果每100手,Pluribus就能從它的人類競爭對手那裏平均撈到480美元。
紐約Facebook人工智能研究公司的Noam Brown表示:“這大概是人類精英專業人士立志擊敗較弱玩家時想要達到的水平。”
這意味着Pluribus比人類對手更聰明。Brown和匹茲堡卡內基梅隆大學的Tuomas Sandholm一起創造了Pluribus。
布拉格捷克技術大學的計算機科學家Viliam Lisy説,既然人工智能已經掌握了撲克,那麼我們或許可以在包含更復雜隱藏信息的遊戲中測試它們的戰略推理能力。
即使是“賭神”發哥親自出馬,估計也沒戲了。
Lisy並沒有參與這項工作,不過他説,在Kriegspiel(一種象棋衍生遊戲,玩家看不到彼此的棋子)這樣的遊戲中,未知的東西可能會變得比緊挨着對手胸口的幾張牌複雜得多。
◎編譯 |Max
◎審稿 |alone
◎責編 | 張夢
◎期刊來源 | 《科學》
◎期刊編號 | 0036-8075
◎原文鏈接:
https://www.sciencenews.org/article/artificial-intelligence-has-now-pretty-much-conquered-poker?tgt=nr
中文內容僅供參考,一切內容以英文原版為準,轉載請註明來源。