新浪科技 2017-01-12 14:06:53
北京時間1月12日消息,加拿大與捷克研究人員開發了撲克機器人,它已經在一對一比賽和無限下注德州撲克比賽中打敗了人類職業玩家,撲克機器人的勝利標志著AI取得了新的突破。本周晚些時候,匹茲堡賭場將會舉辦撲克錦標賽,到時幾名世界級撲克玩家將會與卡內基梅隆大學開發的程序對決。
北京時間1月12日消息,加拿大與捷克研究人員開發了撲克機器人,它已經在一對一比賽和無限下注德州撲克比賽中打敗了人類職業玩家,撲克機器人的勝利標志著AI取得了新的突破。
研究人員稱,程序用“逼近法”打敗了人類對手。密歇根大學游戲理論與AI教授邁克爾·韋爾曼(Michael Wellman)認為:“如果真是這樣,意味著游戲AI取得了明顯進步。首先,它是一個里程碑,AI在游戲中打敗了撲克職業玩家。其次,它將一些新創意結合在一起,開創了激動人心的新方法,我們可以用這種方法應付信息不完全的游戲。”
本周晚些時候,匹茲堡賭場將會舉辦撲克錦標賽,到時幾名世界級撲克玩家將會與卡內基梅隆大學開發的程序對決。卡內基梅隆大學計算機教授圖奧馬斯·桑德赫爾(Tuomas Sandholm)是程序的主要開發者,他說參賽的選手比之前測試時的選手強很多,在20多天的比賽中,玩家將會打出12萬手撲克,研究人員可以統計數據,為開發工作提供幫助。一直以來,人們認為撲克對于電腦來說過于復雜,錦標賽也許可以向我們證明AI已經可以在撲克上超越人類了。
撲克軟件DeepStack曾經打敗過職業玩家,它是加拿大阿爾伯塔大學計算機教授邁克爾·保林(Michael Bowling)領導開發的,查爾斯特大學和捷克理工大學的研究人員也參與了研發。網上刊發了一份研究報告,研究人員在報告中表示,DeepStack與幾名人類玩家比賽,打了4.5萬手撲克,輕松獲勝。
人類也曾與AI在其它游戲中對決,相比而言撲克更加復雜。撲克不確定因素很多,比如對手可能會欺騙,在現實世界中到處都是欺騙,AI還不懂得怎樣欺騙。撲克玩家看不到對手的牌,但在西洋棋、國際象棋和圍棋中,大家可以看清對方的棋子。今年年初時,Alphabet子公司DeepMind開發的AI程序打敗了李世石,他是韓國知名職業圍棋高手。
對于機器來說,不限注德州撲克太難了,每一手牌都有10的160次方種(10的后面跟160個0)可能。DeepStack通過自己與自己打撲克不斷學習。每打完一局,系統就會修改優化策略,讓技能更上層樓。由于不限注撲克很復雜,系統通過玩限注撲克來提高技巧。為了處理復雜性問題,研究人員使用了快速逼近技術,他們將之前的撲克比賽資料輸入深度學習算法,不斷優化精煉。
密歇根大學韋爾曼認為,撲克是一種復雜的游戲,采用新技術之后,系統碰到各種情況都可以有效應對,這是新的突破;以前要繪制整個樹,將各種可能性找出來。
研究人員將DeepStack的逼近技術與人類玩家的直覺類比,當對手欺騙或者拿到一手可以獲勝的牌時,人類會用直覺判斷,比如根據對手的語言來判斷,機器不同,它根據對手的下注模式來判斷。研究人員稱:“我們可以將這種估計看成是DeepStack的直覺。”
通過觀察撲克玩家在多次對決中贏得的金額,系統可以評估玩家的表現,而不是根據桌面上的下注額判斷。與優秀的職業選手相比,DeepStack的勝率高了大約9倍。
2015年,保林與阿爾伯塔大學的同事找到了解決方案,他們開發的撲克機器可以玩限注德州撲克,表現很完美。參加匹茲堡錦標賽的機器人名叫“Libratus”,它是圖奧馬斯·桑德赫爾(Tuomas Sandholm)與學生諾姆·布朗(Noam Brown)合作開發的,Libratus用匹茲堡超級計算中心的強大硬件運行。
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP