人工智能新算法DeepStack挑战扑克 完美“碾压”人类智商

被称为DeepStack的、会玩扑克的人工智能系统,其背后研究人员表示,这是第一个在单挑无限模式下战胜人类职业扑克玩家的算法。这个说法如果属实,将标志着人工智能系统发展的一个重要里程碑。

 

击败人类职业扑克玩家不同于人工智能过去在智力竞赛节目Jeopardy或者围棋等游戏中战胜人类对手的成功,因为每个玩家都只能掌握游戏状态不完整的一部分,并需要一个导航战术程序,例如基于不对称的信息虚张声势。

DeepStack是University of Alberta和两所捷克大学的研究人员合作的成果,他们在一份新的非同行评审的论文中表示,这是“第一个在单挑无限模式下战胜人类职业扑克玩家的计算机程序。”

新的一页已经展开,卡内基梅隆大学竞技性人工智能扑克团队的研究人员宣布将进行一场由他们的系统和四位职业人类扑克玩家——Jason Les、Dong Kim、Daniel McAulay和Jimmy Chou的对抗赛,这四个人类职业玩家加在一起将在20天内和Libratus玩120,000手单挑无限德州扑克。

Libratus是卡内基梅隆大学开发的Claudico的继任者,它在2015年和同样四位玩家对抗,在超过8万手牌后失利。微软研究院为这场比赛捐赠了10万美元的奖池。

虽然Claudico和DeepStack使用一种称为“反事实遗憾最小化”的技术通过卡片游戏策略进行推理,但DeepStack的制造商说,它的系统“采用了一种完全不同的方法”来处理信息不对称,包括在决定保留哪张牌的时候模拟“直觉”。

Libratus和DeepStack都被描述为使用新奇的方法来实现纳什均衡,卡内基梅隆大学将其定义为“一对战略,每个玩家,只要一个玩家的策略保持不变,就不会有玩家因为改变战略受益。”

DeepStack的研究人员写道,“DeepStack算法试图在这个游戏中计算和使用游戏的低利用率策略,即求解一个近似的Nash均衡。只有在游戏中实际出现的公共树的状态时,DeepStack在游戏过程中计算这个策略。本地计算的能力限制了DeepStack在游戏中推理能力,如果不将游戏中的10项权力抽象的160个决策点减少为14项权力,计算的量对于现有的算法来说就太大了。”

DeepStack接受了来自国际扑克联盟(International Federation of Poker)的33名职业扑克玩家的评估。每个参与者被要求在一个月内参加3000场比赛。

DeepStack研究人员写道,“33位职业玩家总共参加了44,852场比赛,11位玩家完成了所要求的3000场比赛。在所有的比赛中,DeepStack赢得了492 mbb / g(每场比赛的超大盲注)。从零开始有四个标准背离,因此非常引人注目。”

卡内基梅隆大学表示,Libratus采用更快的方法来找到纳什均衡,以及开发更好的终结策略,这是由匹兹堡超级计算中心的Bridges超级计算机支撑实现的。

Sandholm表示,“我们正在疯狂推动超级计算机。”Sandholm表示,Libratus使用了1500万个核心小时的计算,而Claudico只有300万个。

卡内基梅隆大学的比赛今天上午11点在Pittsburgh Rivers Casino开始,将在晚上7点左右结束。

原文发布时间为:2017年1月12日 

本文作者:作者:孙博

本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。

时间: 2025-01-21 11:45:19

人工智能新算法DeepStack挑战扑克 完美“碾压”人类智商的相关文章

前沿|人工智能新算法「CHIRP」或帮助宇宙科学家生成第一张黑洞图像

来自麻省理工学院计算机与人工智能实验室和哈佛大学的研究人员们,近期开发出了一种新的算法,它或许能够帮助宇宙科学家生成第一张黑洞图像. 来自麻省理工学院计算机与人工智能实验室和哈佛大学的研究人员们,近期开发出了一种新的算法,它或许能够帮助宇宙学家们生成第一张黑洞图像. 在 Event Horizon Telescope 国际联合会的支持下,该算法能够将全球的无线电天文望远镜所收集到的信息串联在一起.而这一项目的最终目标,将是把整个星球变成一个大型无线电望远镜的抛物反射面. 「无线电波有许多有利之处

【田渊栋报告】游戏中的人工智能:成就与挑战 | ICML WorkShop(46PPT)

[田渊栋]这次有幸成为了首届VGML(Video Games and Machine Learning)的workshop的受邀演讲嘉宾.以下是流水帐. 我第一个演讲,因为Gabriel的开场白只花了十分钟,所以我有五十分钟,占了点小小的便宜.主要讲了DarkForest,Doom还有最近的ELF的框架.ELF是一个游戏之上的框架,任何游戏或者虚拟环境,只要带有C++接口都可以往里装(现在有Python接口也可以了),而ELF会自动处理并行的问题.ELF收集完了一个batch的游戏数据,就可以交

谷歌发布新算法以提高搜索结果的时效性

文|CBN记者 李蓉慧 谷歌发布新算法, 以提高搜索结果的时效性. 它想改变搜索引擎的过时印象, 应对Facebook的挑战. Google+让谷歌有了能够拿得出手的社交产品,但这还不够,现在谷歌试图让人相信,对于谷歌的传统搜索业务,人们也能够期望它做出些应对新时代的改变. 美国当地时间11月3日,谷歌发布了一款名为"Freshness Algorithm"的网页搜索算法,以增强网页搜索时效性.这是谷歌对搜索算法的一次重大改变,这次改变将会影响35%的网页搜索结果. Freshness

阿里云人工智能小Ai将挑战音乐情感预测

本文讲的是阿里云人工智能小Ai将挑战音乐情感预测[IT168 ]科技的进步带来人类生活方式的改变,智慧医疗.智能楼宇.星际探秘等科幻大片的情节,如今已然成为现实,人类历史已经进入人工智能时代.阿尔法狗(AlphaGo)刚刚战胜韩国围棋名将李世石,成为人工智能挑战人脑极限的一大热点.眼下阿里云人工智能又放大招,新近推出的智能机器人小Ai,将在第四届<我是歌手>歌王争霸赛的现场,接受人工智能领域首次"音乐+情感"的挑战,预测本届歌王最终会花落谁家. 小Ai是谁? 作为湖南卫视的

AI 诊断新算法,可提前十年查出老年痴呆症;济南酒店推行“人脸识别”,没带证件也可住店

可口可乐借AI和大数据稳固市场领先地位 可口可乐公司是世界上最大的饮料公司,在200多个国家销售超过500种饮料. 当然,这也意味着从生产和销售到销售和客户反馈该公司会生成大量的数据,公司依据可靠数据来驱动策略,在战略层面上为业务决策提供信息. 事实上,可口可乐是除IT市场之外最早谈论大数据的全球知名品牌之一. 2012年,该公司的首席大数据官Esat Sezer说:"社交媒体.移动应用.云计算和电子商务的结合,给像可口可乐这样的公司提供了前所未有的工具,改变了他们走向IT的方式.在这一切的背后

人工智能: 自动寻路算法实现(三、A*算法)

前言 本篇文章是机器人自动寻路算法实现的第三章.我们要讨论的是一个在一个M×N的格子的房间中,有若干格子里有灰尘,有若干格子里有障碍物,而我们的扫地机器人则是要在不经过障碍物格子的前提下清理掉房间内的灰尘.具体的问题情景请查看人工智能: 自动寻路算法实现(一.广度优先搜索)这篇文章,即我们这个系列的第一篇文章.在前两篇文章里,我们介绍了通过广度优先搜索算法和深度优先算法来实现扫地机器人自动寻路的功能.两种算法都有各自的优点和缺点:对于广度优先搜索算法,程序会找到最优解,但是需要遍历的节点很多.而

人工智能: 自动寻路算法实现(二、深度优先搜索)

前言 本篇文章是机器人自动寻路算法实现的第二章.我们要讨论的是一个在一个M×N的格子的房间中,有若干格子里有灰尘,有若干格子里有障碍物,而我们的扫地机器人则是要在不经过障碍物格子的前提下清理掉房间内的灰尘.具体的问题情景请查看人工智能: 自动寻路算法实现(一.广度优先搜索)这篇文章,即我们这个系列的第一篇文章.在上一篇文章里,我们介绍了通过广度优先搜索算法来实现扫地机器人自动寻路的功能.在这篇文章中,我们要介绍与之相对应的另一种算法:深度优先搜索算法. 项目下载地址 正文 算法介绍 深度优先算法

人工智能: 自动寻路算法实现(一、广度优先搜索)

前言 随着人工智能技术的日益发达,我们的生活中也出现了越来越多的智能产品.我们今天要关注的是智能家居中的一员:扫地机器人.智能扫地机器人可以在主人不在家的情况下自动检测到地面上的灰尘,并且进行清扫.有些更为对路线进行规划,找到可以清理灰尘的最短路径,达到省电的效果.当然,绕过障碍物也是必须拥有的技能.我们今天就来看一下扫地机器人自动寻路的算法的简单实现.这里我们不对机器人如何识别出灰尘进行讨论,我们只讨论发现了灰尘之后,机器人的路径规划进行一个分析.为了简单起见,我们假设机器人所处在的是一个M×

《写给程序员的数据挖掘实践指南》——5.7一个新数据集及挑战

5.7一个新数据集及挑战 现在到考察一个新数据集的时候了,该数据集是美国国立糖尿病.消化和肾脏疾病研究所(United States National Institute of Diabetes and Digestive and Kidney Diseases,简称NIDDK)所开发的皮马印第安人糖尿病数据集(Pima Indians Diabetes Data Set). 令人吃惊的是,有超过30%的皮马人患有糖尿病.与此形成对照的是,美国糖尿病的患病率为8.3%,中国为4.2%. 数据集中