再下一城!
AI在六人桌德州扑克赛中战胜人类选手

2019-07-15 09:21:48 来源: 科技日报-中国科技网 作者: 刘霞

科技日报记者    刘霞

据美国《新闻周刊》网站近日报道,美国科学家开发出一种新的人工智能(AI)程序“合众为一”(Pluribus),其在6人无限制德州扑克比赛中击败了6名全球顶尖选手。研究人员认为,这是人工智能发展史上的一座里程碑,未来有望应用于生物医学、安全等领域。研究发表于12日出版的《科学》杂志。

新人工智能Pluribus在六人扑克比赛中击败人类顶级选手(来源:美国《新闻周刊》网站)

Pluribus由Facebook人工智能实验室和卡耐基梅隆大学的研究人员携手完成。在游戏中,Pluribus和职业选手共进行了10000手扑克牌比赛。在一种情况下,人工智能面对5名人类选手;在另一种场景中,5个版本的人工智能与一名人类选手对决(AI没有相互配合)。研究人员发现,Pluribus的表现明显优于人类。他们认为,这是“决定性的胜利”。

研究报告共同作者、卡内基梅隆大学计算机科学教授托马斯·桑德霍尔姆博士素有“德州扑克AI之父”的美誉,他表示:“在AI领域(至少自1970年以来)和博弈论领域(至少从1950年开始),扑克是测试非完美信息游戏解决能力的主要基准。”

桑德霍尔姆解释说,人工智能已经在国际象棋、跳棋、围棋、双人限制和双人无限制扑克等双人零和游戏中击败了人类。在双人零和游戏中,只能有一方可以获胜,用博弈论的术语来讲,这些人工智能所做的都是在找到一个接近纳什均衡的策略。所谓纳什均衡策略就是指一系列能够使自己预期收益最大化的策略。但由于六人游戏规模大,人数多,上述办法很难扩展到六人游戏。

诺奖得主约翰·纳什(来源:美国《新闻周刊》网站)

因此,研究人员需要找到一种方法来摆脱纳什均衡,桑德霍尔姆解释道:“这种策略计算起来要困难得多,但最新算法‘强大且可扩展’,最新胜利‘是AI在多玩家游戏领域的第一个里程碑’。”

桑德霍尔姆表示,这一研究所涉及的战略推理技术未来有望在多个领域“大显身手”,从扑克、视频游戏到投资银行的战略优化、政治运动等,不一而足,其还可以引导进化和生物学适应——例如医疗计划和合成生物学等。此外,该技术还可用于电子战、安全领域等。

总编辑圈点

谷歌的“阿尔法狗”在围棋对弈中大败李世石后,有人指出:别着急,人工智能还没打赢多人德州扑克呢。能在一对一的博弈中获胜,确实是人工智能的重要成就。不过,现实生活中很多竞争场景并非双人对决,而是多人参与,股票投资、职位竞选、招投标活动等等就是如此。因此人工智能在6人德州扑克中获胜,是一座新的里程碑。在此基础上,人工智能有可望为多人竞争的更为复杂的现实场景,提供最优解决方案,从而胜任更多任务。

责任编辑: 房琳琳