中科院自动化所拿下星际争霸AI竞赛第四名,顺便发布了一个训练AI“大局观”的数据集

上周日,互动数字娱乐AI大会(AIIDE)2017中的星际争霸AI竞赛落下帷幕。这一竞赛是即时战略(RTS)游戏AI比赛中最重要的比赛之一,暴雪、DeepMind和Facebook人工智能研究院等机构也有赞助。两周的车轮战中共进行了41580场1v1比赛,28个参赛AI中每两个之间也平均比赛了110场。

DeepMind 和 Facebook 近两年在星际争霸AI研发上动作频频,Facebook 也拿出名为 CherryPi 的机器学习AI亲自参加了这场比赛,但只以69%的胜率拿到第6名。面对这样的战绩,多家外媒不免对 Facebook 发出了“雷声大雨点小”的嘲笑,不过机器学习在RTS游戏中的探索毕竟只是刚刚开始,大可不必心急。

比赛冠军是一位独立参加的星际争霸爱好者,来自澳大利亚的程序员Chris Coxe,依靠手工编码、基于预定义规则和情境判断的AI获得了最高胜率83%,从而获得冠军;不仅如此,排名前三的AI都是由独立参赛的星际争霸爱好者开发的,大多数排名靠前的个人参赛AI也都是和Chris Coxe类似的手工编码、基于规则的AI。

同时雷锋网 AI 科技评论发现,也有多个来自中国的AI参加了这次比赛,除了个人名义参加的Sijia Xu和他的AI“Overkill”之外,中科院自动化研究所更是有三支队伍参赛,复杂系统管理与控制国家重点实验室有两支,一支是在读博士生朱圆恒、赵冬斌研究员的团队和他们的AI“Juno”,另一支是唐振涛团队,他们的AI名为“killall”;还有一支团队来自智能感知与计算研究中心,他们的AI“cpac”首次参赛就以71%的胜率拿下了第4名。

智能感知与计算研究中心“cpac”团队共有13名成员,开发这个 AI 用了几个月的时间,其中有新的游戏策略,也融合了部分机器学习功能。根据他们介绍,他们训练了一个多层感知网络用于在生产队列为空的时候造兵。

在这个 AI 的开发过程中,他们还一并发布了一个新的数据集 MSC(Macro-management in StarCraft),论文署名为在读博士生武慧凯、副研究员张俊格、研究员黄凯奇。

MSC 基于暴雪今年开放的 SC2LE 平台,作者们在论文中表示这个平台的好处是有目前为止最大的replay数据集、这些replay的质量更高格式更标准,而且 SC2LE 还有官方的支持和积极的更新。

MSC 数据集的目标是提供预定义的、根据特征分割过的replay,用于游戏中宏观操作(比赛策略&“大局观”,Macro-management)的训练和评估。SC2LE中现有的replay虽然数量很多,但是没办法直接用来学习和测试;MSC则把replay过滤、解析、采样、提取操作特征,并形成训练、验证、测试三个数据集,就可以供研究人员方便地训练模型,数据集自身也就成为了公开、标准的模型对比手段。

MSC基于 CS2LE 的80万场replay中已经公开的约6万4千场,按照上图中的流程进行处理,形成三个数据集。在预处理中剔除了过短、APM(每分钟操作数)过低以及选手的MMR(比赛积分)过低的比赛。

除了数据集之外,论文中也一并提出了一个基准模型,展示了在全局局面评估和单位建造预测任务中的表现;其它游戏策略、序列建模、不确定性建模、不平衡数据集学习、强化学习、规划和树搜索等RTS游戏中常出现的子任务也可以从这个数据集中受益。

本文作者:杨晓凡

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-31 22:53:38

中科院自动化所拿下星际争霸AI竞赛第四名,顺便发布了一个训练AI“大局观”的数据集的相关文章

【星际争霸人类战胜机器】韩国选手4:0战胜Facebook等机构AI

 韩国的专业玩家在星际争霸游戏中以4:0的比分战胜了AI. 在人与AI最近的一次遭遇战中,韩国的专业玩家在星际争霸游戏中以4:0的比分战胜了AI.比赛于本周二在韩国的世宗大学举行. 虽然AI在本次比赛中击败了两位业余玩家,但是,在对阵专业级玩家宋炳具(Song Byung-gu)时,它们输掉了所有的比赛.宋炳具被认为是世界上最好的星际争霸职业选手之一. 参加本次比赛的AI系统有四个,分别是:来自韩国世宗大学的MJ Bot.来自澳大利亚的ZZZK.来自挪威的TSCMOO和来自Facebook的Ch

已经确定不用通过战网就可以进行星际争霸2对战

来自韩国chosun的报道: 已经确定不用通过战网就可以进行星际争霸2对战. 在26日进行的星际2聚会上进行了前星际1职业选手Grrr和TheBoy的星际争霸2对阵,2名星际争霸时代知名选手在时隔10年之后再次展开了激烈的争夺. 6月26日韩国Party上Grrrr对战老对手TheBoy(左二) 不过比起比赛更引人注目的是进行方式.两名选手的对阵方式不是之前说的战网对阵,而是局域网对阵.赛后采访时我们发现这局域网是使用的暴雪内部的. 暴雪从公布战网2.0的时候就开始声明星际争霸2所有玩家之间的比

星际争霸II结束8天免费公测开始正式运营

星际争霸II结束8天免费公测开始正式运营 4月6日下午消息,<星际争霸II>官网今天正式发布公告,宣布今日在中国大陆地区正式运营.价格为20元人民币30天连续游戏时间. 此前,<星际争霸II>进行了为期8天的免费公测. 以下为官方公告全文: 我们很高兴地宣布:<星际争霸II>今天正式开始运营.在此,我们对在过去8天时间里参与免费公测的玩家们表示最衷心的感谢--希望<星际争霸II>激烈的即时战略对战为大家带来了充满乐趣的游戏体验--但是,科普卢星区的战斗现在才

【阿法狗只是小儿科】5年内,AI将问鼎星际争霸,横扫人类玩家

本文讲的是5年内,AI将问鼎星际争霸,横扫人类玩家,对于人类来说,星际争霸是难度系数最高的游戏.而这一切即将改变.星际争霸AIIDE AI大赛负责人表示,五年内AI将能打败人类玩家,占据星际争霸主导权.这将会给医疗.技术中海量数据处理方式带来巨变. 接下来两周,纽芬兰纪念大学的一个小房间,将会成为银河系争霸的战场. 这既是银河系克普鲁星区主导权的争夺赛:也是AI掌握人类复杂性的一种探索. 纽芬兰纪念大学的一位计算机科学教授 David Churchill说,"这是我们对人工智能做过的最复杂尝试.

DT科技评论第14期:暴雪《星际争霸2》将进行AI开源

DT科技评论 Data Technology Review 第 14 期           人民网研究院,阿里云研究中心 本期目录 CEO对话:阿里.英特尔携手 深度布局人工智能 与漏洞赛跑 美安全专家给出9点经验和建议 英特尔收购VR技术公司Voke 进军沉浸式体育赛事市场 Adobe推出Sensei人工智能平台 让软件变智能 暴雪<星际争霸2>将进行AI开源 并与AlphaGo合作 日本力推自动驾驶 要在2030年实现交通事故"零死亡" Facebook发布手机版机器

FaceBook发布星际争霸最大AI数据集

简介 我们刚发布了最大的星际争霸:Brood War 重播数据集,有 65646 个游戏.完整的数据集经过压缩之后有 365 GB,1535 million 帧,和 496 million 操作动作. Overview We release the largest StarCraft: Brood War replay dataset yet, with 65646 games. The full dataset after compression is 365 GB, 1535 million

专访阿里研究员袁全:从 AI 玩《星际争霸》谈认知智能的现状与趋势

不同于以提升点击率和转化率等优化指标为主的机器学习模型,认知计算以实现算法和智能化为核心,训练智能体的自主学习能力,以及多个智能体之间的协作和配合能力,和原来优化大数据和算法具有很大的区别.近日,笔者就认知计算.应用场景.算法优化.深度学习以及云计算&大数据技术的关系等问题与阿里认知计算实验室研究员.资深总监袁全进行了深入探讨. 阿里认知计算实验室研究员.资深总监袁全(左一) 深耕细作,瞭望人工智能新征程 "人工智能时代,我们专注认知计算研究,以积累核心算法系统为首要目标"--

堪比沃森的游戏AI星际争霸用于人工智能

昨日,由IBM和美国德克萨斯大学联合研制的超级电脑"沃森(Watson)"在美国最受欢迎的智力竞猜电视节目<危险边缘>击败了该节目有史以来最成功的两个选手肯·詹宁斯和布拉德·拉特,这是自1997年"深蓝"战胜国际象棋世界冠军卡斯帕罗夫之后,超级电脑又一次在"人机大战"中战胜了人类. 科学家们一直在孜孜不倦的研制人工AI,希望有朝一日电脑也能像人类一样思考.其实我们所玩的众多游戏里,也有不同程度的AI设计,并有人对此展开了研究. IBM

以《星际争霸》为例,阿里多智能体协作网络BiCNet展现人工集体智能无限潜力

阿里巴巴认知计算实验室与伦敦大学学院计算机系合作,以游戏"星际争霸1"(下简称"星际")中的微观战斗场景为测试环境,深入地研究了多个 AI 智能体之间的协作问题,旨在通过协作智能解决人类不擅长的问题.该研究引入的多智能体双向协调网络(BiCNet )可以自动学习各种最佳策略来使多个智能体协同作战,从无碰撞移动到基本的攻击和逃跑策略,再到复杂的掩护攻击和集中火力攻击.该研究所用的方法优于目前已有的最先进方法,多智能体协作完成复杂任务,显示出了在现实世界中电商.游戏.健