重磅 | 阿里推出多智能体双向协调网络BicNet,玩《星际争霸》堪比人类

过去十年中,人工智能取得了长足的进步,在图像和语音识别上已经在某种程度上超越了人类。而通过反馈奖励,单个的AI智能体也能在雅达利这样的视频游戏和围棋中战胜人类。

但人类真正的智能还包括了社会和集体智能,这也是实现通用智能必不可少的。就像虽然单个蚂蚁的智能有限,但通过协作它们能狩猎,能筑巢,能发动战争。毫无疑问,人工智能的下一个挑战就是让大规模的AI智能体学习人类水平的协作与竞争。

协作的一个例子就是星际这样的即时战略游戏。雷锋网消息,最近阿里巴巴与伦敦大学的研究人员们,就在一篇论文中展示了如何用星际争霸作为测试场景,让智能体协同工作,在多对一和多对多中打败敌人。

掩护攻击

这项研究主要关注星际中的微管理任务,每个玩家控制自己的单位,在不同的地形条件下歼灭对手。星际这样的游戏对计算机来说可能是最困难的,因为它们的复杂程度比围棋要高得多。这种大型多智能体系统学习面临的主要挑战是,参数空间会随着参与人数的增加而呈指数级增长。

研究人员让多智能体把星际中的战斗当作零和随机游戏来学习。为了形成可扩展且有效的通讯协议,研究者引入了一个多智能体双向协调网络BiCNet,智能体可以通过它来交流。另外,研究中还引入了动态分组和参数共享的概念,来解决扩展性问题。

边打边跑策略

BiCNet可以处理不同地形下的不同类型的战斗,且对战时双方都有不同数量的AI智能体。

分析显示,在没有任何诸如人类示范或标签数据的监督时,BiCNet也能学习各类协调策略,而这些策略与经验丰富的玩家所展现出来的很相似,比如在不引发冲突的情况下移动,边打边跑等基本策略,以及 掩护攻击与适度集中火力等高级技巧。

另外,BiCNet还可以轻易适应异构智能体任务。在实验中,研究者根据不同的场景对网络进行了评估,发现它表现优异,在大规模现实应用中有潜在价值。

研究中还发现,指定的奖励与学习策略之间存在很强的相关性。研究人员计划进一步研究这种关系,研究 策略如何在智能体网络中传递,以及是否会出现特定的语言。另外,双方都通过深度多智能体模型来操作时,纳什均衡的的探讨也很有意义。

论文阅读:https://arxiv.org/pdf/1703.10069.pdf

本文来源于"中国人工智能学会",原文发表时间" 2017-04-05 "

时间: 2024-10-29 22:46:09

重磅 | 阿里推出多智能体双向协调网络BicNet,玩《星际争霸》堪比人类的相关文章

阿里推出中国智能物流骨干网,马云成为新帝国掌门人

[导读]马云将会出任菜鸟网络董事长,而沈国军则担任CEO.而该公司宣布,第一期投资将是1000亿元,公司计划将在8-10年内建立起一张能够支撑日均300亿网络零售额的智能物流骨干网络,企图能够做到"让全中国的任何一个地区都可以做到24小时内送货必达". 在5月28日,阿里宣布推出了一项中国智能物流骨干网(China Smart Logistic Network,简称CSN)计划,而他本人也即将担任新帝国的掌门人.而由阿里集团牵头组建的CSN,准备联合银泰集团.复星集团.富春集团.顺丰速

深度强化学习、GAN与多巴胺对撞:阿里“AI 智能体”认知研讨会干货

2017年4月,阿里巴巴首次向外公布在人工智能"认知"层面上的研究成果:阿里巴巴认知计算实验室与伦敦大学学院计算机系合作,以游戏"星际争霸1"中的微观战斗场景为测试环境,深入地研究了多个 AI 智能体之间的协作难题,旨在通过协作智能解决人类不擅长的问题. 该研究引入的多智能体双向协作网络(BiCNet )可以自动学习游戏中的各种最佳策略,以使多个智能体协同作战,从无碰撞移动到基本的攻击和逃跑策略,再到复杂的掩护攻击和集中火力攻击. 据介绍,该研究在对战游戏中与其他方

以《星际争霸》为例,阿里多智能体协作网络BiCNet展现人工集体智能无限潜力

阿里巴巴认知计算实验室与伦敦大学学院计算机系合作,以游戏"星际争霸1"(下简称"星际")中的微观战斗场景为测试环境,深入地研究了多个 AI 智能体之间的协作问题,旨在通过协作智能解决人类不擅长的问题.该研究引入的多智能体双向协调网络(BiCNet )可以自动学习各种最佳策略来使多个智能体协同作战,从无碰撞移动到基本的攻击和逃跑策略,再到复杂的掩护攻击和集中火力攻击.该研究所用的方法优于目前已有的最先进方法,多智能体协作完成复杂任务,显示出了在现实世界中电商.游戏.健

专访阿里研究员袁全:从 AI 玩《星际争霸》谈认知智能的现状与趋势

不同于以提升点击率和转化率等优化指标为主的机器学习模型,认知计算以实现算法和智能化为核心,训练智能体的自主学习能力,以及多个智能体之间的协作和配合能力,和原来优化大数据和算法具有很大的区别.近日,笔者就认知计算.应用场景.算法优化.深度学习以及云计算&大数据技术的关系等问题与阿里认知计算实验室研究员.资深总监袁全进行了深入探讨. 阿里认知计算实验室研究员.资深总监袁全(左一) 深耕细作,瞭望人工智能新征程 "人工智能时代,我们专注认知计算研究,以积累核心算法系统为首要目标"--

阿里推出智能音箱“天猫精灵”,张张口就可以买买买了

7月5日下午,阿里云在北京时间博物馆召开了一场发布会,正式推出首款智能音箱产品"天猫精灵X1",定价499元,有黑白两个配色,除了支持播放音乐,查询天气.控制智能家居.家电设备等基础功能外,还运用了首个商用的声纹识别技术,其中一个典型的应用场景是购物,这在国内智能语音设备中尚属首例. "天猫精灵X1"从当日起开放1000台限量公测,并将于8月8号正式进行首批发售. 此前,不少媒体已收到并纷纷晒出本次发布会的邀请函--一个扁平的圆片,上面印有"未来,开口即来

未来智慧城市长啥样? 大咖解答:万物互联成“智能体”

随着"智慧城市"概念的提出,一幅被描绘的智慧城市远景图也逐渐呈现在人们眼前:发个手机短信,可为家中的花浇水:看公交站牌上的提示,就知道路堵不堵,下一班车何时来:智慧厨房还可以进行食品索源,教您如何做菜,为您配好菜单--数字化.智能化的发展不断给我们的生活带来惊喜,未来的智慧城市还会是什么样子? 11月14日下午,作为河南省第四届互联网大会的主要分会场之一,由中国移动通信集团河南有限公司承办的以"共建共享 智慧城市"为主题的分论坛在会展中心举行,各界业内专家齐聚一堂,

阿里入局智能音箱:一次人工智能的“探索”

上周,关于阿里巴巴旗下人工智能实验室(A.I. Labs)诞生的消息不胫而走,殊不知该实验室早在2016年低调成立.昨天下午,这个专门研发消费级AI产品的实验室高调推出研发的第一款智能语音终端设备--天猫精灵X1,内置阿里第一代人机交流系统--AliGenie. 现场,阿里人工智能实验室负责人浅雪两句开场白,道出阿里入局智能语音助手市场的初衷: "语言是人与人之间最主要的沟通方式,也应该是人与另外一种智能进行交流的主要方式.""云端一体化带来的趋势是高度智能化,智能终端需要一

DeepMind提出增强想象智能体 这次能帮你赢游戏

DeepMind发布的最新论文中提出了,用于深度强化学习的增强想象智能体(Imagination-Augmented Agents).这个智能体的有趣之处在于,它用到了想象力.不仅能够获取当前信息.想象行动结果,还能制定计划,选择一种可以够达到最大预期值的方法. 研究发现,在软件中植入想象智能体,就能让它们更快地学习,论文描述了通过想象计划(imaginative planning)提高深度强化学习的新方法. 学会想象的智能体在玩 Sokoban(推箱子)游戏时,解决了 85% 的问题,而基准智

环境也能强化学习,智能体要找不着北了,UCL汪军团队提出环境设计的新方法

雷锋网 AI 科技评论按:提到"强化学习",大家都知道这是一种让智能体寻找优化策略.从而与环境互动获得奖励的半监督学习方法.但是在汪军教授看来,强化学习的应用领域不止如此. 在刚刚结束的CCF-GAIR 2017大会中,来自伦敦大学学院 UCL 计算机系的汪军教授在自己的演讲 如何进行大规模多智体强化学习? - 雷锋网(公众号:雷锋网) 中提到了一类他们团队最近正在研究的环境设计问题,比如宜家希望自己店铺空间设计优化,优化目标可以是环境中不同位置的人流量平均,这样各个地方摆放的商品都可