DeepMind表示要给人工智能增加想象力?我们来仔细看看吧

至顶网软件频道消息:因击败世界顶尖围棋选手而名声大噪的谷歌人工智能精品店——DeepMind以消灭人类在智力方面的优越感妄想而著称,发现为其软件代理注入想象力有助于它们更好地学习。

本周发表的两篇论文——《Imagination-Augmented Agents for Deep Reinforcement Learning》和《Learning model-based planning from scratch》(从头开始基于模型的规划)——总部在英国人工智能业务的研究人员描述了通过想象力规划提升深度强化学习的新奇技术。

强化学习是机器学习的一种形式。它包含了通过与特定环境进行交互而学习的软件代理程序,通常通过反复尝试和犯错。深度学习是一种机器的形式,涉及受到人类大脑启发的算法——被称为神经网络。而这两种技术可以一起使用。

可以使用包含软件代理运行规则的模型来完成深层强化学习。例如,为了教会软件如何玩视频游戏,研究人员可能希望提供一个包含游戏信息的模型,这样可以避免在学习过程中代价高昂的尝试和犯错。或者研究人员可能会选择无模型的强化学习,期望软件代理最终自己选择游戏。

每种方法都有自身的缺点,基于模型的方法缺少在模型中未捕获的信息,而无需模型的方法需要大量数据集并且缺乏行为灵活性。DeepMind的工作尝试融合这两种方法的优点。

这些研究人员在他们的第一篇论文中解释说:“对环境模型的结构和可能存在的缺陷没有做出任何假设,我们的方法是以端对端的方式学习提取从模型模拟中收集的有用知识——特别不依赖于模拟的回报。”他们表示,“这样就可以让代理受益于基于模型的想象,而又不会陷入传统基于模型方式的陷阱。”

他们正在描述的是能够在行动之前思考的软件。

死胡同

DeepMind的研究人员提出通过构建,评估和执行计划来学习的软件代理。它将试错学习与模拟结合作为“飞行前”检查的一种形式,以便评估最有希望的途径,同时避免明显的死胡同。

研究人员用Sokoban测试了他们的想象力代理,这是一个拼图视频游戏,是1981年在日本创建的,其中包含了在仓库里移动盒子以及飞船导航游戏。

Sokoban允许玩家推盒子,但是不可以拉动盒子,这意味着可能会有一些动作会让游戏中的难题无法解决。因此,如果是人类玩家,游戏就会建议他们在开始行动之前先制订一个计划。研究人员认为,因为DeepMind代理也能够进行这样的规划,所以也非常适合这个游戏。

想象代理设法解决了所提出的Sokoban中85%的关卡,而标准无模型代理则为只能完成60%。它的表现也超过了一个拷贝模型代理,这是一个不使用有想象规划增强版的标准代理。

研究人员在一篇博客中解释说:“对于这两个任务来说,想象增强代理在很大程度上胜过无想象的基准:它们以较少的经验学习,能够处理环境建模的缺陷。”他们表示,“因为代理能够从内部模拟中提取更多的知识,和传统的搜索方法——例如蒙特卡洛树搜索——相比,它们能够使用更少的想象,完成更多的任务。”

在行动之前思考让机器学习工作变得更慢,但研究人员认为:“这在不可逆转的领域至关重要,在这些环境中某些行动可能会产生灾难性的后果,例如Sokoban。”

原文发布时间为:2017-7-23

本文作者:黄雅琦

 

时间: 2024-08-31 02:09:55

DeepMind表示要给人工智能增加想象力?我们来仔细看看吧的相关文章

DeepMind最新论文:人工智能可以从旧概念中创造新概念

大约2500年前,一个美索不达米亚的商人使用陶器.木制品和簧片作为流通货币,这改变了人类经济的发展历史.后来,美索不达米亚的商人又使用"算盘"来记录的他们商品,调整财政政策,这促成了经济的蓬勃发展. 在这些灵感乍现的时候恰恰折射出了人类具有惊人的能力:能够整合现有的概念,并构想出一些全新的概念.许多不为人知的发明家曾不得不考虑他们想要解决的问题是什么,可能制造出怎样的装置以及要思考建立这些装置所需要的原材料是什么,例如,粘土可以通过模具压成平板,簧片可以充当计数器.这些物体都具有相似性

OpenAI 和DeepMind开源人工智能训练平台

领导人工智能(AI)潮流的大咖DeepMind和OpenAI日前开放旗下了的训练平台,目标是进一步开发通用智能. DeepMind隶属Alphabet的人工智能部门.DeepMind周一宣布开源DeepMind实验室.DeepMind实验室是DeepMind旗下用于基于代理的AI研究的3D游戏平台. DeepMind团队在一篇博客文章中表示,3 D世界是从第一人称的角度观察到的,在3 D世界里开发通用智能会更容易一些.所谓的通用智能是指适应不断变化的环境和在未预先编程环境里运作的能力. 该博文指

为什么人工智能发展需要国家?

如果你是电影迷,你一定看了今年奥斯卡热门电影<模仿游戏>,这个以英国著名科学家阿兰·图灵为主线的传记电影,展现出图灵如何设计一套模仿人类思考机器,从而破解纳粹德国密码的历程. 如果你是一个科学迷,你一定看到霍金.马斯克对于正在兴起的一股热潮的恐惧,马斯克甚至断言:"我们需要万分警惕人工智能,它们比核武器更加危险!" 如果你是一个互联网迷,过去一年你会被互联网公司各种新奇的名词"洗脑",包括但不限于机器学习.计算机视觉等等. 如果你是个新闻迷,最近一定关注

专家点评:谷歌人工智能AlphaGo完胜欧洲围棋冠军,如果对战一组冠军结果如何?

今天被谷歌AlphaGo刷屏了.各媒体内容角度不同,笔者所在人工智能高级微信群中专家纷纷评论: 谷歌基于深度学习的围棋程序赢了欧洲冠军,值得庆祝.但不必过分解读,必经计算机的强项在于计算能力和记忆能力. 关键是以前一直神话围棋的不可战胜,现在战胜了欧洲冠军,后续看3月9段之战. 如果让程序与一组冠军下,会是什么结果?(蒙特卡洛树的方法容易扩展,不过计算量大增) 如果围棋突然变成29*29,机器会reboot? Chess Program,需要大量学习对局棋谱.所以有专家做扫描棋谱识别OCR出了名

人工智能机器人玩转电子游戏,超越人类成最厉害玩家

2月25日,<自然>杂志刊登了谷歌DeepMind团队关于其研发的人工智能机器人玩转电子游戏的文章.文章称该智能机器人在<钓鱼德比>.<高速公路>.<机器人坦克>.<功夫大师>等29项游戏中表现突出.其中在<星际炮手>和<疯狂的登山者>等十几项游戏中超越了最牛人类玩家.该系统在设计上融合了深度神经网络和增强学习运算两种脑启发智能,因此被称为"非凡的人造特工". 机器人发明者DeepMind公司Hassa

英特尔披露人工智能战略 —— 英特尔将提供覆盖数据中心、物联网设备及软件的广泛产品组合, 推动人工智能服务于企业和社会

近日,英特尔公司宣布推出一系列涵盖从前端到数据中心的全新产品.技术及相关投资计划,旨在拓展人工智能(AI)的发展空间并加速其发展速度.英特尔认为,人工智能将变革企业业务的运营方式以及人类与世界交互的方式.为此,英特尔正在整合优势,为人工智能提供最为广泛的技术选项,将其潜能在各个领域中充分释放,包括智能工厂.无人机.体育.欺诈检测和无人驾驶汽车等等.今天 英特尔首席执行官科再奇分享了英特尔对人工智能前景及复杂性的洞察.他指出,人工智能需要众多的领先技术的支撑,以及远超初期采用者范围的更大规模的生态

击败李世石后,人工智能转战医疗:用大数据诊断眼科疾病

今年3月份,4:1赢下韩国棋手李世石的AlphaGo,让谷歌旗下的人工智能公司DeepMind名声大噪.尽管外界还传出AlphaGo可能会继续挑战<星际争霸>游戏,中国棋手柯洁等消息,但对于DeepMind来说,利用人工智能进入医疗领域才是重头戏. 这家初创于英国的公司,早在谷歌正式安排AlphaGo对抗李世石之前,就成立了DeepMind健康部门,并在今年2月份宣布与伦敦帝国理工学院.伦敦皇家自由医院展开合作.DeepMind联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)表示

DT科技评论第31期:阿里巴巴启动“NASA”科技计划

DT科技评论 Data Technology Review 第 31 期           人民网研究院,阿里云研究中心 本期目录 阿里巴巴启动"NASA"科技计划 IBM创造出世界上最小磁存储介质 AWS S3故障回应评论 英特尔收购Mobileye DeepMind成功将"记忆"融入人工智能 安全攻击模拟厂商(Cymulate)PRE A轮融资三百万美金 谷歌升级语言处理框架SyntaxNet DARPA终身学习机器(L2M)计划 谷歌开源JPEG图像压缩编码

浅谈各地降低能耗技术 关注可持续发展

根据数据中心行业业界预测显示,从电力使用的角度来看,数据中心与航空市场一样,每年都在消耗3-5%的世界能源. 随着在线服务和基于云的基础设施和应用的需求持续增长,托管数据中心(IDC)业绩上升,能源消耗也会随之增长. 数据中心持续增长的能耗使用情况并没有被监管机构和环保游说者忽视,监管机构正在积极通过一些举措,在促使运营商重新思考如何建立低能耗的数据中心,提升运维管理效率,重点关注可持续发展. 这促使一些组织采用尖端技术,如人工智能(来解决)有助于增加能源使用的领域),或者将数据中心建在水下.