机器人走路未必笨拙,DeepMind新方法训练的人工智能走得就很飘逸

雷锋网(公众号:雷锋网) AI 科技评论按:无论是在树木间乱窜的猴子,还是躲避对手和进击目标的足球运动员,他们灵活敏捷的速度,都让人十分惊叹。掌握这种复杂的电机控制是物理智能研究的方向,是 AI 研究的重要组成部分。

真正的智能电机需要在一系列复杂的环境中,学习如何调节控制身体使其更加灵活来完成任务。目前,很多领域开始研究如何控制模拟人,包括计算机动画和生物力学领域。智能电机的另一种发展趋势是,使用手工制作的目标或运动捕捉的数据来产生特定的行为。
然而,这可能需要相当多技术工作的努力,也可能会导致智能电机面对新任务时,难以重新调整行为。

在以下 3 篇新的论文中,阐述了 DeepMind 已经找到了 AI 学习灵活行为的方式,这种方式不仅能够重复使用,还能解决任务。

一、丰富的环境中表现的运动行为

如果玩
Atari 或 Go
时,目标很容易描述,就是赢。但是你如何描述一个后空翻表演的过程?或者仅仅只是单纯描述一下“跳”这个动作?当 DeepMind 把运动技能教授给人工系统时,常常会遇到这个问题,就是很难准确描述一个复杂的行为。 DeepMind 目前的工作就是研究如何在简单高水平的目标下,使身体能够从头开始与环境相互作用来完成复杂的行为,例如向前移动而不会下降。更具体地说,他们训练了各种模拟人,让他们在不同的地形上进行跳跃,转弯或者蹲伏。结果显示,模拟人完成这些复杂的技能前,并没有收到具体的指示。 DeepMind 需要找到一种方法,可以训练系统中明显不同的模拟人。下面的
GIF 显示了能够产生高质量的运动的技术。

模拟的“平面”步行者反复尝试翻墙

模拟的“蚂蚁”步行者在学习如何在木板之间精确地跳跃

二、通过对抗模仿学习人体行为

上述的模拟人解决突发行为的能力非常强大,但是由于这些动作必须从头开始,所以模拟人的动作看起来和人类行为不太一样。在 DeepMind 的第
2
篇论文中,阐述了如何通过运动捕捉数据来构建一个模仿人类行为的政策网络,需要预先学习一些技能,例如步行、起步、跑步和转弯等等。目前,模拟人已经产生了类似人类的行为,可以通过重新调整这些行为来完成其他任务,比如爬楼梯,通过导航绕过围墙等等。

下面的 GIF 可以查看模拟人的行为。

人形步行者产生类似人类的行走行为

人形步行者摔倒后立即站起来

三、模拟人模仿人类各种行为


3
篇论文提出了构建一种最先进的生成模型的神经网络结构,它能够学习不同行为之间的关系,并模仿它所显示的具体动作。经过训练之后, DeepMind 的系统可以编码观察到的动作,还可以创建新的小动作。尽管模拟人并没有看到动作之间的过渡,依旧可以在不同类型的动作之间切换,例如在行走风格之间的转换。

GIF 中左侧和中间演示了两个行为;GIF 中右侧展示了模拟人在不同行为之间产生了它从未见过的过渡
GIF 中左侧平面步行者演示了特定的行走风格;GIF 中右侧展示了我们的模拟人使用单一政策网络来模仿这种行走风格

实现模拟人行动灵活且适应控制是
AI
研究的关键要素。 DeepMind 的工作旨在开发一套系统,能够通过学习和调整技能来解决电机控制任务,同时减少手动工程。 DeepMind 未来的研究工作主要是扩展这些方法,以便在更复杂的情况下完成更多的任务。雷锋网
AI 科技评论也会继续保持关注。

论文地址:

via DeepMind,雷锋网 AI 科技评论编译

本文作者:白及

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-11-08 20:11:34

机器人走路未必笨拙,DeepMind新方法训练的人工智能走得就很飘逸的相关文章

DeepMind新论文:在复杂环境中,智能体能更聪明地进行想象和思考了

雷锋网 AI科技评论按:不同于AlphaGo所处的"完美环境",在复杂和不完美的环境中,智能体能高效地思考,对未来的结果进行想象吗?DeepMind推出新论文,描述了一类基于想象来进行计划的新方法,在不完美的环境中也同样具有高效性. 雷锋网(公众号:雷锋网) AI科技评论将其编译如下: 在行动之前想象可能出现的结果是人类认知中的一个有力工具.例如,当在桌子边缘放一个玻璃杯,我们会停下来想一想:这样稳固吗,杯子会不会掉下来.根据想象的结果,我们会把杯子的位置调一下,防止它掉下来摔碎.这种

摆脱数据困境的新方法

人们讨论大数据就像讨论青少年性行为一样! 这里有让你摆脱数据困境的新方法. -4Ps来拯救你-Platform(平台),Processes(流程),People(人),Politics(政策)"大数据就像是青少年性行为:每个人都谈论但却没人真正知道该怎么办,每个人都认为别人都在做,所以他们都说他们也正在做-- -Dan Ariely TED演讲者,畅销书的作者以及杜克大学的教授Dan Ariely说的话是对的--在当今的大数据领域中,纸上谈兵太多而实质内容太少导致了许多企业在大数据项目中的失败.

【AAAI 2018】中大商汤等提出深度网络加速新方法,具有强大兼容能力

深度网络不断地提升计算机视觉任务的性能,然而,性能提高往往却伴随着愈高的计算复杂度,这严重限制了深度网络在资源受限的平台(如手机,移动嵌入式设备等)的应用.因此,研究深度网络的加速吸引大量工作的关注.近日,中山大学.哈尔滨工业大学.桂林电子大学,香港理工大学以及商汤科技公司联合研究团队提出基于类小波自编码机的深度网络加速法.该方法首先通过一个可学习的类小波自编码机(Wavelet-like Auto-Encoder, WAE),把输入图片分解成两个低分辨率的小图,再以小图替代大图输入到深度网络,

Photoshop制作怀旧照片新方法

今天我们介绍一种Photoshop制作怀旧照片的新方法. 学习之前,我们先看看对比效果图: 首先,在Photoshop中打开一张照片. 复制一个图层备用 点菜单上的"滤镜-艺术效果-胶片颗粒",设置如下图:(这个滤镜可以让照片的表面布上一层颗粒) 执行颗粒滤镜后的效果: 选择菜单"图像-调整-去色",也可以按快捷键:Shift+Ctrl+U,将照片处理成黑白. 去色后效果: 选择菜单"图像-计算": 计算后效果:(层次感更加分明,也可以使用图像-

盘点关键词竞争度分析新方法

网站SEO优化核心工作之一是关键词的选择.我们在选择关键词的时候会考虑一些因素.但是现在随着搜索引擎的算法不断改变,将排名的权利逐渐向用户倾斜.也就是在网站排名里面越来越多的加入了用户体验的因素.导致现在就算是新站也有可能会战胜老站.今天就来介绍一些新方法进行关键词竞争度分析. 我们常见的关键词竞争度分析考虑的因素有:百度指数,搜索量,看排序中竞价网站的个数,自然排名中网站首页的个数,自然排名前十网站的质量,百度推广后台服务等等.在考虑这些因素的时候,我们会对关键词的热门程度做一个统计.分析出关

Ajax: Web应用开发的一种新方法

ajax|web   原文:  http://www.neokeen.com/mornlee/2005/02/21/1108998494781.html Ajax是什么 异步JavaScript + XML(Asynchronous JavaScript + XML)的缩写.Ajax不是某种新技术,只是几种技术的集成创新的一种新方法.其技术组成有:基于标准的表示技术: XHTML , CSS动态显示和交互技术:Document Object Model(文件对象模型)数据互换和操作技术: XML

Visual Basic.NET带来的新方法(一)

visual Visual Basic.NET带来的新方法(一) 简介 为了快速地创建企业WEB应用,开发者必须依赖可扩展,健壮的,可重用的商务逻辑.在过去的几年来,面向对象的编程方法作为一种主要的思想,适应了这种需要.用面向对象的编程语言来创建大型的系统工程,有着代码易懂,易调试,和更新迅速的优点. 为了让Visual Basic的开发人员从面向对象的设计中得益,从而简化开发企业WEB应用,整个面向对象语言的特性,包括继承,将在Visual Basic的下一个版本Visual Basic.NE

Visual Basic.NET带来的新方法(二)

visual Visual Basic.NET带来的新方法(二) 继承性 对于Visual Basic来说,对继承性的支持是最需要的.在Internet时代的开发需要快速的组建以及大规模的重用.现在,Visual Basic包含了一整套的继承性的落实,包括可视窗口的继承. 开发者可以通过一个新的关键字 Inherits 来从一个已存在的类中创建继承. Class1 Function GetCustomer() ... End Function Class2 Inherits Class1 Fun

在ASP程序中打印Excel表格的新方法

 在ASP程序中打印Excel报表的新方法 目前,B/S模式(浏览器/服务器模式)成为企业网上首选的计算模式.由于B/S模式的特殊性,在C/S下相对较易实现的Excel报表打印功能在B/S下却成为一个难点.本人通过研究写了一个基于ASP程序的打印Excel报表的程序.本程序的特点是无须任何组件.   Print.asp ------------------------------------------------ <html><title>打印Excel报表</title&