李飞飞团队最新跨界研究:神经任务编程NTP,让机器人具有强大泛化能力

9月26日,在温哥华举行的IROS大会上,计算机视觉专家、斯坦福AI Lab&Vision Lab主任李飞飞做了“A Quest for Visual Intelligence”的演讲,这也是李飞飞首次参加IROS这一机器人为主题的大会。值得注意的是,近日雷锋网在Arxiv发现了一篇讲述新型机器人学习框架的论文《Neural Task Programming: Learning to Generalize Across Hierarchical Tasks》,该论文的主要作者来自于斯坦福,其指导教师正是李飞飞及其丈夫Silvio Savarese。这也标志着人工智能和机器人两个社区在视觉与感知方面的重合度越来越大,之后的合作也会越来越紧密。

下面雷锋网和大家来一起看这篇论文。

摘要: 在本论文中,我们提出了一种名为神经任务编程(NTP)的新型机器人学习框架,该方法可以通过较少的示范和神经程序引导进行学习。NTP可将输入的规范性任务(例如任务的视频演示)递归地将其分解成更精细的子任务规范, 这些规范被传递到分级神经程序,通过可调用的底层子程序是与环境进行交互。同时,我们在三个机器人操纵任务中验证了我们的方法,在试验中,NTP展示了在显示分层结构和组合结构的顺序任务的强泛化能力化。 实验结果表明,NTP在学习长度不定、可变拓扑和不断变化的未知任务的学习和拓展有较好的效果。

背景

自越来越强调“人机协作”的今天,机器人通常在某些特定环境中与人进行长时间的交互,如物体分类、装配、和清理等。但是以往的机器人通常需要在固定的场景下才能与人交互,如何让机器人能适应复杂的操作任务、新的任务目标和周围环境,则是机器人技术中的一个重大挑战。

设想一个仓库中的物体分类任务,这通常包括分类、检索、打包等具体任务,每个任务又可以分解为若干个动作,如抓取、移动、放下等,这些动作构成了如抓取和放置等子任务,如果在考虑到不同的对象、排序、子任务的排列组合,当中的变化将会非常复杂,例如,将四类物品分类放到四个容器中,这当中的组合会有256中之多。本文中,我们希望解决复杂任务规划的两个主要挑战,即a)从新的概念化到新的任务目标的学习策略,以及b)与长期环境交互的基本原生代码模块的组合。

神经任务编程(NTP)原理

NTP的关键基本思想在是跨任务学习和与共享域中的可重用表示。NTP对一个描述任务过程和最终目标时间序列的任务规范进行解释,并将其分层策略实例转化为一个神经程序。NTP从输入规范中解码生成任务目标,并将其分解为子任务并与周边环境进行交互和反馈直至搭成目标,每个程序调用环境观察和任务规范(输入),并输出下一个子程序和相应的子任务规范。

如上图所示,在给定输入、任务规范和当前环境的情况下,NTP模型预测需要运行什么样的子程序,并作为下一级子任务的输入,并判断当前程序是否结束,否则将继续循环执行任务 。

测试

该研究团队通过对模拟和实际机器人实验中的单臂操作任务模拟对NTP进行评估。任务包括:堆叠方块,目标分类和清理桌子。

该研究的两个目标:I. 在同一个域中学习多项任务;以及 II. 通过单一例子形成在测试中的泛化能力。

如图所示,机器手可从模拟的Demo环境(包括图像、视频、VR输入)中进行学习并完成积木的堆叠;

NTP编程:通过分级的任务条件输出策略归纳程序,调用Robot API进行操作。

上图展示了在堆叠方块任务中 NTP 的样本执行轨迹图。任务是按指定要求堆叠字母块,顶层程序作为输入参与整个演示,预测下一个运行的子程序,并为特定输入作为指定任务的一部分,底层 API 调用机器人作出相应的动作(如Move_to(Blue)、Grasp(Blue)等)。当程序结束符(EOP)为 True,当前程序停止并返回其调用程序。

如果环境发生变化(如人为破坏已完成的任务),机器人会探测到环境的变化并重复任务。

任务结构的变化包括:改变完成条件(任务语义),可变子任务排列(任务拓扑)和更大的任务量(任务的长度)。随着任务数量的增加,NTP可以为新的任务师范及目标生成更好的结果。

完整演示视频见:

  

类似的研究还有雷锋网之前介绍过的BAIR《One-Shot Visual Imitation Learning via Meta-Learning》的论文,都是通过一次性学习形成的泛化能力让机器人快速掌握新技能。相比之下,BAIR的论文更偏于算法的迭代改进,而Visual Lab的研究则从任务结构出发提出了一种新的学习框架。雷锋网(公众号:雷锋网)认为,虽然李飞飞团队之前的研究更多是在计算机视觉领域,但正是如此,才有可能从机器人领域研究者习惯的视角外去思考问题,这篇论文提出的新思路也值得机器人研究者注意。

本文作者:岑大师

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-11-18 10:27:54

李飞飞团队最新跨界研究:神经任务编程NTP,让机器人具有强大泛化能力的相关文章

本次CVPR上,李飞飞团队都中了哪8篇论文? | CVPR 2017

CVPR是IEEE一年一度的计算机视觉与模式识别技术会议,也是计算机视觉的世界三大顶会之一.2017年的CVPR会议将于7月21日到26日于夏威夷Convention中心召开,雷锋网将赴前线做覆盖与报道. 李飞飞就职于斯坦福大学计算机科学系,目前为斯坦福大学人工智能实验室.斯坦福视觉实验室.丰田汽车-斯坦福人工智能研究中心负责人,同时也是Google云端人工智能暨机器学习首席科学家. 本次CVPR上,李飞飞团队共有8篇论文成功入选,以下是CVPR 2017 Li Fei Fei作为作者的论文摘要

李飞飞最新演讲:视觉智慧是人类和计算机合作沟通的桥梁

本文讲的是李飞飞最新演讲:视觉智慧是人类和计算机合作沟通的桥梁, 中国计算机学会 CCF 举办的中国计算机大会CNCC 2017已于10月26日在福州市海峡国际会展中心开幕.参加会议的人数众多,主会场座无虚席.雷锋网 AI 科技评论也派出记者团全程参与大会报道. 26日上午开幕式结束后,多位特邀嘉宾进行了现场演讲,主题涵盖计算机科学发展中的新技术和应用.自然语言利净额.AI如何服务于人.人工智能在信息平台的应用等等.斯坦福大学副教授.谷歌云首席科学家.机器学习界的标杆人物之一的李飞飞进行了题目为

李彦宏坐镇《最强大脑》,一次与众不同的跨界

中介交易 SEO诊断 淘宝客 云主机 技术大厅 按:1月3日,2014年首个周末,卫视台开始收视率大战,湖南卫视<我是歌手>,江苏卫视<最强大脑>都有意思.<我是歌手> 亮点是京东广告,<最强大脑>亮点是百度李彦宏,近期比较闲散,看电视,做点与互联网有关的点评. 去年开始,互联网大佬都流行跨界,最近百度创始人李彦宏重磅加盟了国内首档科学真人秀节目<最强大脑>.当然,李彦宏的跨界却与之前大佬的跨界不同,找到了属于自己的独特跨界方式--纯技术范儿.我

京东联手斯坦福 AI 实验室发布联合研究计划,Manning、李飞飞代表签约

美国当地时间11月27日,京东集团宣布与斯坦福人工智能实验室(Stanford AI Lab)发布AI联合研究计划(SAIL-JD AI Research Initiative),京东集团CTO张晨,CHO&GC隆雨,AI平台与研究部负责人周伯文.Y事业部负责人于永利等参与了签约仪式并参与酒会.  签约仪式:斯坦福大学Christopher Manning教授和李飞飞教授等出现在现场 据介绍,京东自今年5月开始与斯坦福人工智能实验室就AI领域的合作研究开始初步沟通,历经数次拜访与磋商,多个技术团

李彦宏:在跨界的地方找寻创新

9月9日,未来科学大奖颁奖典礼在京举行.百度创始人李彦宏作为捐赠人出席,并颁发了"生命科学大奖".在谈及选择捐赠生命科学大奖的原因时,李彦宏给出了两个字:"跨界".  据悉,在2016年未来科学大奖成立之初,李彦宏就作为捐赠人参与到了其中,并且还拉上了马化腾等其他企业家一道.作为一个学计算机出身的IT男,李彦宏选择资助"生命科学大奖",让不少人感到费解,但李彦宏表示,"很多创新是在跨界.跨学科,是在很多领域交叉的地方出现的".

深度学习理论研究已进入瓶颈期?看看李飞飞们怎么说

AI圈推特红人,Keras框架的作者François Chollet又搞大新闻了!近日François Chollet在推特上发推称:"深度学习研究已经进入了瓶颈期.将深度学习应用于解决现实生活问题的应用正在迎来一个大爆发." 这条推特下很快获得了上千个赞.数百转发,以及一系列热烈讨论.从回复中看,不少回复者(尤其是产业界人士)认为,"深度学习进入平台期"的提法值得商榷,雷锋网节选了其中几条: Buzzfeed首席数据科学家.哥伦比亚大学客座助理教授Adam Kel

文睿研究:音乐厂商跨界游戏开发运营

网络游戏和网络音乐是数字娱乐中应用最广泛的两类应用,所拥有的用户数量巨大.据文化部发布的数据表明,2010年,中国网络游戏用户总数突破1.2亿人,在线音乐总体用户规模已达到3.6亿.近几年,音乐和游戏不断融合,音乐游戏已经成为网络游戏的一个重要题材和类型,在网络游戏盈利的不断刺激下,一些音乐厂商开始跨界,涉足游戏的开发和运营工作. 文睿研究中心认为,国内音乐厂商跨界开发和运营游戏的模式主要有以下几种: 第一种:音乐游戏合作开发模式. 这类代表企业有国内唱片,如公司海蝶音乐,正版音乐服务网站,如巨

NIPS 2017:与李飞飞、哈萨比斯、Ian Goodfellow等7位大牛面对面

我现在在斯坦福大学攻读人工智能博士,师从斯坦福人工智能实验室主任.现谷歌云首席科学家李飞飞教授.这是我第一次参加NIPS会议.今年的NIPS不仅热度上达到历史峰值,内容和活动上也异常精彩.NIPS上听到的演讲和遇到的人物,很多都和我研究人工智能的心路历程直接相关,所以有不少"相见如故"和"感慨万千"的瞬间和大家分享. 我第一天一早6点45分就到会场门外了,排在签到队伍的第一个,没想到转身一看,紧接着排在我后面的居然是Yoshua Bengio大神.我之前就听说了他老

皇台酒业蹊跷“跨界”:亏损扩大急融资

皇台酒业(000995.SZ)从去年下半年开始的业绩下滑势头并未止住.7月15日,皇台酒业最新公布的业绩预告为亏损约480万元,相比上年同期,业绩下滑幅度高达717.02%.就在2013年上半年,皇台酒业的亏损还仅为58.75万元.2013年年报显示,公司营业收入只有1.08亿元,亏损高达2930万元.就在白酒行业深陷寒冬之际,皇台酒业貌似在谋求通过产业多元化改善业绩.6月19日,皇台酒业发布公告称,公司拟与穆拉德企业集团有限公司(下称"穆拉德集团")共同投资设立中外合资经营企业穆拉德