DeepMind提出SCAN:仅需五对样本,学会新的视觉概念!

雷锋网 AI科技评论按:DeepMind实验室发布名为符号-概念联合网络(Symbol-Concept Association Network,SCAN)的新型神经网络模型,可以让计算机模仿人类视觉和词汇获取的方法,通过重组学到的概念,来想象新的概念。

以下为雷锋网 AI科技评论根据DeepMind实验室发布内容编译。

大约二千五百年前,一个美索不达米亚商人收集了一些粘土、木材和芦苇,随着时间的推移,通过这些材料,他们发明了算盘,能够在商品交易过程中记录货物数量、理清资产,这带动了经济的蓬勃发展,也改变了人类社会。

那一刻的灵感也照亮了人类另一个惊人的能力:重组现有的概念,想象出全新的东西。不具名的的发明家思考他们想要解决的问题,建造奇妙的装置,收集原材料来创造新的东西。粘土能塑造成算盘的框架,棍子能用来把算珠串起来,芦苇可以编成算珠。算盘的每个组成部分都很常见,也各有区别,把他们用这种新的方式组合在一起,就出现了革命性的创造。

组合的思想是诸如创造力、想象力和语言表达等能力的核心。脑海中只要有少量熟悉的概念性模块,我们就能创造出大量新东西。我们将概念从具体到一般进行归类,形成不同层次,然后用新的方式重组层次里的不同部分。这种方式对我们来说很自然,但要将其应用于AI研究还是个挑战。

在DeepMind的新论文中,提出了一种新的理论性方法来解决这个问题。此外,他们还展示了一种称为符号-概念联合网络(Symbol-Concept Association Network,SCAN)的新型神经网络模型,这是首次通过模仿人类视觉和词汇获取的方法,学习自下而上的视觉概念层次,从而能够通过语言指令想象出全新的概念。

他们的方法可以总结为以下几点:

  • SCAN模型在视觉上与婴儿在出生前几个月看到的世界类似。这段时期,婴儿的视线仍无法集中在半米以外的东西上,他们成天都在观察各种映入眼帘、移动和旋转的物体。为了模拟这个过程,他们将SCAN模型放在DeepMind实验室的模拟3D世界中。在那儿,模型就像是婴儿躺在婴儿床上一样,不能移动,但可以转动头部,并观察在各种不同颜色的背景下可能呈现在他面前的物体,例如帽子、行李箱或冰棍。和婴儿的视觉系统类似,这个模型会学习视觉世界的基本结构以及如何用可表述的视觉特征来表示物体。例如,当看到苹果时,模型将会学习根据其颜色、形状、大小、位置或明暗来表示它

图:SCAN模型依据物体的个体区分、颜色和旋转、墙壁颜色、地板颜色等可表述的视觉特征等来学习,去表示视觉场景。

  • 一旦模型能够根据可表述的视觉特征来解析世界,就进入学习过程中的命名阶段。这相当于婴儿的单词学习,大人开始为他们看到的各种东西提供单词符号标签。例如,在这个阶段,父母可能指着一个苹果对孩子说:“看,一个苹果!”同样的,对SCAN模型输入基础语言之后,它的经验也在增强。一张黄色墙壁背景下红色行李箱的图像将伴随着“红色行李箱、黄色墙壁”这样的符号输入。SCAN模型能够通过在前一阶段学习的视觉特征来构建抽象概念,进而学习新的概念。例如,苹果的概念可以根据其颜色、形状和大小来说明,而诸如位置和明暗等其他视觉特征则会被认定为与其无关。
  • 命名阶段可以从任何层次学习视觉概念,同样也可用于向模型教授“和”、“忽略”和“共同”等这些概念重组操作,这种教授是通过向模型展示如何正确使用这些操作的例子来实现的。例如,“和”的意思可以通过向SCAN模型展示一张金冠苹果的图像,同时伴随“金冠苹果是黄色的和苹果”
    这样的指令来训练。
  • 一旦SCAN模型学习了一定数量的概念词汇,并学会通过符号性的指令来处理它们,它就能在词语形式的指示下,将常见的概念组合成新的概念,而不需要更多的图像作为例子。通过这些指令,SCAN可以想象出大量新的视觉概念,如蓝苹果(“蓝色的和苹果”)或不同种类的苹果(“澳洲青苹是金冠苹果,忽略黄色,和绿色”)

图:首先,SCAN模型通过语言指令连接概念层次——从“蓝色房间、红色地板、白色行李箱”这种具体的概念,到“行李箱”这种普遍的概念,再回到“黄色房间、粉红色地板、绿色行李箱“这种具体的概念。在每一步SCAN系统都会被要求想象出相应的概念(如图右所示)。最后,向它指示一个新的概念——“woog”。虽然从没看到过“woog”的例子,SCAN系统能成功地想象出它们看起来是什么样的(黄色房间、粉红色地板、绿色物体)。

  • 他们的方法不同于以往的研究,因为它完全基于感官数据,只需要从非常少的图像—词汇对中学习。当其他的深度学习方法需要数千个图像示例来学习一个概念时,SCAN模型通过非监督观测,学习视觉特征和抽取概念,只需五对图像—标签对就可以学会一个概念。一旦训练好了,SCAN模型就可以生成与特定图像相对应的各种概念,并且可以想像出与特定概念相对应的多种可视化示例,即使它以前从未见过此类概念。

图:图中左边是SCAN模型设想的“白色行李箱”的图像,右边是SCAN模型从“粉色房间、橙色地板、青色帽子”这张图像上产生的概念。

通过符号指示,来重组现有的概念,学习新概念,这赋予了人类惊人的能力,使其能够解释诸如宇宙、人文主义或美索不达米亚经济案例中的抽象概念。在成功实现这些概念性的飞跃之前,算法还有很长的路要走。他们的这项研究朝着算法的飞跃前进了第一步,即让算法在很大程度通过无监督的方式学习,就像人类一样思考,进行概念抽取。

via DeepMind Research Blog

雷锋网(公众号:雷锋网) AI科技评论编译。

本文作者:思颖

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-21 21:33:02

DeepMind提出SCAN:仅需五对样本,学会新的视觉概念!的相关文章

仅需五年,中国无人零售店市场交易额将达万亿以上,用户规模接近2.5亿

"无人零售"的模式本质上并不新鲜.1895年在德国柏林就诞生了世界上第一台自动售货机Quisisana.移动支付.物联网和人工智能则让自动售货不再局限于一台机器,而是面积更大的便利店,所能够提供的商品和触达的用户场景也更多.自从亚马逊推出Amazon Go以后,各路资本竞逐无人零售店.在中国,也有十数家无人零售店在各大城市崭露头角.到底这一新兴的零售形式在中国发展如何,前景又几何?雷锋网(公众号:雷锋网)结合艾瑞咨询咨询近日发布的<中国消费者无人零售行为研究报告>.易观&l

100%移植阿里云移动测试技术,竟仅需1周?! ——移动测试专有云(1)

移动设备大量涌现,终端类型浩如烟海,任何一款设备的兼容性问题都将导致大量用户流失! 移动终端的配置千差万别,碎片化严重又导致APP的全机型适配成本巨大且异常困难! 不仅如此,有一些企业和开发者还面临着以下问题: 安全生产要求 测试数据严禁外泄,使用公有云平台存在数据泄露风险.某些测试包依赖本地网络 . 缺少自动化测试技术经验 搭建一套自动化测试平台成本巨大,对自动化测试的技术深度要求高. 缺少移动机房搭建经验 移动机房不像传统机房,对机房环境有着更加苛刻的要求,运维难度大. 测试终端管理混乱,资

翻新iPhone4仅需半小时利润达700元

去掉胶水印迹安装数据线拆分旧机零件组装金属中枢完成翻新熊女士(左)表示将维权到底手机被经销商提前激活,导致她无法下载软件 果粉们(苹果产品用户)都知道,iPhone 4手机使用前必须激活,方可享受自激活日起一年内的保修服务.然而,市民熊女士本月8日买的iPhone 4,却已被店方拆掉封装提前激活了4个月.店方把它重新封装后卖给熊女士,却不告知真相. 昨日,熊女士来到手机销售商.位于高新区渝州路156号的某知名通讯歇台子营业厅,向该店店长讨真相. 店方承认4月前激活手机 自称用于给店员演示功能 熊

达芬奇踢爆高端家具业潜规则30万的床仅需3万

第1页: 达芬奇踢爆高端家具业潜规则第2页: "原装进口"的达芬奇家具:30万的床仅需3万 达芬奇踢爆高端家具业潜规则 坚称产品原装进口达芬奇要起诉东莞长丰 虽然产品被曝贴牌生产.质量不过关,并涉嫌伪造产地,但是,在昨日接受记者采访时,达芬奇家具股份有限公司(下称"达芬奇")上海总部销售主任苗刚仍坚称,公司在国内销售的意大利品牌家具均为意大利生产并原装进口.他同时表示和东莞长丰家具有限公司(下称"东莞长丰")没有任何关系,并将为此起诉东莞长丰.

领悟网站优化核心仅需三要素

网站优化一直都是具有争议性的热门话题,有些站长朋友会认为网站优化无非就是内容优化与外链发布,但网站优化真正的核心却是在于内部结构的优化,俗话说:工欲善其事.必先利其器,把网站内部结构优化好,那么做起网站优化来就事半功倍了. 一.程序选择篇 1.适合自己的才是最好的 对于网站程序来说也是相同的道理,程序即使再强大,自己对它不了解.不熟悉也是白搭,反而网站程序的功能虽然简单,而自己对它却是了如指掌,使用起来得心应手,那才是自己应该选择的网站程序. 2.程序语言需符合搜索引擎 对搜索引擎友好的网站程序

英汉互译仅需2步 WPS Office翻译功能

现代社会,日常办公中经常会接触到英语,"这个单词是什么意思?","这个词翻译成英语怎么说?"是我们经常遇到的问题.您会怎么解决?抱起一本词典翻出答案还是购买一套翻译软件?投入的金钱不说,费时费力又不一定满意,还可能引起兼容性问题.使用WPS Office 2005,这些烦恼您都可以抛诸脑后! WPS Office 2005无缝整合金山词霸在线翻译功能,免费为用户提供强大的英汉互译的解决方案! 图1 WPS Office 2005无缝整合金山词霸在线翻译功能 立刻开始

未来大数据存储:1PB仅需一张光盘

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;     以后数据存储无论个人用户,抑或不同规模的企业政府机关等,都可更加轻松地进行.来自斯威本科技大学(SwinburneUniversityofTechnology)的研究团队负责人MinGu教授最新开发出了一种全新的数据存储方式,可将1PB(1024TB)的数据存储到一张仅DVD大小的聚合物碟片上. 大数据存储在当今世界已经显得尤为必要,而且我们人类自步入数字时

山寨上网本1300元叫卖 上游工厂仅剩下五六家

本报记者 黄乔 深圳报道经历一番大浪淘沙式洗牌后, 山寨上网本的价格再创新低.日前,从深圳山寨厂传出消息,主流10.2寸 山寨本已公开杀至1300元的低价.另外,伴随大批山寨厂商和下游渠道商的退市,目前深圳山寨上网本工厂已仅剩下五六家.价格逼近1300元与6月份价格跌破1600元相比,日前,记者在深圳华强北市场看到,不少山寨上网本的价格已直逼1300元大关.以山寨上网本经典机型S30为例,市面公开打出的零售价为1380元,一些山寨主甚至杀至1350元的低价.而该款机型的制造成本在1330-135

Godaddy经济型主机仅需12美元一年

3月开春,市场打折促销活动纷纷登场,http://www.aliyun.com/zixun/aggregation/29826.html">Godaddy作为享誉国内外的大牌主机商,为抢滩市场更是大力出击,推出囊括经济型.豪华型.无限型等诸多强势品牌的大范围主机促销,在诸多促销中,最引人注目的当属12美元一年的经济型主机促销,此促销除了优惠之外还有域名赠送. 同时据了解,此经济型主机促销截止日期是4月1日,距离此优惠期到来现在大概只有一个星期的时间,我们知道,虽然Godaddy主机优惠比较