深度:机器如何模仿人类的学习方式?

古有算盘,今有计算机,人工智能(Artificial Intelligence,AI)始终是人类永恒又美好的梦想。然而,漫漫的历史长河中人类前仆后继,虽然计算机技术已经取得了长足的进步,然而仍然没有一台机器产生真正的“自我”意识。谷歌大脑认出猫和狗,阿法狗打败了李世石,智能车拉着我们去兜风……尽管深度学习(Deep Learning)让 AI 在近期取得了诸多突破,但人工智能始终还是离不开“人工+智能”,离不开大量的人工标定数据去指导智能系统的学习。

ImageNet,COCO,Places,我们为了智能而不断人工,为了一劳永逸而不断地标定数据。然而,这并不是人类的最终梦想——不劳而获。直到 Science 封面文章 Bayesian Program Learning(BPL,《Human-level concept learning through probabilistic program induction》),像人类一样学习的人工智能又引爆了人类曾经的梦想,Google DeepMind 的新成果 Memory-Augmented Neuaral Networks(MANN,《One-shot Learning with MemoryAugmented Neuaral Networks》)让梦想又朝现实迈进了一步。  

懒惰是人类社会进步的原动力,单点学习(One-Shot learning)的目标是不劳而获。不同于传统机器学习方法需要大量数据去学习和反复的训练,One-Shot 通过单一的训练样本去学习并做出准确的预测。然而,One-Shot learning 是一个永恒的挑战。由于现有的机器学习模型参数量庞大,小样本下很难在巨大的搜索空间中找到刻画本质属性的最优解。

因此当遇到新的任务(Task)时,传统学习算法只能通过新任务的大量样本低效率地去调整(finetuning)原有模型,以保证在杜绝错误干扰(Catastrophic Interference)的情况下将新信息充分涵括。BPL 从认知科学的角度,基于贝叶斯过程模拟人类学习思路;MANN 从神经科学的角度,基于记忆神经网络构造仿生学习模型。相比于贝叶斯过程学习(BPL),记忆增强神经网络(MANN)将 One-shot Learning 从应用驱动型推向数据驱动型从已有数据出发去主动挖掘One-shot Learning的方法。通过关注存储内容的外部记忆机制快速吸收新知识,并且仅利用少数几个例子就可以从数据中做出准确预测。 

一、人的学习—记忆与学习(Memory & Learning)

从神经科学的角度来说,学习(Learning)定义为将经验(Experience)编码进记忆(Memory)的过程。鱼的记忆只有 7 秒,没有记忆的学习不是智能,鱼永远是只能在水里游的鱼。学习形成了不同类型的记忆:形象记忆(以感知过的事物形象为内容),情绪记忆(以过去体验过的情感为内容),逻辑记忆(是以概念命题为内容),动作记忆(以操作性行为为内容)……记忆指导学习,学习增强记忆。人类从刀耕火种,婴儿从呱呱落地,“学习→ 记忆→学习”贯穿着社会与个体。对于社会,古书典籍让经验得到记忆;对于个体,大脑皮层让知识得到记忆。           

人的学习过程中(如下图),大脑对外部环境进行感知,注意机制对感兴趣的信息保持关注;在工作记忆中,新知识在旧知识的基础上通过检索被快速建立起来;而后经过神经元的加工整理,形成难被遗忘的长时记忆。由此,人不断地从生活经验中建立并整合知识,从而学会处理日益复杂的任务。在持续不断的学习过程中,对以往知识检索利用,使得人们只需要少量的训练就能快速地学会新的任务。综上,一个真正的智能系统应具备以下两方面的作用:

(1)在长时记忆系统中建立一个可检索的知识库;

(2)在交互过程中持续不断的整合更新知识库。

二、MANN——学会学习(Learning to Learn)

埃德加•福尔在《学会生存》中指出:“未来的文盲不再是不认识字的人,而是没有学会怎样学习的人 。 ”学会学习(Learning to Learn)不仅仅是教育界面临的问题,也是机器学习中面临的问题:未来的智能不再是能干活的机器,而是学会怎样学习的机器。“学会学习” 中的“学习”即为元学习(Meta-learning)。行为学意义上认为元学习是学习行为本身的改变;信息学意义上认为元学习是关于获取知识和经验的学习。人工智能意义上的元学习一般指的是一种迁移学习(Transfer Learning)方案,通过已有的知识辅助新知识的学习,照着葫芦画瓢,照着猫画老虎。可规模化的元学习方案应满足以下两个要求

(1)知识必须以稳定且可寻址的方式存储;

(2)存储容量不与参数规模相关。  

长短时模型(Long Short Term Model,LSTM)通过隐性的共享记忆结构,不完全地实现知识的存储。直到了神经图灵机(Neuaral Turing Machine,NTM)的出现,NTM 引入带记忆的神经网络去模拟大脑皮质的长时记忆功能,实现用极少量新任务的观测数据进行快速学习。不同于传统神经网络,NTM(如下图)通过控制器(Controller)对输入输出(Input/Output)向量进行选择性地读写(Read&Write Heads)操作,实现与外部记忆矩阵(Memory)进行交互。基于强泛化能力的深度神经网络架构,并综合长时观测的记忆模型与新观测的匹配信息对存储内容进行有效地更新。

 

相比于神经网络图灵机,记忆增强神经网络(MANN)提出了一种新读写更新策略——LRUA(Least Recently Used Access)。有别于 NTM 由信息内容和存储位置共同决定存储器读写, MANN 的每次读写操作只选择空闲或最近利用的存储位置,因此读写策略完全由信息内容所决定。这种更为灵活的读写策略更适用于时序无关的分类回归问题。MANN 结合了更灵活的存储能力和强泛化的深度架构,实现知识的更为高效的归纳转移(Inductive transfer)——新知识被灵活的存储访问,基于新知识和长期经验对数据做出精确的推断。

三、终极理想——终身学习(Life-long Learning)

活到老学到老,人的一生是学习的一生。终身学习(Life-long Learning)是一种能够存储学习过的任务知识,并能利用旧知识快速学习新任务的完整系统方案。相较于传统机器学习方法,终身学习凭借任务间的知识共享和知识库的知识积累,突破了学习过程在样本集和时间上的限制,为实现高效及高度智能化的系统提供可能。 

一个终身学习系统包含以下基本组成部分,各模块间的相互作用共同实现“活到老学到老”。

(1)知识仓库(Memory)

记忆是智能的基础,终身学习系统期望充分利用已学过的知识辅助学习。知识仓库用于存储学习过程中需要长期存储的知识。其中可分为基础知识和抽象知识两类,分别支持知识从简单到复杂的纵向迁移,以及相关任务之间知识的横向迁移。

(2)任务队列(Controller)

任务队列考虑知识的学习顺序对系统的泛化能力与学习代价的影响。学习顺序设置对学习有着重要的影响,因此终身学习系统期望合理设置学习顺序以越快越好地进行学习,循序渐进,抛砖引玉。此外,高效的任务队列也为终身学习系统提供主动学习的可能,系统可以主动优先学习对关键任务。

(3)知识迁移(Read)

知识迁移是终身学习系统的基础。知识迁移从知识仓库中选择对新知识(目标领域,Target Domain)有帮助的旧知识(源领域,Source Domain)进行迁移。因此要求终身学习系统应具备有效度量并创造正迁移条件的能力,充分利用已经学到的任务知识,尽可能高效地学习新任务——迁移什么?如何迁移?何时迁移?

(4)知识整合(Write)

知识整合是终身学习系统中至关重要的环节,以保证知识仓库能得到及时的更新。取其精华,去其糟粕,知识在整合过程中,系统应对知识进行相应的筛选,在兼顾不损害原有知识的前提下,尽可能整合有利于迁移的新知识。

学海无涯,活到老学到老。人工智能之路漫漫,吾将上下而求索。

参考文献

[1] Santoro A, Bartunov S, Botvinick M, et al. One-shot Learning with Memory-Augmented Neural Networks[J]. arXiv preprint arXiv:1605.06065, 2016.

[2] Lake B M, Salakhutdinov R, Tenenbaum J B. Human-level concept learning through probabilistic program induction[J]. Science, 2015, 350(6266): 1332-1338.

[3] Graves A, Wayne G, Danihelka I. Neural turing machines[J]. arXiv preprint arXiv:1410.5401, 2014.

[4] Ruvolo P, Eaton E. ELLA: An Efficient Lifelong Learning Algorithm[J]. ICML (1), 2013, 28:507-515.

本文作者:蔡博仑

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-09-20 02:27:34

深度:机器如何模仿人类的学习方式?的相关文章

马云对话创业者:我不喜欢人工智能,机器应做人类做不到的事

3月23日下午,阿里巴巴董事局主席马云受邀在马来西亚环球转型论坛(GTF)演讲,与近3000名来自20多个国家的创业者和年轻人交流. 马云说:"我们无法选择出生在怎样的家庭,如果你碰巧出生在比尔?盖茨家族,你很幸运.当然这不可能.但我们可以决定我们死在何处.以何种方式死亡.如果你想死在监狱里,很简单.如果你想去世时有很多朋友,你必须交到很多朋友,你必须改变你的性格.价值观." 博尔特要马云和他来张自拍. 图片来源:博尔特Twitter 曾是英语教师的马云很擅长给年轻人忠告,马云自称&q

机器在俯视人类,是我们的希望还是恐惧?

免费开通大数据服务:https://www.aliyun.com/product/odps 你看过"I,Robot"这部电影吗?如果你看过,是不是还记得这样一个场景:当警探史普纳进入庄严威武的USR公司时,公司大厅那个巨大的俯身凝视人类的机器人塑像?谈到 "I,Robot"观感时,有人使用了"不寒而栗"这个词,"感觉到发自脊背的寒意". 好在,它只是一部电影. 当时光进入2017年,Master连挫中日韩,包括柯洁.李世石.古

《中国人工智能学会通讯》——11.24 本文的出发点:模仿人类视觉

11.24 本文的出发点:模仿人类视觉 表 1 列出了人类视觉系统实现视觉物体分割所依赖的能力及素材,以及计算机与之对应的能力和素材.可以看出二者之间具有很强的可类比性,因此,本文考虑借鉴人类视觉系统的成功经验来指导计算机实现视觉物体的分割.由于表1中前三种能力不能直接得到语义级的物体分割,我们将主要关注后面几种能力及其对应的素材.对于人来说,运动感知需要持续一定时间的序列视觉信号,计算机与之对应的能力是光流估计,而所需要的素材为视频.视差感知则需要两只眼睛同时有视觉信号的输入,计算机与之对应的

[译]深度学习:模仿人脑还是完善应用

近期,机器学习领域专家们关于深度学习的一些言论引起了极大的轰动.同时,关于深度学习的开创性和整体架构也在学术界引发了相当的讨论.伴随着人工智能开始进入进一步开发应用阶段,人们意识到它的成功与否完全取决于其实用性. 星期二,我和IBM沃森研究中心的副总裁John Gordon先生有过一次半个小时的专访.在专访中,Gordon先生从始至终都不认可人们对人工智能系统"沃森"的预期和它实际能做什么之间存在相当的差距.虽然在我和Gordon先生之间存在必然的误解,但很明确的一点是:Gordon先

AI模仿人类笔迹,汽车失控,属于黑客的舞台战斗不息

灯光.音响.升降机.闪光灯,上海喜马拉雅艺术中心大观舞台上承载过数不清的电影节.音乐剧.话剧戏曲.舞蹈.时尚秀场,而今天,这束灯光给了聚集在台上的一群黑客. "骗过"人脸识别门禁."偷走"独一无二的声音.破解 iPhone 8"盗"照片,10月24日,GeekPwn2017(极棒)大赛的上午场精彩连连,而下午的挑战赛也不遑多让,甚至更加刺激. 芥川龙之介曾说过,不要忘记人生是要战斗到死,而极棒的舞台则上演着一出不落幕的战斗. 我用它看着喵,他用它

计算机首次通过图灵测试 机器将具备人类智能

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 今天图灵测试 2014 的举办方英国雷丁大学发布新闻稿,宣称俄罗斯人弗拉基米尔·维西罗夫(Vladimir Veselov)创立的人工智能软件尤金•古斯特曼(Eugene Goostman)通过了图灵测试.如果这一结论获得确认,那么这将是人工智能乃至于计算机史上的一个里程碑事件. 图灵测试是由现代计算机科学之父英国人阿兰•图灵 65 年前提出

快还不够:模仿人类交流才是数字化沟通的关键

信息技术极大地提高了市场化社会的繁荣程度,但这是有代价的,线上交谈损害了其他更具丰富内涵与意义的沟通方式.不管接受与否,我们如今的沟通方式与我们本原的.与生俱来最擅长的那种沟通方式已经不同步了.如果我们想改善数字化沟通,我们得首先了解人类是如何交流的. CHEAP WORDS 你有没有过在微信.微博.Twitter上开个玩笑结果被喷的经历?他人不能理解你暗藏的幽默嘲讽或是睿智,就算你用上了表情符号也于事无补.网络的闸门已经打开,人类的沟通方式已经被彻底改变,面对面的接触.实时的通话被电子邮件.短

机器流量超过人类流量,主导整个互联网?

 茫茫人世间,你我如同沧海一粟,如果哪天当你环顾四周,发现身边半数都是机器人,你是否会吓一跳?这一切如今虽然尚未发生在现实世界,但在互联网世界里,你我的四周充斥着"机器人"过往的痕迹. 互联网安全公司 Imperva 对全球10万个域名的网站访问进行分析,发布了一份<2016年机器流量报告>(Bot Traffic Report 2016).称全球范围内约 52% 的互联网流量来自"机器人"(bots),这里机器人指的是自动化程序.也就是说,许多网站大部

人工智能居然会模仿人类品酒

<机器学习实践应用>作者傲海,手把手带领大家在机器学习PAI上,体验各种酒的口感,完成整个机器"品酒"的过程,内容包含:如何上传数据.如何做数据预处理.如何分类.如何评估四个部分,全程在线实操,并产出结果. 1.下载酒水的相关数据,地址:并上传到MaxCompute的表中:(数据为csv格式,不要用excel打开,否则不能使用) 数据下载地址:http://pai-shanghai-test.oss-cn-shanghai.aliyuncs.com/wine/winequa