Geffory Hinton:深度学习进入平台期?不,深度学习需要的是“推倒重来”

一个星期前由François Chollet在Twitter上引发的“深度学习是否进入平台期”的讨论,因为大神Geffory Hinton的参与达到了高峰。

Hinton:深度学习可能需要“推倒重来”

据科技媒体Axios报道,上周三在多伦多举行的一个AI会议上Hinton表示,他现在对反向传播算法“深感怀疑”。这一算法是用来训练人工神经网络的常见方法,该方法计算对网络中所有权重计算损失函数的梯度。这个梯度会反馈给最优化方法,用来更新权值以最小化损失函数。值得一提的是,Hinton本人是反向传播算法的早期提出者,1986年,Hinton在一篇论文中首次将反向传播算法引入多层神经网络训练。

尽管在这次会议上,不少参会的科学家表示在人工智能的未来反向传播仍处于核心地位,但Hinton的发言一锤定音:可能会有全新的方法推出。Hinton在现场引用普朗克的名言称:“Max Planck 曾说:‘科学之道,不破不立。’未来取决于对我所说的一切持怀疑态度的那些研究生。”他还表示,如果要让深神经网络变得更聪明,即向无监督学习过渡,“这可能意味着要彻底放弃反向传播。

这一观点在Twitter上引起了广泛讨论,Pedro Domingos、李飞飞等多人纷纷转发。在李飞飞转发的Twitter上,雷锋网(公众号:雷锋网)注意到,前几天的“few tools lives enternity”已经悄然变成了“no tool is eternal”,Hinton这一观点对AI研究者的震撼之大可见一斑。

众所周知,从Hinton于2006年在Science杂志上发表《Deep Belief Networks》的论文开启了深度神经网络的新时代。十余年来,基于Hinton及众多先驱提出的深度学习理念框架,深度学习在有监督学习上取得了一定的突破,但同时也暴露出了一定的技术局限,如数据需求大、环境适应弱、可解释性差、性能差异大、数据分享难等。不少研究者认为,人工智能的下一步发展有待于在无监督学习领域的进一步突破。

如何破局?Hinton提出Capsule

Hinton近日对其在2011年的一篇论文《Transforming Auto-encoders》提出的Capsule概念重新进行了思考及完善,关于Capsule的最新论文《Dynamic Routing Between Capsules》目前已被NIPS 2017接收,目前这篇论文并未正式发表,但我们还是可以从Google Research Blog发表的论文摘要以及部分提到了Capsule的Slide上了解到关于Hinton对Capsule的想法,雷锋网摘编如下:

Capsule 是一组神经元,其活动向量的矢量方向及方向分别代表实体化程度及实例参数,相同水平下的活跃capsule可通过矩阵变换对更高级别的Capsule实体化参数进行预测。当多个预测一致时,高级别的Capsule将会更加活跃。在论文中我们展示了用于判别训练的多层Capsule系统在MNIST数据集表现臻于完美,相比起高度重叠的数字的卷积网络的性能更为优越。为达到这一目标,我们试用使用迭代的路由协议机制,即低级别的Capsule倾向于将预测结果输出发送至高级别的Capsule,从而使得高级别Capsule的活动向量具备大标量积。论文最终版本正在修订中,并会包含评论者的意见。

换言之,Capsule试图在神经网络内形成和抽象创建子网络,也就是说,如果你看一个标准的神经网络,层与层之间是完全连接的(也就是说,层1中的每个神经元都可以访问层0中的每个神经元,并且本身被第2层中的每个神经元访问,以此类推), 这种更复杂的图形拓扑似乎可以更有效地地提高生成网络的有效性和可解释性。论文中提到的 Dynamic Routing,就是希望能够形成一种机制,让网络能够将适合某一层 Capsule 处理的内容,路由到对应的 Capsule让其处理,从而形成了某种推断链。

(关于Capsule理论的更多内容,可参见雷锋网之前文章:《Hinton亲自讲解迄今未发表工作:胶囊理论的核心概念到底是什么?》)

如何看待Capsule ?

在知乎的这一问题下,得到赞同最高的SIY.Z是这样回答的:

首先这个工作成功或者不成功都是很正常的,就算 Capsule 真的会成为以后的趋势,Hinton 也未必这么快找到正确的训练算法;就算 Hinton 找到了正确的训练算法,也没有人能够保证,Capsules 的数量不到人脑中 mini-columns 数量的时候,能够起达到人类的识别率(何况现在 CNN 虽然问题很多,但是识别率很多已经超过人类了)。

从目前已经披露的信息看,Capsule的概念会更仿生一些,能够更好地模拟人类大脑神经元之间的复杂连接结构,但对这个框架具体的数学描述仍有待于进一步研究。

雷锋网认为,在最近几年,深度学习得到了广泛的应用,深度学习工程化的门槛逐步降低,导致在诸多学术会议上已经开始呈现出“不用深度学习都不好意思和人打招呼”的现象,在这种环境下,不少研究者也在探索深度学习之外的其他理论研究,Hinton的“深度学习需要推倒重来,可能需要抛弃反向传播”的反思更多具备指导性的意义,也会激励更多人在其他的理论研究上进一步探索。

值得一提的是,有不少国内学者已经走在了这个领域的前列。如南京大学的周志华教授今年稍早发表的关于多层随机森林的论文《Deep Forest: Towards An Alternative to Deep Neural Networks》是关于用做深度学习的,也不需要反向传播;而在去年,周志华教授也针对当前深度学习存在的技术局限提出了“学件”的解决方案,在这一波对深度学习的重新思考中,我们也期望有更多的国内学者能够有更多的突破。

本文作者:岑大师

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-26 22:18:34

Geffory Hinton:深度学习进入平台期?不,深度学习需要的是“推倒重来”的相关文章

阿里云异构计算平台——加速AI深度学习创新

云栖TechDay第36期,阿里云高级产品专家霁荣带来"阿里云异构计算平台--加速AI深度学习创新"的演讲.本文主要从深度学习催生强大计算力需求开始谈起,包括GPU的适用场景,进而引出了弹性GPU服务--EGS(Elastic GPU Service),重点讲解了EGS的优势.EGS监控以及EGS产品家族,最后对EGS支撑AI智能创新进行了总结.以下是精彩内容整理:   基于大数据的深度学习催生强大计算力需求 怎样加速AI深度学习支撑,帮助大家搭建模型,支撑大家业务运营等等. 如图,深

解析:Facebook首创全新深度学习移动平台,“视频版”的Prisma是如何实现的?|深度

雷锋网(公众号:雷锋网)按:"风格特效转换"  在Prisma出现之后就已被熟知,这是利用神经表征分离再组合图片的内容和风格,最后实现可用来描绘艺术图像.但是,就像我们所体会到的,Prisma依旧存在一些问题,比如使用人数多导致服务器过载.智能软件处理的计算力不足等,雷锋网编辑曾在发布<AI修图艺术:Prisma背后的奇妙算法 | 深度 >时就曾请教过一些深度学习工程师,为什么没有应用在视频上?得到的答案是,除了Prisma出现的问题,要保持时间上的帧率一致也是非常麻烦的,

一入侯门“深”似海,深度学习深几许(深度学习入门系列之一)

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud  [导言]目前人工智能非常火爆,而深度学习则是引领这一火爆现场的"火箭".于是,有关"深度学习"的论文.书籍和网络博客汗牛充栋,但大多数这类文章都具备"高不成低不就"的特征.对于高手来说,自然是没有问题,他们本身已经具备非常"深度"的学习能力,如果他们想学习有关深度学习的技术,直接找来最新的研究论文阅读就好了.但是,对于低手(初学者)而言,

数据不够怎么训练深度学习模型?不妨试试迁移学习

深度学习大牛吴恩达曾经说过:做AI研究就像造宇宙飞船,除了充足的燃料之外,强劲的引擎也是必不可少的.假如燃料不足,则飞船就无法进入预定轨道.而引擎不够强劲,飞船甚至不能升空.类比于AI,深度学习模型就好像引擎,海量的训练数据就好像燃料,这两者对于AI而言同样缺一不可. 随着深度学习技术在机器翻译.策略游戏和自动驾驶等领域的广泛应用和流行,阻碍该技术进一步推广的一个普遍性难题也日渐凸显:训练模型所必须的海量数据难以获取. 以下是一些当前比较流行的机器学习模型和其所需的数据量,可以看到,随着模型复杂

学习服务平台“跟谁学”上线陈向东不做天猫淘宝

2014年年初,陈向东辞任新东方教育科技集团执行总裁一职.9月22日,他的创业项目O2O学习服务网站跟谁学正式发布测试版.从定位上看,跟谁学突出老师个人品牌,并加入了评价体系.它既是一个工具型平台,也提供一体化配套服务.陈向东强调,虽然是一个创业公司,但平台系统及其一系列工具.软件都是自主研发的,跟谁学的目标是打造成一个人人乐用的学习服务平台,解决优秀师资和学习需求之间的匹配问题.课程分类涵盖知识和技能,品类广泛和全面,既有鲜明的K12特征,涵盖了从小学到高中的主要学科,同时还有舞蹈.声乐.陶艺

【干货】AI 实践者需要掌握的10大深度学习方法:反向传播、迁移学习、梯度下降……

过去10年,人们对机器学习的兴趣激增.几乎每天,你都可以在各种各样的计算机科学课程.行业会议.华尔街日报等等看到有关机器学习的讨论.在所有关于机器学习的讨论中,许多人把机器学习能做的事情和他们希望机器学习做的事情混为一谈.从根本上讲,机器学习是使用算法从原始数据中提取信息,并在某种类型的模型中表示这些信息.我们使用这个模型来推断还没有建模的其他数据. 神经网络是机器学习的一种模型,它们至少有50年历史了.神经网络的基本单元是节点(node),基本上是受哺乳动物大脑中的生物神经元启发.神经元之间的

net-VB6.0平台项目值得深入学习吗?

问题描述 VB6.0平台项目值得深入学习吗? 大家好,请教一下,VB6.0的项目,餐饮类管理桌面软件,涉及的东西也挺多, 国内外这个项目在很多连锁餐饮公司都在用,有没有必要深入学习一下?请有经验的前辈 帮忙解答一下,(目前我在自学.net)多谢! (管理员发发慈悲,不要再删除问题了) 解决方案 这个取决于你,看你看你想哪方面了,是想学习语言还是学习业务实现,侧重的内容不同 解决方案二: 个人觉得VC6.0 的话,有含金量是必须的,但是他的门槛很高,若果你之前是做前端的话,并且想在短期内实现,那么

开源系统-要做一个学习服务平台,类似“跟谁学”,请问有什么开源的系统可以参考么?

问题描述 要做一个学习服务平台,类似"跟谁学",请问有什么开源的系统可以参考么? 如题:要做一个学习服务平台,类似"跟谁学",请问有什么开源的系统可以参考么? 解决方案 额,不就是网站嘛,spring,hibernate... 解决方案二: http://www.genshuixue.com/guide/join?a=join 嗯,这个网站好傻哦,有开源的系统可以参考他们还招什么PHP工程师. 解决方案三: 不要去找参考先,自己色剂出来再对比,一味引用别人的很难创新

小微金融趋于饱和,消费金融步入平台期,产业金融是新蓝海

日前,"第三届(2017)中国普惠金融大会"在京举行.大会通过政策解读.趋势探讨.案例分享等方式探讨"践行普惠金融服务实体经济"这一主题.国家互联网信息办公室.中国人民银行.国务院扶贫办.中国互联网协会等机构代表,农业银行.中国银行.国家开发银行.光大银行.华瑞银行及蚂蚁金服.京东金融等部门负责人皆受邀出席. 中国互联网协会秘书长卢卫围绕"互联网金融到底改变了什么?"这一主题作了主题演讲.在他看来,"互联网金融是资金或者资产在互联网的信