​【NIPS2017】深度学习真的不需要理论指导了?图灵奖得主讲座无人问津,贝叶斯之父Judea Pearl落寞身影背后引人深思

NIPS 2017 "Test of Time"论文大奖获得者Ali Rahimi 在长滩现场的演讲中抱怨当前机器学习尤其是深度学习使用的很多方法缺少(理论)理解。而Lecun则回怼说:仅仅因为理论没有追赶上实践的水平,就批评整个机器学习社区使用「炼金术」,这种言论是危险的。

CMU大学教授,Petuum公司创始人Eric Xing则在看到这组图后表示:这是NIPS2017大会上一个让人难过的场景。成为一个单纯的“炼金术师”并不可耻,可耻的是并不努力从“炼金术师”学成“化学家”。 意思是仅仅反复的做工程实践并没有什么不对的,但是还应该想想背后的原理。(不想当将军的士兵不是好兵?)

图:Judea Pearl演讲的会场

Judea Pearl简介

Judea Pearl 曾获得2011年的图灵奖,奖励他在人工智能领域的基础性贡献,他提出概率和因果性推理演算法,彻底改变了人工智能最初基于规则和逻辑的方向。他主要的研究领域是概率图模型和因果推理,这是机器学习的基础问题。图灵奖通常颁给纯理论计算机学者,或者早期建立计算机架构或框架的学者。

Judea Pearl 是 UCLA 计算机科学系的教授,他曾两次居于科学革命的中心:第一次是在 20 世纪 80 年代,他为人工智能引入了一套新的工具,叫贝叶斯网络。这种基于概率的机器推理模型使得机器能在复杂的、模糊的和不确定性的环境下工作。短短几年内,贝叶斯网络就完全替代了此前基于规则的人工智能方法。

第二次革命,鉴于贝叶斯网络在计算上的优势,Pearl 意识到简单的图模型和概率论(正如贝叶斯网络中的那样)也能用于因果关系的推理。这一发现为人工智能的发展奠定了另一个基础,但意义远非如此,这一能验证因果关系的、条理性的数学方法,几乎已经被所有科学和社会科学领域采用。

Judea Pearl 还是美国国家工程院院士,AAAI 和 IEEE Fellow,是以他儿子姓名命名的 Daniel Pearl 基金会的主席(他的儿子Daniel Pearl曾是华尔街日报记者,2002年被巴基斯坦恐怖份子绑架并斩首,为这事美国还专门拍了一部电影 ” A Mighty Heart” 。)

场外JudeaPearl亲自讲解自己的工作

http://web.cs.ucla.edu/~kaoru/theoretical-impediments.pdf

理论在深度学习中的作用

AliRahimi 阿里引起的理论之争一石激起千层浪,网络上出现了更多机器学习界的代表发声。今天芝加哥丰田研究院教授DavidMcAllester发表博文进行解读,以下内容为McAllester的观点:

这篇博文的主要受Ali Rahimi最近的NIPS演讲和Lecun回怼的启发。

  • https://www.reddit.com/r/MachineLearning/comments/7hys85/nalirahimistalkatnipsnips2017testoftime/
  • https://www.facebook.com/search/str/yann+lecun+alchemy/keywordssearch

这个研究话题从根本上就是理论和深度学习的关系。我将从Ali的演讲中摘抄一些引用。


Rahimi:


机器学习已经成为炼金术。

炼金术是有效的(对于很多事情)。

但科学家已推翻二千年的炼金术的理论。

我想生活在一个社会,这个社会的制度建立在可证实的严谨的知识上,而不是炼金术上。

  • LeCunn:

理解(理论或其他)是一件好事。但是仅仅因为理论没有追赶上实践的水平,就批评整个机器学习社区使用「炼金术」,这种言论是危险的。

为什么危险?正是这种态度使机器学习社区放弃神经网络 10 年有余,尽管大量实证研究证明神经网络在很多情况下非常有效。

我从根本上同意Yann的观点,他认为苛刻的要求会误导一个领域。也许最危险的是要用成熟的数学理论来打动同行,而不是寻求真正的进步。

但我想在这场辩论中加入我自己的观点。我将再次引用Rahini:

  • Rahini:

当一个深度网络不起作用时,我认为它是梯度下降的错误。

梯度下降是深度学习的基石。梯度下降是局部搜索的一种形式。以下是一些局部搜索的例子:

内燃机从十九世纪九十年代到二十世纪的演变。

摩尔定律指导下近50年来半导体工艺的发展。

包括人类大脑进化的生物进化。

从希腊数学到现代数学的演变。

Alphago zero训练时间,通过自我下棋成为世界上最强大的国际象棋程序。

局部搜索确实是神秘的。但是,我们真的能期待一个严格的局部搜索理论来预测或解释人脑的进化或数学知识的历史演变吗?我们真的可以期待通过某种梯度下降的二阶分析来预测未来二十年将出现哪些数学理论?我的立场是,局部搜索(梯度下降)是非常强大的,从根本上超出了任何完全严格的理解。

如今的计算能力已经达到了这样的水平:强大GPU加上强大架构设计上的梯度下降只能被理解为某种形式的非常强大的通用非凸局部搜索,其性质类似于上述例子。是的,特定的神经网络训练失败是梯度下降(局部搜索)的失败。但是那个观察提供提供的信息很少。

一个相关的问题是在通用人工智能(AGI)中时间帧上的方位。严谨是否有助于实现AGI? 也许即使是Rahini也会发现对AGI的严格处理是不可能的。一个严谨者的普遍反应是,AGI太远太扯淡。但是,我觉得我们离得很近,这更让人兴奋。

我写了一篇关于关于近期的机器感知的合理性的博客文章(https://machinethoughts.wordpress.com/2017/07/22/the-plausibility-of-near-term-machine-sentience/)。

我相信洞察结构是可能的,而这种洞察可以成功地指导设计。LSTMs出现在1997年,因为有克服梯度小时的一种“理论洞察力”。理解批量标准化是克服内部协变量转换的一种方法,我确实认为我是在直观的层面来理解(我很乐意解释它)。直觉的非严格的理解是理论理解的基础。

20多年前,Fernando Pereira(可能他是引用别人)对我说“探险家”和“定居者”。探险者首先看到地形(没有严谨),定居者清理它(严谨)。考虑微积分或傅立叶分析。但在局部搜索的情况下,我不认为定理(定居者)将会解决它。

在我看来,一般局部搜索(AGI)的进展将来自寻找正确的计算模型——正确的通用架构——用于定义“强”局部搜索空间的结构。我已经写了一篇关于搜索一般认知架构的博文(https://machinethoughts.wordpress.com/2016/06/20/cognitive-architectures/)。

输或赢,我个人打算继续追求AGI。

原文发布时间为:2017-12-10

原文链接:​【NIPS2017】深度学习真的不需要理论指导了?图灵奖得主讲座无人问津,贝叶斯之父Judea Pearl落寞身影背后引人深思

时间: 2024-09-26 20:57:36

​【NIPS2017】深度学习真的不需要理论指导了?图灵奖得主讲座无人问津,贝叶斯之父Judea Pearl落寞身影背后引人深思的相关文章

深度学习真的可以零基础入门吗?

我们先来谈谈自学深度学习最大的问题. 现在搞深度学习的,十之八九并不是"科班出身". 这就导致:如果你想要跨行成为一名深度学习工程师,从头到尾的一切,都基本靠自学.但是,开发者很快就会发现自己遇到了第一个障碍: 绝大多数的学习资源以理论研究为导向,轻工程实践. 其实这也难怪.这几年,深度学习是火了,但大牛们都来自学界,例子不胜枚举:比如谷歌云首席科学家李飞飞.主管 FAIR 的 Yann LeCun.在谷歌大脑的 Ian Goodfellow,以及在过去三年里任百度首席科学家的吴恩达.

深度学习真的会带来人工智能吗?

4月2日旧金山,Bulid 2014微软开发者大会,这是微软新CEO纳德拉上台之后第一次Build大会,会上最引人关注的可能是Windows Phone 8.1和诺基亚的新旗舰Lumia 930.微软最新的WP 8.1系统集成了智能语音助手Cortana.自此,智能语音助手成为三大移动操作系统的标配. Cortana,取名自经典游戏Holo中的人工智能,比Siri晚到了两年半,比Google Now晚了一年半.看起来微软仍在iOS和Android身后拼命追赶. 微软:领先的落后者 而实际上,微软

薛定谔的佛与深度学习中的因果

<寻梦环游记>看哭了许多人,小男孩米格踏过花瓣桥,也就踏入了既生又死的状态,出现在他眼前的,是恢弘的亡灵世界.如果人世间没有人再记得,骷髅人也将在亡灵世界烟消云散,这是人存在的本来景象吗?玛雅人祭奠的圣井,真的是通往亡灵世界的入口吗?玛雅人是不是已然到达了传说中的梵境? 紧跟着玛雅人到达梵境的,是现在的一批90后.<第一批90后已经出家了>称,办公室的90后已经找到人生的新方向,宣布成佛,"有也行,没有也行,不争不抢,不求输赢",这是真真正正的梵境,是物我两忘.

最新信息瓶颈理论,打开深度学习的万能黑匣子

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud 只要你能想到的出,什么都可以交给万能的深度学习--聊天.开车.打游戏.战胜世界围棋冠军--但是,虽然人类创造了它,其内部机制却像个黑匣子,我们所知甚少,除了隐约知道这种学习系统的设计灵感正是我们自己的大脑.哦对了,如果你对脑科学有所了解的话,大脑也是一个我们所知甚少的黑匣子. 深度学习的机制也和大脑很像.大脑中,神经元激活后会给与其相联系的神经元发送信号.对深度学习来说,深度神经网络也有神经元,它们之间的联系

【深度】“信息瓶颈”理论揭示深度学习本质,Hinton说他要看1万遍

本文讲的是"信息瓶颈"理论揭示深度学习本质,Hinton说他要看1万遍,利用深度神经网络的机器已经学会了交谈.开车,在玩视频游戏和下围棋时击败了世界冠军,还能做梦.画画,帮助进行科学发现,但同时它们也深深地让其发明者困惑,谁也没有料到所谓的"深度学习"算法能做得这么好.没有基本的原则指引这些学习系统,除了一些模糊的来自人类大脑的设计灵感(而关于这一点,实际上也没有人真正懂得多少). 像大脑一样,深度神经网络也有很多层神经元.当神经元被激活时,它会发出信号,连接上面一

Geffory Hinton:深度学习进入平台期?不,深度学习需要的是“推倒重来”

一个星期前由François Chollet在Twitter上引发的"深度学习是否进入平台期"的讨论,因为大神Geffory Hinton的参与达到了高峰. Hinton:深度学习可能需要"推倒重来" 据科技媒体Axios报道,上周三在多伦多举行的一个AI会议上Hinton表示,他现在对反向传播算法"深感怀疑".这一算法是用来训练人工神经网络的常见方法,该方法计算对网络中所有权重计算损失函数的梯度.这个梯度会反馈给最优化方法,用来更新权值以最小化

普渡大学创造 DeepHand,用深度学习开发 AR 新技术

雷锋网报道,美国印第安纳州的普渡大学西拉法叶分校的研究工作者,利用深度学习算法为虚拟增强现实技术提供了新型系统--"深度手控"(DeepHand). 未来的人机交互系统,概念上应能够满足人类和虚拟环境间的交流互动.届时,对计算机的要求也变得更高,计算机将需要获取并计算人类手部复杂的运动状态及庞杂关节角度,从而理解人类双手无穷无尽的姿势所要表达的含义. 在虚拟增强现实技术中,用户需要佩戴头盔,才能够感知虚拟环境为用户所带来的视听盛宴.然而,增强现实技术能为用户呈现虚实并存的世界,并且满足

深度学习并非万能,你用对了吗?

[ 导读 ]深度学习随着AlphaGo大胜李世石之后被"神话",很多人认为深度学习就是挑战人类智力的"神器".可是,深度学习真的如他们想象的那般"战无不胜"吗?本文编译自hyperparameter.space,作者是Pablo Cordero,就读于加利福尼亚大学圣克鲁斯校区,主攻方向为细胞生物学和再生医学背景下的应用机器学习研究.阅读此文后,你便能够从深层理解,为什么深度学习其实并不像普通百姓想象的那般"神"了,甚至,你还

2017年深度学习必读31篇论文(附下载地址)

2017年即将擦肩而过,Kloud Strife在其博客上盘点了今年最值得关注的有关深度学习的论文,包括架构/模型.生成模型.强化学习.SGD & 优化及理论等各个方面,有些论文名扬四海,有些论文则非常低调. 一如既往,首先,标准免责声明适用,因为今年仅与GAN有关的论文就超过1660篇.我肯定会有疏漏,试图缩减到每两周一篇论文,包含了Imperial Deep Learning Reading Group上的大量素材.无论如何,我们开始吧. 架构/模型 今年的Convnet网络架构已经少得多,