Keras之父:大多数深度学习论文都是垃圾,炒作AI危害很大

Keras之父、谷歌大脑人工智能和深度学习研究员François Chollet最新撰写了一本深度学习Python教程实战书籍《Python深度学习》,书中介绍了深度学习使用Python语言和强大Keras库,详实新颖。

近日,François Chollet接受了采访,就“深度学习到底是什么”、“Python为何如此广受欢迎”、“目前深度学习面临的主要挑战”等议题进行了回答。他认为,目前很多深度学习领域的论文都是无意义的,因为这些研究使用了不科学、不规范的研究方法。以下是采访全文编译。

关于本人

问:您主要的工作内容是什么?

答:我在谷歌大脑团队工作,花了很多时间开发Keras。我也参加TensorFlow的工作。最近我主要在写机器学习、计算机视觉、将深度学习应用于定理证明等方面的论文。我的主要研究兴趣是理解AI中的抽象和推理问题,如何从感知得到抽象的、高度概括的模型。

深度学习的本质、挑战、和未来

问:深度学习到底是什么?

答:深度学习是机器学习的一种具体方法。与以前的方法相比,它更加强大和灵活。在大多数应用程序中,我们所说的“深度学习”是指一种把大量由人类注释的数据转换为以与人类相似的方式自动注释新数据的软件。您可以通过这种方式自动完成很多不同的任务。深度学习尤其擅长理解“感知”数据,如图像、视频或声音。

我来举例说明。假设有很多图片都带有相关联标签(如“猫”、“狗”)。深度学习可以让你自动将数据转换到一个“了解”如何把图片映射到标签的系统,只需从示例中学习,无需任何手动调整或自定义工程。然后这种系统可以被应用到新的数据,将标记图片任务有效自动化。

同样,你可以将深度学习应用于机器翻译、语音识别、文本到语音转换,光学字符识别等问题。

问:深度学习社区现在面临的主要挑战是什么?

答:打击炒作、发展伦理意识、获得科学严谨性。

炒作:对人工智能的大肆炒作正在危害这个领域。一些人正荒谬地夸大目前AI取得的进展,还说人工智能已把人类逼到了绝境。但事实并非如此。如果我们把目标设得极高,却又不能实现,就是逼着公众站在我们的对立面上。而且,炒作AI这件事,本质上是不诚实的,对公众讨论也产生了危害。

伦理: 现在部署人工智能系统的大多数人来自单一背景,他们往往没有意识到自己所构建的系统给人们带来了道德影响和副作用。这将成为一个问题,因为这个群体所拥有的权力会越来越大。我们需要更多地讨论这些问题,并提高人们对不道德使用AI的潜在行为的觉察力,例如具有偏见性的预测模型会影响公众生活,或以危险的方式操纵AI。

科学: 每天都有大量的深度学习论文发表,其中大多数并没有真正产生任何有意义的新知识,因为这些论文没有遵循科学的研究方法。他们以模糊的方式“评估”模型,或者在他们的训练数据上测试过度拟合模型(尤其是生成模型和强化学习,这是深度学习研究中发展最快的两个主题),仅在MNIST上评估模型等。深度学习简直是科学的重灾区。同行评审通常不会以有意义的方式解决这些问题,也许部分原因是大多数同行评审员进入这个领域最多才一两年。如果想要取得更快的进展,那么当涉及研究可重复性、基线、模型评估和统计显著性时,我们需要更加严谨。我们目前的激励机制是与科学相对立的:发表论文是被鼓励的。如果你的研究听起来既复杂又神秘,很难被正确评估研究重要性,那么发表论文就容易多了。

问:你认为深度学习的未来是什么?

答:我期望AI未来能把“直观的”模式识别模块与正式推理模块相结合。我也希望AI能够演变得更像自动化软件开发的形式,借用目前软件工程中的很多模式和实践。

写书动机

问:你出版了一本新书《Python深度学习》。为什么要写这本书呢?

答:写这本书的原因是,我想推出一个课程,来教那些已有Python编程能力,但没有机器学习背景的人。

Python为何广受欢迎

问:Python应该是目前发展最快的编程语言,至少在高收入国家是这样。为什么Python如此受欢迎?

答:我爱Python。学习Python很容易上手,当你习惯使用它之后,会越来越高效。与我使用过的大多数其他语言相比,Python非常直观和优雅。但是Python真正的杀手锏并不在于语言本身,而是周围的生态系统和社区。无论你需要做什么,比如解析特定的文件格式或与特定系统连接,几乎有一个Python库在做这件事,你不必花时间去做。在数据科学和机器学习方面尤其如此,有很多很棒的工具:numpy,pandas,scikit-learn,plotting libraries等,这使得Python成为一种非常高效的语言。

我喜欢Python的另一个原因是,它并不是一个领域特定的语言,而是多领域的交叉点,从网站开发到数据科学和系统管理。这意味着无需切换到新语言来将Keras模型部署为Web API。无论你需要做什么,无论是启动一个web应用程序,查询一个REST API,还是解析一些文件,训练最先进的深度学习模型,Python通常都会是一个很好的选择。

给初学者的建议

问:有些声音认为进入机器学习有壁垒。您如何看待?

答:我不同意。在过去的5年中,进入机器学习领域变得非常容易。当然,5-7年前这很艰难。你可能需要研究生教育。你需要用C ++或Matlab来编写大量的低级算法。我经历过这些。而现在不一样了。你只需要Python,很容易上手,你有权限访问高级和易于使用的工具(如Keras)。另外,你可以在网上学到很多非常高质量的资源,你可以在Kaggle上练习现实世界的问题。学习从未如此简单。

问:对于初学者来说,最重要的是什么?

答:最重要的是要深刻了解深度学习能做什么,不能做什么。去感受一些best practice,比如如何正确评估模型,如何防止过度拟合。这需要把正式解释(formal explanations)和对现实问题的广泛实践结合起来。

原文发布时间为:2017-12-20

本文作者:常佩琦

原文链接:Keras之父:大多数深度学习论文都是垃圾,炒作AI危害很大

时间: 2024-10-01 23:40:19

Keras之父:大多数深度学习论文都是垃圾,炒作AI危害很大的相关文章

126篇殿堂级深度学习论文分类整理 从入门到应用 | 干货

如果你有非常大的决心从事深度学习,又不想在这一行打酱油,那么研读大牛论文将是不可避免的一步.而作为新人,你的第一个问题或许是:"论文那么多,从哪一篇读起?" 本文将试图解决这个问题--文章标题本来是:"从入门到绝望,无止境的深度学习论文".请诸位备好道具,开启头悬梁锥刺股的学霸姿势. 开个玩笑. 但对非科班出身的开发者而言,读论文的确可以成为一件很痛苦的事.但好消息来了--为避免初学者陷入迷途苦海,昵称为 songrotek 的学霸在 GitHub 发布了他整理的深

【独家】深度学习论文阅读路线图

如果你是深度学习领域的一名新手,可能会遇到的第一个问题是"应该从哪篇论文开始读起呢?" 这里给出了深度学习论文阅读路线图! 路线图按照下面四个准则构建而成: 从提纲到细节 从经典到前沿 从通用领域到特定领域 专注于最先进的技术 你将会发现很多近期发表但是确实值得一读的论文. 我们将持续不断的给这条路线图添加论文. 1 深度学习历史和基础 1.0  书籍 1.1调查 1.2 深度信念网络(DBN) (深度学习开篇的里程碑) 1.3 ImageNet进展(深度学习从此爆发) 1.4语音识别

华盛顿邮报:中国AI研究领先世界,深度学习论文数量及质量居第一

据<华盛顿邮报报道>,人类距离造出有自我意识的人工智能可能还有很长的路要走.但随着智能手机以及其他设备中机器学习服务的兴起,一种狭义的.专门的AI已经非常流行.这一分支的AI研究也正在加速.   事实上,随着越来越多的行业和政策制定者从机器学习中得到受益,有两个国家似乎在AI研究的"军备竞赛"中走在前列.这可能对AI的未来有重大影响.   "深度学习"是机器学习的一个分支,机器学习则是AI的分支--涉及使用计算机算法执行模式识别和分析.例如,深度学习可以

(zhuan) 126 篇殿堂级深度学习论文分类整理 从入门到应用

126 篇殿堂级深度学习论文分类整理 从入门到应用 | 干货 雷锋网  作者: 三川 2017-03-02 18:40:00 查看源网址 阅读数:66     如果你有非常大的决心从事深度学习,又不想在这一行打酱油,那么研读大牛论文将是不可避免的一步.而作为新人,你的第一个问题或许是:"论文那么多,从哪一篇读起?" 本文将试图解决这个问题--文章标题本来是:"从入门到绝望,无止境的深度学习论文".请诸位备好道具,开启头悬梁锥刺股的学霸姿势. 开个玩笑. 但对非科班出

分析全球334家真正的深度学习创业公司,盘点25家AI芯片创业公司 | IEEE Fellow Chris Rowen演讲

在回顾Chris的演讲前,我们先来了解一下Chris本人.Chris Rowen是一位著名的硅谷企业家和技术专家.他目前是Cognite Venture的CEO,斯坦福SystemX联盟顾问,Cadence设计系统的顾问.他正在开发认知计算领域新的创业企业.他曾担任Cadence IP集团首席技术官,在那里他带领团队为移动.汽车.基础设施.深度学习和物联网系统的高级应用开发新的处理器和内存.Chris在1997年创建了Tensilica公司并担任CEO,开发可扩展处理器,成为领先的嵌入式架构之一

谢源:计算存储一体化,在存储里做深度学习,架构创新实现下一代AI芯片

谢源教授于1997年获得清华大学电子工程系学士学位,于1999年和2002年获得普林斯顿大学电机工程系硕士和博士学位.于2003年加入宾夕法尼亚州立大学计算机系,2008年获得终身教职,2012年提升正教授.2014年他转入加州大学圣芭芭拉分校电机与计算机工程系(ECE)担任正教授.他同时也是北京大学的兼职教授和台湾新竹清华大学的客座教授. 谢源教授也拥有丰富的工业界经验,他于2002-2003年任职于IBM担任微电子部门全球设计中心的咨询工程师,2012年到2013年期间加入AMD,负责组建和

独家 | 教你在R中使用Keras和TensorFlow构建深度学习模型

引言: 在R和Python之间如何进行选择一直是一个热议的话题.机器学习世界也被不同语言偏好所划分.但是随着深度学习的盛行,天平逐渐向Python倾斜,因为截至目前为止Python具有大量R所没有的深度学习的资源库和框架. 我个人从R转到Python是因为我想更加深入机器学习的领域,而仅仅使用R的话,这(在之前)是几乎不可能实现的事情.不过也仅此而已! 随着Keras在R中的实现,语言选择的斗争又重新回到舞台中央.Python几乎已经慢慢变成深度学习建模的默认语言,但是随着在R中以TensorF

keras中最常用深度学习的API

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud 众所周知,利用Keras-Python库可以快速.轻松地创建属于自己的深度学习的模型,今天我们就来介绍一些我们常用的API函数. 序贯模型(Sequential)API允许你为大多数问题逐层的创建模型.它的局限性在于它不允许你创建共享层或者是具有多个输入或输出的模型. Keras中的API函数是创建更多灵活性模型的替代方法,其中也包括创建更复杂的模型. 在本篇博客中,你将发现如何在Keras中使用灵活的API

热门论文Top 30:那些被国外专家引用最多的计算机视觉和深度学习论文【可下载】

在2012年,我整理了一份有关计算机视觉的热门论文清单.我把论文的研究重点放在视觉科学上,避免其与图形处理.调研和纯静态处理等方向产生重叠.但在2012年后随着深度学习技术的兴起,计算机视觉科学发生了巨大的变化--从深度学习中产生了大量的视觉科学基线.虽然不知道该趋势还会持续多久,但我认为它们应该拥有属于自己的清单. 一如我一直强调的,被引用得最多的论文并不代表它在该领域做出的贡献就最大:而是代表了它抓住了当时的某个热点.   以下就是我重新整理的有关计算机视觉与(或)深度学习的Top30论文清