吴恩达 NIPS 2016:利用深度学习开发人工智能应用的基本要点(含唯一的中文版PPT)

雷锋网按:为了方便读者学习和收藏,雷锋网(公众号:雷锋网)特地把吴恩达教授在NIPS 2016大会中的PPT做为中文版,由三川和亚峰联合编译并制作。

今日,在第 30 届神经信息处理系统大会(NIPS 2016)中,百度首席科学家吴恩达教授发表演讲:《利用深度学习开发人工智能应用的基本要点(Nuts and Bolts of Building Applications using Deep Learning)》。

此外,吴恩达教授曾在今年 9 月 24/25 日也发表过同为《Nuts and Bolts of Applying Deep Learning》的演讲(1小时20分钟),以下是 YouTube 链接:

https://www.youtube.com/watch?v=F1ka6a13S9I

一、深度学习为何崛起

吴恩达在开场提到:深度学习为何这么火?

答案很简单:

第一是因为规模正在推动深度学习的进步。

从传统算法到小型神经网络、中型神经网络最后演化为现在的大型神经网络。

第二:端到端学习的崛起

从下图中的上半部分可以看出,传统端到端学习是把实体数据表达成数字数据,输出数字值作为结果。如退昂识别最后以整数标签输出为结果。

现在的端对端学习更为直接纯粹,如机器翻译:输入英语文本,输出法语文本;语音识别:输入音频,输出文本。但端对端学习需要大量的训练集。

吴恩达先讲述了常见的深度学习模型,然后再着分析端到端学习的具体应用。

二、主要的深度学习模型

  • 普通神经网络
  • 顺序模型   (1D  顺序)  RNN,  GRU,  LSTM,  CTC,  注意力模型
  • 图像模型  2D 和  3D 卷积神经网络
  • 先进/未来 技术:无监督学习(稀疏编码 ICA,  SFA,)增强学习

三、端到端学习应用案例

  • 语音识别

传统模型:语音→运算特征—(人工设计的 MFCC 特征)→音素识别器—(音素识别)→最终识别器→输出。

端到端学习:音频→学习算法→转录结果;在给定了足够的有标注数据(音频、转录结果)时,这种方法的效果会很好。

  • 自动驾驶

传统模型:摄像头图像→检测汽车+检测行人→路径规划→方向控制。

端到端学习:摄像头图像→学习算法→方向控制。

自动驾驶对安全有极高要求,因此需要极高的精确度。采取纯粹的端到端学习十分有挑战性。只在有足够(x,y)的数据,来学习足够复杂的函数的情况下,端到端学习才有效果。

四、机器学习策略

你经常有很多改进 AI 系统的主意,应该怎么做?好的战略能避免浪费数月精力做无用的事。

以语音识别为例,可以把原语音数据分割成:

  • 60% 训练集(训练模型)
  • 20% 开发集(开发过程中用于调参、验证等步骤的数据集)
  • 20% 测试集(测试时所使用的数据集)

这里面普及几个概念:

人类水平的误差与训练集的误差之间的差距是可避免的偏差,这部分误差可以通过进一步的学习/模型调整优化来避免。

训练集和开发集之间的差距称为方差,其因为跑了不同的数据从而导致误差率变化。

上述两种偏差合在一起,就是偏差-方差权衡(bias-variance trade-off)。

  • 机器学习的基本方案

  • 自动数据合成示例

  • 不同训练、测试集的分布

假设你想要为一个汽车后视镜产品,开发语音识别系统。你有 5000 小时的普通语音数据,还有 10 小时的车内数据。你怎么对数据分组呢?这是一个不恰当的方式:

  • 不同训练和测试集分配

更好的方式:让开发和测试集来自同样的分配机制。

五、机器学习新方案

  • 普通人类、偏差、方差分析

  • 人类的表现水平

当机器学习在处理某项任务上比人类表现还差时,你经常会看到最快的进步。

机器学习超越人后,很快就会靠近贝叶斯最优误差线。

可以依靠人类的直觉:(i)人类提供加标签的数据。(ii)进行错误分析,来理解人是怎么对样本正确处理的(iii)预估偏差/方差。比如,一项图像识别任务的训练误差 8%, 开发误差 10%,你应该怎么处理?

六、人工智能产品管理

新的监督DL算法的存在,意味着对使用 DL开发应用的团队合作,我们在重新思考工作流程。产品经理能帮助 AI 团队,优先进行最出成果的机器学习任务。比如,对于汽车噪音、咖啡馆的谈话声、低带宽音频、带口音的语音,你是应该提高语音效果呢,还是改善延迟,缩小二进制,还是做别的什么?

今天的人工智能能做什么呢?这里给产品经理一些启发:

如果一个普通人完成一项智力任务只需不到一秒的思考时间,我们很可能现在,或者不远的将来,用 AI 把该任务自动化。

对于我们观察到的具体的、重复性的事件(比如用户点击广告;快递花费的时间),我们可以合理地预测下一个事件的结果(用户是否点击下一个此类广告)。

  • 产品经理和研究员、工程师该如何分工

七、吴恩达新书推荐

本文作者:亚峰

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-29 19:55:03

吴恩达 NIPS 2016:利用深度学习开发人工智能应用的基本要点(含唯一的中文版PPT)的相关文章

谷歌大脑之父吴恩达加盟百度 主攻深度学习

中介交易 SEO诊断 淘宝客 云主机 技术大厅 5月16日,<第一财经日报>记者获悉,百度今日在内部公布了Google Brain项目创始人Andrew Ng(中文名吴恩达)加入百度的内部邮件.邮件显示,吴恩达出任百度首席科学家职务,向百度高级副总裁王劲汇报.据了解,他将负责百度深度学习研究院工作,尤其是Baidu Brain计划. 公开资料显示,吴恩达是斯坦福大学人工智能实验室主任,人工智能和机器学习领域国际上最权威的学者之一.此前,吴恩达与谷歌合作研究深度学习,并领导谷歌X实验室团队斥巨资

为什么吴恩达认为未来属于迁移学习?

雷锋网按:日前,知名 AI 博主.爱尔兰国立大学 NLP 博士生 Sebastian Ruder 以"迁移学习:机器学习的下一个前线"为题,对迁移学习的技术原理.重要性与意义.应用方法做了详细阐述.本文对其中讨论迁移学习的原理.重要性,以及吴恩达的预测的部分做了节选,阅读原文(英文)请戳这里.雷锋网编译. Sebastian Ruder  Sebastian Ruder:在训练深度神经网络.学习输入到输出的精准映射上,近年来我们做得越来越好.不管是针对图像.语句,还是标签预测,有了大量

利用深度学习开发老板探测器,再也不担心刷着微博一回头突然看到老板了

如果上班的时候想放松一下,或者直说想偷偷懒,看点和工作无关的网页,这时候万一老板突然出现在背后,会不会感到很难堪呢? 有的浏览器设置了boss按键,手快的人还可以切换屏幕,不过总会显得不自然,而且经常搞的手忙脚乱的. 一个日本程序员决定自己动手,编写一个一劳永逸的办法,我们来看看他是怎么实现的吧~ 思路很直接:用网络摄像头自动识别在工位通道走过的人脸,如果确认是老板的话,就用一张写满了代码的截图覆盖到整个屏幕上. 整个工程中应用了Keras深度学习框架来建立识别人脸的神经网络,和一个网络摄像头用

NIPS 2016精华大盘点丨吴恩达、LeCun等大师的论文、PPT都在这儿,别劳心去找了

2016 NIPS 仍在如火如荼地进行,各位大佬也频繁在会场露面,并时不时的搞个"大新闻".雷锋网时刻关注着 NIPS 的一切动态,并把大家较为关注的论文以及学术大师的PPT整理出来,方便大家学习和参考. 先打个招呼,正文和文末都有彩蛋. Yann LeCun  Yann LeCun 最近可谓是学术界的网红,上周先后录了三段视频为大家普及人工智能知识,现在又飞到西班牙见见粉丝,也不忘随时更新下 Facebook. Yann LeCun 受邀在今年的 NIPS 大会发表演讲.众所周知,深

深度学习前瞻:吴恩达 + 百度 &gt; 谷歌吗?

导读:百度是中国网民上网时的常用工具,它致力于成为影响全球的力量.作为世界上人工智能领域的顶尖研究员,吴恩达先生能否助其成功挑战硅谷最大的互联网公司? 百老汇音乐厅位于旧金山北海岸,是新古典主义建筑,已拥有95年历史,历经岁月磨蚀,四周环绕数不清的脱衣舞俱乐部.从Blondie(金发女郎)到Ramones(莱蒙斯),曾有许多朋克乐队在此演出.但今年六月某个明亮的早晨,一位完全不同类型的"摇滚明星"在此登场.一小撮参加科技创业会议的人群簇拥着一位身穿蓝色礼服衬衫和深蓝套装.个子高高.说话

吴恩达亲自采访百度林元庆和谷歌 Ian Goodfellow,他们对刚入门者有何忠告?

雷锋网 AI 科技评论按:随着吴恩达公开 Deeplearning.ai 系列深度学习课程,他也出人意料地放出了一系列主题为"The Heros in Deep Learning"的采访视频.吴恩达亲自上阵采访了"深度学习教父" Geoffery Hinton."GANs之父" Ian Goodfellow."深度学习三驾马车"中另一位 Yoshua Bengio .UC伯克利教授 Pieter Abbeel .百度研究院院长

吴恩达:“人工智能杀人说”是炒作

百度举办的The Big Talk活动,第一场演讲即是百度首席科学家吴恩达(Andrew Ng)带来的有关人工智能的分享.作为斯坦福大学的教授,其在深度学习方面享誉世界的成就,被认为是在该领域世界范围内的"一哥",吴恩达的选择也让百度成为了硅谷一颗耀眼的"新星".这次The Big Talk深入硅谷腹地--谷歌总部的计算机历史博物馆(Computer History Museum)也是颇具象征意义. 当然,没有点真家伙,这样的象征也不过就是一种浮夸,吴恩达领导的百度

百度吴恩达:语音搜索未来将占百度搜索的50%

腾讯科技讯 美国当地时间12月2日,全球移动互联网大会硅谷站(GMIC SV 2014)在旧金山开幕.百度首席科学家吴恩达就"深层学习"发表主题演讲.吴恩达谈到,深度学习呈现环形生态链,囊括产品.数据和用户三大要素,借此打造神经式网络(Neural network).百度基于此也推出了深度学习产品,比如语音识别和图片认知搜索.吴恩达表示,深度学习主要包含语音.图片.文本三种形式.目前10%的百度搜索是语音搜索,9月百度还发布了语音智能硬件cool box.他 认为电视遥控器未来将消失,

吴恩达成立1.5亿美元基金,专注AI投资

上周,吴恩达宣布了一系列深度学习的课程,这也是他deeplearning.ai项目的一个开始.雷锋网消息,在美国时间15日晚,外媒TC报道称他又有新动作了,即成立一个1.5亿美元规模的风险投资基金AI Fund,主要做AI领域的投资. 吴恩达曾创立了Google大脑团队,后担任过百度首席科学家,他长期以来一直希望AI技术能更为普及,推动他AI的民主化.通过深度学习课程的教育应该是其中一步,而为AI创业提供资金和其他资源则应该是另一件. 目前还不清楚吴恩达的AI基金会如何从众多基金中脱颖而出. 2