吴恩达:大数据终将帮助机器拥有自主智慧

福布斯网站对加盟百度人工智能实验室的吴恩达进行了专访。文章指出,招纳吴恩达,体现了百度希望通过研发世界一流技术,将自身打造为世界前列的创新型公司的愿景。在以下访谈中,吴恩达透露了他将如何帮助百度实现这一愿景。

以下为文章主要内容:

今年5月百度在硅谷创立了人工智能实验室,并将吴恩达纳入麾下,任命为百度首席科学家。作为斯坦福大学计算机科学教授,吴恩达曾是Google Brain项目的负责人,并联合创建了在线教育初创企业Coursera。让百度成为国际化企业的发展规划中,吴恩达不失为核心人物。

问:你是如何对人工智能产生兴趣的?

答:过去我只是认为,让机器具备人工智能是再酷不过的事。高中暑假期间,我在新加坡国立大学做人工智能方面的实习生,任务是编写神经网络。它是深度学习算法的雏形。我觉得编写出能够自我学习并做出预测的软件是很有意思的。

如果我们能够让电脑更加智能,并更好地理解这个世界和环境,我们可以让许多人的生活变得更美好。正如同工业革命把我们从体力劳作中解放,我认为人工智能也存在巨大潜能,未来能够让我们摆脱大量单调重复的脑力劳动。

问:曾经有段时间,由于进展不顺,你对人工智能丧失了兴趣,是吗?

答:人工智能的远大前景是,机器总有一天将演变成像人类那样,能够完成一些具有自主智慧的任务。我刚进入斯坦福大学时,并不认为这种前景是可行的,因此当时有点困惑。人类的智慧或许是依赖某种学习算法,这是有据可依的。因此,我认为或许我们可以模仿人类大脑,建立更像人脑的智能,从而迅速取得进展。这些理念存在已久,但人工智能专家和人脑启发软件商Numenta的联合创始人杰夫•霍金斯(Jeff Hawkins)为普及这些理念做了不少贡献。

问:真正实现这些设想,你当前的进展如何?

答:我们与真正的成功距离遥远。我们面临很多问题。其中之一就是达不到应有的规模。当前我们对图像的处理规模远远不足。其二,我很肯定我们还未摸索出正确的算法。

问:但为什么近几年人们又重新燃起了对人工智能的兴趣和关注?

答:大约在四年前,2010年底,我们已经摸索出了许多算法,并意识到要推动人工智能技术更上一层楼的最大瓶颈是规模。如果我们使用现在的电脑运行20世纪80年代编写的软件,效果比使用那个年代的电脑要好很多。

因此2010年年底,我在硅谷寻求可能扩大算法规模的途径。谷歌拥有很多电脑,因此我在谷歌启动了一个项目,利用这些算法打造了规模超乎以往的神经网络。现在回想起来,这个项目取得成功的关键在于研发团队所接受的指令很单纯:建立尽可能大的神经网络。

问:你是指2012年Google Brain项目,当时该项目的神经网络成功地识别出猫的图像。

答:对。谷歌的神经网络竟然能够自己发现猫的定义,非常了不起。从来没有人告诉它什么是猫。那是机器学习的一个里程碑。这对许多公司,如Facebook、百度等等,都具有启发作用。

问:对这些公司而言,这一项目引人注目之处体现在哪里?

答:大多数具有经济效益的应用,到目前为止仅仅是从经过标记的数据进行学习。以语音识别为例。百度和谷歌已提高了语音的识别效果,他们依据的理论基础是,深度学习算法可以接纳海量的、转录为文本的语音数据。这就是经过标记的数据。由此我们可以训练神经网络进行预测。

从长远来看,还有种不同类型的深度学习,我对此感到很兴奋。它被称作无监督学习(unsupervised learning),是指从未经标记的数据展开学习,这更接近人脑的学习方式。Google Brain项目对猫的识别就是这方面的例子。我们曾经让神经网络连续一星期观看YouTube的视频,并且不作任何提示。一周后,我们做了测试,看看它学会了什么。结果它学会了识别人脸、猫脸和其他一些事物。从某种程度上,这是人工智能的一项重大进展。当前,监督学习是促使深度学习技术产生经济效应的重要功臣。而无监督学习与它不是同一概念。

问:你为什么看好无监督学习?

答:原因之一是,无监督学习最接近动物和婴儿的学习方式。如果想让当前的神经网络学会识别汽车,我们的做法是寻找5万张汽车图片,并把他们标记成汽车,再将这些标记数据输入到监督学习算法中。而孩子如何学会认识汽车呢?没有哪对父母会弄来5万辆汽车的图片。大多数神经科学家相信,大多数动物和孩子的学习仅仅是通过融入世界、亲身体验世界完成的。如果我们能在这方面取得进步,就能让神经网络系统更好地理解图像。

第二个原因在于,对于某些依赖监督学习的应用,我们能够提供的数据有限,从而限制了它的发展潜力。例如,医疗成像方面,全国进行的X射线扫描次数毕竟有限,因此能够得到的图像数据也受到限制。

问:现在就职于百度实验室,你关注的焦点是不是无监督学习?

答:它是初期的重要事项之一。无监督学习面临更多困难,前人的成功经验更少,而且不知道正确算法是什么。

问:如今存在一种趋势,即人们倾向于研究移动设备的计算和通信。此外,感官数据也在呈现爆发之势。这两个因素是否引发了人们对人工智能的热潮?

答:还有其他因素。大数据的发展源于两个趋势。第一,社会数字化的日益深入,衍生出电脑能够处理的电子数据。第二,存储和计算成本不断降低,最终使存储和处理所有这些数据的费用降至可承担的范围内。如果社会数字化持续发展,存储和计算成本继续下滑,大数据最终会发展成为一种潮流。

问:对于百度人工智能实验室,你短期或中期的具体规划是什么?

答:百度拥有三个实验室,两个北京的实验室已初具规模,而位于硅谷的人工智能实验室大部分是空荡荡的,才刚刚起步。我们招募新成员的速度很快,一周就招进一名成员,到今天为止,我们已经招了6个人。目前为止,他们都来自硅谷,而且都接受了我们发出的offer。我们还同硅谷以外的少数人接触,这需要更多的时间。我们还有很多工作要做。

问:对硅谷人工智能实验室,你心中是否已画好蓝图,例如,是否会效仿贝尔实验室、施乐帕克研究中心、谷歌或微软?

答:此前我曾与这些实验室的主管交谈过。今天早上我会见了SRI实验室的比尔•马克,之前也与许多相关领域的人交谈,如施乐帕克研究中心的前主管。我曾在Google X实验室工作。很久以前,本科期间和博士学位攻读早期的每年夏天,我都在AT&T贝尔实验室中实习。不断向他人学习、态度谦逊是很重要的。

问:一个成功的实验室最重要的因素是什么?

答:团队文化。

问:从一开始就要正确定位,这点很重要。如果一开始就走偏方向,要纠正是很困难的。你是怎么看?

答:初期过后,即使要做出些许改变也是很困难的。最关键在于,任务是什么。我所任职过的所有机构都以任务为主要动力。Coursera的使命是让每一个人享受教育,因此我们决定要实现这一任务的最佳途径是创建Coursera这家公司。现在,我面临的任务是通过人工智能技术改变世界。而我有种强烈的感觉,要实现这一点,最有效的方式是加盟百度。

问:为什么选择百度?

答:百度已经拥有非常先进的深度学习技术。它的深度学习实验室负责人余凯是深度学习方面的专家。深度学习对百度的核心产品,如网页搜索、广告、语音识别、光学字符识别等等,具有重要意义。李彦宏对人工智能抱有很大的热情。

我加入百度有三个原因。

其一,人工智能是一项资本密集型技术。要取得进展,则需要数据和计算机资源的支持。数据比计算机资源更难获得,但两者缺一不可。

第二是灵活性。作为一个大企业,百度拥有着令人难以置信的灵活性。举个例子,余凯想要创建一个图形处理器集群,在做完决定后,很快就付诸实践了。

第三就是员工的积极性。百度的工程师工作非常卖力。

问:在百度你打算如何展开未来的工作?除了互联网应用以外,是否会投入对机器人、无人驾驶车等类似产品的研究?

答:最初,我们只打算把焦点放在技术上。通常我倾向于先以产品为立足点,再考虑技术。纵观硅谷,大多数失败不是因为解决不了困难的技术问题,而是因为最终发现,费心费力解决的问题其实根本无人问津。

深度学习这项技术很不同,它在百度的许多产品中都已得到应用。人工智能对许多事物都具有重大意义。因此我不必担心我们的研究内容对当前或未来的产品是否具有实用性。

问:你将如何利用百度的技术基础设施?是否需要建造一些新的设施?

答:我在摸索如何利用当前的基础设施和开发工具使深度学习团队能够高效地产生新想法并进行测试及学习。例如,许多语音识别实验的实施大约需要一周。如果一周后才能获得结果反馈,就很难高效地进行学习。如果将时间减半,就能使团队的效率翻一番。

问:未来可能会研发出什么样的新技术?

答:我希望能够使百度当前的深度学习应用得到持续改进,如搜索、广告、语言翻译、光学字符识别和语音识别。

技术的进步分为两种。一种是渐进的,这种进步会受到人们的欢迎。例如,如果我们能够把网页搜索的性能提升5%,许多用户都将从中受益。

问:另一种呢?

答:另一种技术的进步是突破性的,它将推进前所未有的新应用的诞生。例如,如果语音识别技术进展到能够无障碍识别人类语言的程度,那么它将创造一种全新的手机互动模式。试想一下,如果我们在开车,哪怕车内很吵,我们仍可以通过向手机输入语音来向朋友发短信。这在现在根本无法实现。

如果我们能够真正解决语音识别问题,我想围绕语音界面对手机进行重新设计。或许未来移动设备上的email应用只需两个按钮:回复和删除。这只是我的想法,不一定可行。但这说明了,一些核心技术的突破将使人们的生活产生巨大的变化。

本文来源于"中国人工智能学会",原文发表时间"2014-09-24"

时间: 2024-09-18 00:34:42

吴恩达:大数据终将帮助机器拥有自主智慧的相关文章

吴恩达的21节Deeplearning.ai课程学习经验总结

截止到2017年10月25日,吴恩达在Coursera上目前有3门新的深度学习课程: 1.神经网络和深度学习(Neural Networks and Deep Learning) 2.改善深度神经网络:调优超参数,正则化和优化(Improving Deep Neural Networks: Hyperparamater tuning, Regularization and Optimization) 3.构建机器学习项目(Structuring Machine Learning Projects

专访吴恩达:百度一切比预想的要快

吴恩达,百度的首席科学家和技术名片,这位中文讲得一塌糊涂的美籍华人成为百度世界2014的一个"彩蛋".吴恩达不算太长的演讲依然挑战了听众的耳朵.这是他第一次公开用中文演讲,集合了英语.普通话和粤语口音的复杂语言还时不时停顿,据说这还是在其彩排3次之后所达到的效果.不过,这并不妨碍他把事情说清楚. 上午吴恩达提出了两个关于人工智能的核心观点. 一是"人工智能需要正循环","你有一个好产品,你就可以有大量用户.有了大量用户,你就有大量数据.这些大量数据用于人工

吴恩达:大数据正在慢慢影响着人们的生活

1976年出生于伦敦,华裔美国人.1998年获得麻省理工学院硕士学位,2002年获得加州大学伯克利分校博士学位. 吴恩达曾在斯坦福大学计算机科学系任教,被认为是人工智能和机器学习领域最权威的国际学者之一. 吴恩达曾在谷歌成立"谷歌大脑"项目,最著名的成就是让机器仅通过观看无标示的视频学习达到高级别识别能力,能够成功识别出"猫".去年,百度公司宣布,吴恩达成为百度首席科学家,全面负责百度研究院. 语音识别可改变人类 新京报:演讲时你提到机器图像和语音识别将在可穿戴设备

NIPS 2016精华大盘点丨吴恩达、LeCun等大师的论文、PPT都在这儿,别劳心去找了

2016 NIPS 仍在如火如荼地进行,各位大佬也频繁在会场露面,并时不时的搞个"大新闻".雷锋网时刻关注着 NIPS 的一切动态,并把大家较为关注的论文以及学术大师的PPT整理出来,方便大家学习和参考. 先打个招呼,正文和文末都有彩蛋. Yann LeCun  Yann LeCun 最近可谓是学术界的网红,上周先后录了三段视频为大家普及人工智能知识,现在又飞到西班牙见见粉丝,也不忘随时更新下 Facebook. Yann LeCun 受邀在今年的 NIPS 大会发表演讲.众所周知,深

MXNet爆红,大神Yann LeCun和吴恩达最新演讲|AI科技评论周刊

美国时间 11 月 22 日,亚马逊 CTO Werner Vogels 在博文中写到 MXNet 被 AWS 正式选择成为其云计算的官方深度学习平台. MXNet 是一个全功能.灵活且高扩展性的深度学习框架,支持深度学习模型中的卷积神经网络和长期短期记忆网络.由学术界发起,由华盛顿大学和卡内基梅隆大学的研究人员联合发起. MXNet 联合发起人解浚源表示: "MXNet 发展到现在有一年多时间,是一个相对成熟的项目.我对我们的技术很有信心.MXNet 的速度,节省内存,接口灵活性,和分布式效率

吴恩达加盟百度原委:让机器自己学习

吴恩达就是那个帮助谷歌发起其野心勃勃的用计算机硬件和软件创造人脑项目的人.现在,他将在百度负责一个类似的项目.wired.com的一篇最新文章<Man behind the Google Brain Joins Chinese Search Giant>介绍了Andrew Ng加盟的前因后果. 深度学习领域的权威 "吴恩达是在机器学习,特别是深度学习方面的领先学者之一",加州伯克利大学理论神经系统科学雷德伍德中心的负责人Bruno Olshausen说,"我期待在

吴恩达,李开复等专家组队打造2017AI趋势报告(附报告全文和完整数据包)

以斯坦福大学为首的专家团队推出的人工智能指数(AI Index)正在追踪AI这个新兴领域,并在近日发布了2017重磅年度报告. 2000年来,活跃的AI创业公司增长了14倍.风险投资在这一时期增长了6倍数. 过去20年,AI领域的学术发布增长了9倍,注册课程也在猛涨.例如,斯坦福的AI相关机器学习课程导论课程在过去30年中,注册人数增长了45倍之多. 近日,由斯坦福大学主导,包括吴恩达.李开复等一众大咖齐力打造的2017AI趋势报告重磅发布. 吴恩达本人也在刚刚发推特支持报告,提及了报告中有趣结

吴恩达创业第一波 看看哪些大咖为他站台

本周,前百度首席科学家吴恩达公开了自己的深度学习系列课程DeepLearning. ai,随后,吴恩达出人意料地放出了一系列主题为"The Heros in Deep Learning"的采访视频. 厉害的是,这次吴恩达亲自上阵采访了7位AI界顶级人物,"深度学习教父" Geoffery Hinton."GANs之父" Ian Goodfellow."深度学习三驾马车"中另一位 Yoshua Bengio .UC伯克利教授 P

吴恩达导师Michael I. Jordan刚去清华手写版书讲了三天课,这有一份他的课程笔记

被称为"机器学习之父"的Michael I. Jordan教授上周(9月12-14日)在清华进行了为期三天的校内公开课,面对清华同学分享了他在伯克利AMP Lab和RISE Lab的最新研究成果. Jordan教授本次亲自上阵授课实属难得,为保证教学质量,本次系列课程也只面向清华学生开放,且不设录像直播,颇为珍贵.据大数据文摘了解,Jordan教授授课风格颇传统,全程抛弃多媒体设备,手写版书公式.本次讲座内容由机器学习方法和系统组成,主要涉及概率图模型.统计推断和模型评判,以及大规模机