百度余凯:数据是极好的竞争壁垒

昨日,极客公园创新大会在北京开幕,百度深度学习研究院(IDL)副院长余凯发表演讲,阐述大数据时代,人工智能与深度学习的发展。

以下是余凯的演讲实录:

各位朋友早上好!在我的演讲之前,先给大家看一段有趣的视频。大家看这辆车开进我们会场,正从我的左侧往右侧开过来,上面没有人,它自平衡行走,看起来有点诡异。为什么我们会做这样有趣的自行车?它是真正的自行车,以前的自行车不是自己行走的。为什么做这个事情,这个就涉及到我今天演讲的话题,就是百度大脑所思考的人机关系。

大家可能会好奇,什么是人工智能?这是一个很严肃的学术话题,今天这个会场我想我们抱着对科技的热情,不需要那么严肃,大家跟我一样是科技的粉丝,看过这样的电影,这个小机器人,它具有相当高的智能。首先这个小机器人具有感知的能力,他有眼睛,可以感知这个环境:哪个地方是路,哪个地方是障碍。

感知的基础上它就会思考和理解,理解什么呢?比如说这个地方是平地它可以走,这个地方是下去的坡,它不能走,这就是理解。在理解的基础上,它说会去控制,去决策。所以说你看,从感知、理解到决策,在一个小的机器人身上体现得淋漓尽致,这就是非常直观地感觉人工智能涉及的几个方面。

智能的本质是学习

在今天的市场上面,充斥着智能设备,有智能手机、智能手表、智能水杯,前一段谷歌说做智能汤勺,我们在做智能筷子。它们为什么叫智能产品?他们是不是真的有智能?我们来思考一下。我们把所有的产品放在一边,另外一边是六七十年代的老式收音机。他们有什么不同,都是在人操控的情况下去完成一些任务,从这个角度讲,他们看似并没有太多的不同。

思考这个问题,实际上可以帮助我们区分现在的这些智能产品,哪些可能是不一定智能的。举个例子,如果在座的跟我是同一个年纪的话,在小学的时候学过一篇课文,讲板凳的故事,爱因斯坦做了一个小板凳,做的很粗陋,根据这个状况我们能不能说他不聪明。跟同年代的小朋友和做的小板凳比,你可以得出结论这个人不是那么聪明。爱因斯坦做这个板凳之前,每一天都在做好多板凳,每一次都在提升,根据他过去做的经验和教训去改进他的下一次。如果动态地看,你会发现他是一个不断学习成长的曲线。

这里面智能的本质在于什么呢?在于你是不是随着经验不断地演化,不断地进步,正如我们的主题叫觉醒叫进化,进化实际上是智能的本质。这里面的经验是什么呢?经验就是数据。你随着过去的经验数据能够不断地学习,不断地提升,今天可能不聪明,但是明天你会变得更聪明,这是智能的本质。所以学习是智能的本质。

经验数据与深度学习

这里面提到一个非常重要的方面,就是经验。在计算机科学和人工智能领域,我们叫它经验数据。经验就是数据,数据就是经验。这就涉及到我们今天经常提到的所谓大数据,是因为我们现在迎来一个伟大的时代,这个时代就是大数据的时代。我们来看看,移动互联网给我们带来怎么样的深刻变化。

比如说这是2005年圣彼得教堂门口的广场上,很多的信众在等待教皇的选举结果。八年以后新的一代教皇重新选举,同样是那批信众,我们看到移动互联网怎么改变世界,每个人都连接了他的设备,这些设备无时无刻都在产生数据。今天在座的每个人跟我一样连接平均两到三个设备,我的口袋里面就有两个手机。

但是这个数据到2020年,呈现不断爆炸性增长的趋势,甚至有比这个预测更加夸张的。前段时间乌镇大会上孙正义说到,2020年每个人要连接1000个设备。这个不一定那么夸张,每个钮扣可能都是一个智能的连接设备。移动互联网时代万物互联,随之而来的就是数据的爆增。大量的数据给我们带来前所未有的机会,所以说我们从万物互联到大数据时代,大数据时代随之而来的就是无处不在的智能。

最近几年,我们在人工智能领域经常听到最引人瞩目的领域就是深度学习。跟大数据时代悄然地发生在一起,这里面有它深刻的时代背景。我们看一下这个曲线,我们的横轴是数据规模,传统的人工智能的算法下,数据到了一定程度效果不再提升。对于深度学习,我们看是怎样的曲线。随着数据不断增长,效果会不断地提升。所以说深度学习可以帮助我们去吸收数据所带来的红利。从技术的角度是这样看,如果从商业的角度来看,你会看到如果你的商业模式也是随着数据的增长陈兴国ian这样的曲线,那说明什么?我要恭喜你,你有一个非常好的壁垒,一个竞争壁垒。

为什么?因为收集数据需要时间,别人要获得同样的能力,他需要花更长的时间,所以你永远跑在前面,搜索引擎就是这样的一个模式。基于大数据的商业模式是有很好的竞争壁垒。

百度深度学习的落地点

百度过去两年在深度学习这个领域可以说是做了很多工作。到今天,百度大脑这个项目已经取得了相当大的进展。它是一个无时不刻在学习、演进和进化的系统。两个月前我给大家介绍的时候,我介绍的是百亿级的参数构建世界上最大的深度神经网络,今天我把百亿级改成千亿级,可以构建更大规模的深度神经网络。

具体落地的有哪些呢?深度学习开始是受到大脑结构的启发。今天我们更多是从统计和计算的角度来看待这个问题,另外也有很多的学者从仿真大脑的生物学角度去做这方面的研究,这两条路应该是齐头并进,互通有无,互相帮助的。

至于谈到百度深度学习在内部落地在什么地方,我们可以看到在搜索、广告投放、图像识别和语音识别这些领域,都有相当大的进展。比如说我们看搜索,没有用到深度学习时,绿色的是我们在搜索满意度上面领先竞争对手的比例,用了深度学习以后,过去一年我们提升的比例是这样子的。从另外一个角度讲,它也是目前深度学习技术用在自然语言方面最成功的一个例子。

当然,在广告投放这个领域,整个百度凤巢广告系统已经进入深度学习的时代,广告的点击率提升非常显著,具体的数字是商业秘密,我不能讲,是百分比两位数的提升,这个对公司的营收是有一个巨大贡献。

在语音这一块,可以说我们过去两年里面语音识别率不断提升,移动搜索中文语音识别我们是世界领先的。在图像这个领域,去年我们在物体检测模型上单个模型是世界最好,谷歌是第二。

大家可能会关心,在过去几年里面,技术的发展在图像分类这个领域是一个怎样的量变到质变的过程,我们还是看图像分类的例子。这边我给大家演示的是在最近这几年,世界上最好的成绩是怎么样变化的。2010年世界最好的成绩在那个地方,整个深度学习往前发展,我们看到每年它都是以很快的速度向前演进。在2014年年底的时候,这个结果是到5.9%这样的错误率,这是百度做到的,也是世界上目前最高的图像识别准确率,大家可能会很关心,它比起人类的能力是什么水平。人类的水平在这个地方,差不多接近5%的错误率。

我们刚才讲的图像和语音,反映在我们的产品就是百度翻译APP,你可以用中文语音说,马上自动翻译成英文。它还可以拍照,外国人来上海,看到这样的菜单,拍照以后图像就能识别翻译成英文,可以理解这个菜是什么菜。

用人工智能的技术可以帮助小朋友有更快乐的童年,暑假可以有更多的时间玩。这不是直接帮你做题,它是告诉你知识点在什么地方。

关于人脸识别的技术发展,也跟大家汇报一下最新成果。在最通用的人脸识别的测试上面Facebook宣布做到最好的成果是97.35%,百度同事取得了更激动人心的进展,最好的人脸识别准确率是99.62%。斯坦福大学科研人员最近用人做了一个测试,人在这个数据上面达到99.2%。

我必须给大家澄清,机器的算法做到接近人的水平,其实只是说数据级上面做到人类的水平,整体来讲,现在机器智能的水平离人还是有差距的,我们还在努力中。

大家小时候有可能做过看图说话,你看到图片要用自然的语言描述这个图片的故事是什么。对于左边的这幅图,如果用一个自然语言描述说是一个黄色的bus,对另外一幅图像我们用自然的语言的句子“下午的阳光照进房间”描述这样一个场景。这些语言实际上不是人来写的,是机器生成的。

很多人工智能的算法在不断地积累它的势能,改变人们生活的方方面面,比如说机器人领域,具体的例子就是高度自动化的驾驶,这是百度深度学习研究院的团队同学们在改装的各种车,这边是我们的一个车上面的感知器演示,集成了雷达、红外、摄像头,每一个感知器覆盖了不同方面,有各自的优势和劣势,怎么样集成在一起对道路的情况有一个理解,自动地去行驶。

我们基于这些传感器对道路有三维的理解,这个理解做的比人更精确。比如说今天的导航系统只知道你在哪条路上,不知道在哪个车道上,我们利用更先进的感知系统可以使车定位在车道上面,精度是10-20厘米的距离。我们可以预见后面1-2年时间里面,导航系统会发生翻天覆地的变化,在北京的街头你要上立交桥的时候,有的时候前面有三五个分岔口,怎么走你会蒙掉,马上科技就会帮助你。

这是我们做的针系统,用深度学习开发图像识别技术,用低成本的摄像头帮你完成任务。完全没有人的自动驾驶不是我们追求的目标,这是很难做到,十年之后也许能够做到,中间是逐步实现的过程,它从辅助驾驶开始,通过感知器通知司机发生了什么状况。整个系统是让人去享受交通系统带来的便捷和安全,但并不是取代人。我们强调的是人车一体的驾驶,这就回到了一开始我的演讲题目——对人机关系的思考。

伟大的技术之所以伟大,在于让每个平凡的人更伟大

我们稍微回顾一下人工智能的发展原点,这个原点很大意义上是由于图灵测试,人工智能是研发能够取代人的机器,这样做是不是好,我们要有自己的一些思考。我们在百度过去做的产品里面,可以稍微反思一下,有两个产品。第一个是PK大咖,一个普通的人给自己照张像,找到很像的明星,用户很欢迎,每个普通人都有做明星的梦想。另外一个产品是拍照写诗,图像识别以后不光是识别,它还生成一首诗,更加复杂和先进。但从用户的反映来讲,用户对这个拍照写诗的兴趣不是那么大,为什么呢?因为这个产品只是去显示机器有多么的伟大,跟每个普通用户到底有什么关系。

我们看另外一个例子,左边是人工智能历史上里程碑式的进展——IBM的深蓝,它下象棋的能力能够达到人类冠军的水平,后面IBM什么事情也没有发生。另外一边也是人工智能技术,就是搜索引擎。搜索引擎使得在北京的一个小孩子,跟在遥远山村的小孩子只要有网络,获取知识的能力是一样的,一个在山村的小孩子也可以获取知识,可以有梦想。这个技术实际上对社会产生了巨大影响。

我们回到一开始开场的视频,这个自行车可以跟着你走。你跑步的时候,衣服可以放在上面,水可以放在上面,自己能很轻松地跑。或者你在什么时候吹一个口哨,它可以跟随你跑进房间。大家想到什么,这是车吗?我想你们在座的答案跟我想的是一样,它像是一个小黑马驹。所以说这个是我们对人机关系的一个思考。

我们认为伟大的技术之所以伟大,不是说让机器更伟大,它最重要的意义在于让每个平凡的人更伟大,更有创造力,他的生活更加美好。

最后我修改引述毛泽东同志的一句语录:世界是我们的,它也是机器人的。但是归根到底它是属于能够创造机器人,能够和机器人和谐共处并且利用机器人为我所服务的人的,谢谢大家。

原文发布时间为:2015-01-18

时间: 2024-07-31 20:56:21

百度余凯:数据是极好的竞争壁垒的相关文章

百度余凯:大数据人工智能

[CSDN现场报道]2014年12月12-14日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办,以推进大数据科研.应用与产业发展为主旨的2014中国大数据技术大会(Big Data Technology Conference 2014,BDTC 2014)暨第二届CCF大数据学术会议在北京新云南皇冠假日酒店盛大开幕. 百度研究院副院长,深度学习实验室主任,图片搜索部高级总监余凯发表演讲"大数据人工智能"."得人心者得天下"

36氪专访百度IDL主任余凯:Google Glass未达预期

摘要: 过去两年Google Glass也进行了不断的改进,从目前我们得到的信息来看, 这是一个非常不成功的产品 ,余凯告诉 36氪 . 已经有很多媒体得到过类似的结论,Wired甚至表示失败已经是Goo "过去两年Google Glass也进行了不断的改进,从目前我们得到的信息来看,这是一个非常不成功的产品",余凯告诉36氪. 已经有很多媒体得到过类似的结论,Wired甚至表示"失败已经是Google Glass(以下简称Glass)能够得到的最好结局",但是你听

余凯与雷鸣漫谈嵌入式人工智能 | 大牛讲堂

2017年2月的最后一天,北京大学"人工智能前沿与产业趋势"研究生课第二讲如约和同学见面.课程依旧由北大人工智能创新中心主任.百度七剑客之一.酷我音乐创始人雷鸣老师坐镇,而邀请的嘉宾则是地平线机器人创始人&CEO.中组部"千人计划"国家特聘专家.机器学习专家.互联网人工智能领域全球领导者之一余凯博士. 本讲围绕的主题是嵌入式人工智能,涉及了嵌入式人工智能的本质特征.软硬件结合联合优化.应用场景及未来的发展机会等等,亮点颇多. 余凯博士首先以"人工智

余凯豪言:进入深度学习时代

摘要: 刚刚结束的极客公园上,百度深度学习研究员常务副院长余凯分享了深度学习技术为百度的技术和产品带来的变化.今天的未来论坛中,余凯又向 36氪 介绍了近期百度在AI和智能硬件领 刚刚结束的极客公园上,百度深度学习研究员常务副院长余凯分享了深度学习技术为百度的技术和产品带来的变化.今天的未来论坛中,余凯又向36氪介绍了近期百度在AI和智能硬件领域的研究进展. 深度学习:百度可以比Google.Facebook做得更好 过去两年里,百度在深度学习领域做了很多事情.百度大脑已经取得了相当的进展,它无

地平线余凯:自动驾驶处理器的“三国时代”| 清华人工智能研习社

昨天,匆匆从机场赶到清华的地平线创始人余凯,用这样一句话为其在清华x-lab人工智能研习社的讲座开场. 这位曾经在百度开创了深度学习研究院(IDL),又进一步开拓了中国最引人注目的自动驾驶创业公司"地平线"的连续创业者略带抱歉的称,自己不擅长讲述商业模式.创业感悟.经历.自喻为"技术人",余凯在清华的这次讲座更多的偏向技术内容,而在清华,这显然比"创业故事"更令现场听众振奋. 图:11月9日,地平线创始人&CEO余凯在清华做了题为<

专访余凯:地平线完成Intel Capital领投的近亿美金A+轮融资,未来如何将嵌入式AI解决方案做到第一?

地平线CEO余凯与Intel高级副总裁&Intel Capital总裁Wendell Brooks 雷锋网(公众号:雷锋网) 旧金山当地时间2017年10月19日消息,Intel Capital今天公布将以6000万美金投资15家人工智能与大数据公司,这15家公司分别来自美国.加拿大.以色列.日本和中国,其中国内人工智能创业公司地平线入选这次公布的投资公司名单. 与此同时,另一条更值得注意的消息是,地平线官方也在当天同步公布完成近亿美元的A+轮融资,其中Intel Capital是本轮融资的领投

人工智能的冰与火之歌:回顾2016,展望2017(余凯)丨硬创公开课

编者按:本文内容来自地平线机器人创始人兼 CEO 余凯博士在雷锋网第 100 期硬创公开课的分享. 2016 年,人工智能在美好理想和残酷现实的夹缝中野蛮生长.当从业者们认为,人工智能时代是"技术为王"的时代,但面对价格战.商务战.公关战时,技术似乎不再是唯一的信仰.当从业者们认为,手握学术大牛.刷爆各种榜单就能所向披靡时,"AI 产品经理比科学家重要"."刷榜是没意义的"等反驳性观点也越来越被业内认可.当从业者们认为,招一大批名校博士就可与巨头

余凯的“地平线机器人科技”要做能推动产业跃迁的事

 "不好意思,我两点还要开一个会,我们尽量压缩时间!"  手里抓着刚从路上买回来的煎饼,余凯像一个学生一样端坐在新公司办公区角落的吧台前,神情真挚,略带狡黠,让人觉得眼前这个人,和中国互联网行业"人工智能领袖人物"的形象颇有一些错位. 自从宣布创业后,余凯变得更忙了.采访改期几次,终于成行. 余凯是谁?他为什么这么牛? 在辞职之前余凯曾经任百度深度学习研究院IDL的老大.这个听起来有些奇怪的研究院其实大有来头,是百度CEO李彦宏钦点成立,挂帅督导的部门.百度的业务无

余凯深访 | 中美 AI 竞赛差距加大,本土 AI 公司十年才能走向伟大

CES 2017 即将开幕,人工智能引爆全球最火黑科技盛会,一大波中国公司纷纷前往参展,占据半壁江山.火热的表象背后,中国的人工智能技术发展到底如何?是否能与西方国家相抗衡?AI专家余凯在启程前往CES之前接受了新智元的独家采访. 大国AI"军备"竞赛,中国差距蛮大 新智元:中美看似进入了" AI 军备竞赛"的过程,包括白宫也特意为此出了报告.您如何看待中国和美国 AI 实力的对比,从技术和行业生态环境的角度? 余凯:其实从更大的一个维度来看的话,一个是北美包括美国