阿里忙收购,李彦宏在忙…“深度学习”

路线选择的不同,使百度与腾讯、阿里的移动互联网战略可比性越来越弱。但百度的这个战略也面临挑战,最大的不确定性来自于数据的来源

要搞清楚一个互联网公司当下的主要战略方向其实并不难,只要看它们的创始人在干嘛,基本就能猜个八九不离十。以这个标准看,腾讯的马化腾在抓手机QQ,搜狐的张朝阳逼着自己看雷人电视剧,新浪的曹国伟当然还是在发微博,阿里巴巴的马云……退休了……

百度的李彦宏在做什么?他在年初成立了深度学习研究院(Institute of Deep Learning,IDL)并自任院长,亲自出马去延揽人才,并在全公司群发邮件介绍这些来自Facebook等硅谷巨头的技术专家。“以前就算是VP入职,也是HR和分管高管发邮件介绍而已啊。”三天前,一位百度员工看着又一封Robin发出的新进专家介绍邮件说。

深度学习对百度有啥用?

今年3月,一位在Google领导重要研究项目的人物低调来访百度,还去清华大学讲了次课。淼叔当时发了一条微博,说他会见了一堆百度的技术高管,还可能帮百度在硅谷的研究员招兵买马。

这个人就是Andrew Ng(吴恩达)。在他来访百度之后不久,即入选《时代》杂志年度全球最有影响力100人,成为16位科技界代表之一。吴恩达现任斯坦福大学人工智能实验室主任。他与大公司合作的一个项目,则代表了互联网巨头的下一步方向:这个项目,叫做Google Brain,它的领域,就是深度学习。

鉴于百度发布的研究成果比较少,我们可以用吴恩达取得的一些成果来侧面看看深度学习能干些什么:去年,吴恩达领导Google的科学家们,用16000台电脑模拟了一个模拟人脑神经网络出来,并向这个网络展示了1000万段随机从Youtube上选取的视频,看看它能学会什么。结果在完全没有外界干涉的条件下,它自己识别出了猫脸。

我们要注意的是,这种机器学习与我们通常意义上说的“机器识别”有所不同。现有的很多此类识别,需要人工输入一些用于对比的数据,或者一些已经进行初步分类、打好标签的数据,机器通过学习这些数据的共同点,得出规律,然后再去将规律应用于更大规模的数据中。粗略地说,这是一种“有监督的学习”,需要人工输入初始数据,有时候还要对识别结果进行判断,由此促进机器的学习速度。

而深度学习是一种“无监督的学习”。它基于一种学术假设:即人类对外界环境的了解过程最终可以归结为一种单一算法,而人脑的神经元可以通过这种算法,分化出识别不同物体的能力。这个识别过程甚至完全不需要外界干预。

还是以识别猫脸为例:吴恩达给神经网络输入了一个单词“cat”,这个神经网络中并没有辞典,不了解这个单词的含义。但在观看了一千万段视频,它最终确定,cat就是那种毛茸茸的小动物。这个学习过程,与一个不懂英语的人,在没任何人教他的时候,通过独立观察学会“cat”的过程几乎一致。

现在我们可以看出,深度学习对百度有什么意义了。最基本的,在门槛上,这个领域不是谁都能随便进来的,它需要有庞大的计算能力,海量的人类知识数据;更重要的,它能够完全自主地学习并数字化这个世界——然后就可以让人们搜索任何东西啦。

深度学习对互联网业务有什么帮助?

现在我们可以看看百度在深度学习方面做了哪些工作。年初,百度建立了深度学习研究院;随后,百度硅谷人工智能实验室成立,这个实验室与Google相距只有六英里,方便一些硅谷的人才直接在本地展开研究;5月,Facebook资深科学家徐伟宣布加盟百度,他此前负责的项目是“大规模推荐系统”,更往前,他在NEC美国研究院从事神经网络底层的研究。6月,李彦宏群发了他今年第二封新员工介绍邮件:曾任职IBM研究院、雅虎研究院的机器学习专家张潼加入。

这些是在人才架构上的动作。而在实际成果方面,深度学习的应用已经在2012年就出现了。百度多媒体业务负责人余凯用淼叔做实验对象,演示了人脸搜索能力。可能是出于强化戏剧性效果以便于传播的考虑,这个产品叫“明星脸搜索”。实验对象实时拍一张照片,百度可以搜索出这张照片最像哪个明星——但令人惊奇的是,在百度作为参考列出的互联网图片搜索照片中,第一张就是淼叔10年前拍的一张照片。也就是说,在没有任何其他条件限定的前提下,百度根据一个现实场景,找到了一个确定的人。

由于计算机的高度普及,很多人可能已经固化了“搜索”的印象:面对屏幕上的一个输入框,敲入一串词语,电脑返回一堆链接,用户再逐个点开查看哪个是自己需要的内容。但当我们要教会从没接触过电脑的父母这一搜索过程时,就发现它与人类天生的本能并不相同:父母们往往会指着一株不知名的植物,问电脑是否能告诉我们这是什么;他们也并不习惯键入文字内容(甚至还不会输入法),更希望对着电脑说一句“明天什么天气”就能得到答案。

传统的搜索,其交互方式是人工提炼出关键词输入,才返回答案。所以使用搜索引擎其实是一种技术,考验的是人能否准确观察问题、恰当提炼主题词,做到这些才有可能得到自己想要的信息。这就与一切搜索引擎“公平地为每个人提供信息”的初衷相悖了。

而深度学习的技术配合上大数据的储备,语音搜索、图像搜索等新兴技术就不再仅仅是技术的噱头,而是将搜索用户从数亿拓展到数十亿的大生意。这也是Google、苹果和百度纷纷在语音搜索上推出新产品的原因。

百度的移动互联网战略:抄后路

在PC互联网上,新搜索方式的出现可能仅仅是扩大用户规模。但在移动互联网上,这种变革可能是生死之争。

手机的小屏幕决定,用户不可能像在PC上一样顺畅高速输入,手机的麦克风和摄像头是比键盘普及得多的输入方式。而对语音搜索和图像搜索快速、高效地给出识别与匹配的结果,这正是深度学习所擅长的领域。所以百度语音助手虽然去年才推出,却在效果与一些专业做这个领域好几年的公司打成平手,语音搜索也一举占据了百度移动搜索10%的流量。在语音识别准确率方面,百度2012年一年的进展就超过了过去15年进展的总和。同样,百度图像识别技术应用于全网搜索以后,以图搜图的准确率一下子从20%提升到80%。

更重要的,除了入口之外,基于深度学习的大数据处理,将覆盖整个移动互联网的“后台”。移动互联网与云计算和大数据其实是一体两面的事务,高度移动化的手机等设备决定了它不会具有很强的运算能力,手机更多地是采集各类数据,将之传送到云计算平台,得到结果后再返回手机,供用户使用。将来的各类可穿戴设备也将是这种模式。

所以,在腾讯、阿里纷纷基于APP展开研发与收购时,百度在这个领域显得相对沉寂。其实从去年9月百度世界的战略发布上,就可以看出李彦宏的算盘:他希望在后台提供整个云计算能力,加上百度这些年积累的最为丰富的中文数据与搜索需求,支撑开发者研发、发布各种APP。这样,即使百度没有任何前端的APP产品,也依然掌握了移动互联网的基础设施。

百度无线事业部总经理岳国锋给我们盘点了百度开放给开发者提供的云开发能力与系统保障服务:云储存PCS、应用引擎BAE、云推送PUSH、位置服务LBS、自测平台MTC、众测平台、移动统计、开放平台提交、移动联运平台、In-App Ads。可以看到,既有开发、储存方面的服务,也有发行、营销能力的支持,还在移动变现方面进行了探索。

路线选择的不同,使百度与腾讯、阿里的移动互联网战略可比性越来越弱(其中阿里巴巴着眼于提供电商生态平台的建设,与百度的抄后路战略略微相似)。但百度的这个战略也面临挑战,最大的不确定性来自于数据的来源:腾讯拥有大量基于用户明确ID的行为数据,阿里巴巴则拥有整个互联网价值最高的电商流量数据。在PC互联网上,百度拥有搜索框入口;但在移动互联网上,杀手级APP的匮乏,可能会导致百度在数据采集方面脚步放慢。在移动用户飞速增长的大前提下,如何再造移动入口,通过大数据“深度学习”出移动互联网的未来? 这或许是百度面临的关键挑战。

(责任编辑:蒙遗善)

时间: 2024-09-14 08:12:54

阿里忙收购,李彦宏在忙…“深度学习”的相关文章

当年被马化腾和李彦宏看不起,阿里云如今营收超谷歌云计算

欧界报道: 如今,IT时代正在转向DT时代,云计算已经成为全球公认的趋势.一些巨头公司如亚马逊.微软.阿里巴巴.谷歌,甚至是百度.腾讯,都开始将云计算视为公司未来发展的目标.而国内起步最早的阿里巴巴旗下的阿里云已经开始尝到了云计算的甜头.   今年4月份, 德意志银行发布研究报告指出,阿里云年度净收入预估高于谷歌云计算,成为全球仅次于微软Azure和亚马逊的AWS的第三大云计算.其中仅去年第四季度的营收就达到1.28亿美元.    今天,我们都看到了阿里云的成功,但它并不是偶然的,也不是靠运气捡

【乌镇峰会解读(一)】李彦宏透露百度真正的护城河

题图说明:李彦宏:将来只要给马云拍个照,就知道谁和他结婚最合适!马云:.....(躺枪)首届世界互联网大会在昨天迎来高潮,由苹果.高通.领英和汤森路透高官组成的世界强队, 对话马云.李彦宏.雷军.刘强东.张朝阳为代表的中国互联网代表队.不过想象中的中外对撞并未出现,中国队再次发挥内战内行的特色,几个人唇枪舌剑不亦乐乎.不过,在媒体一遍遍刷各种大佬相声的时候,也不应该忘记,他们每个人都知道出现在台上的意义,都会把为公司代言隐隐放在首位.剥去口水战和互黑.自黑的外衣,每个人的发言,其实都隐隐透露出他

马云:我和李彦宏、郭广昌、鲁伟鼎交流阿里

阿里巴巴其实就是四块主要业务,第一块是阿里巴巴电子商务,包括了B2B业务.淘宝.天猫:第二块是http://www.aliyun.com/zixun/aggregation/13561.html">阿里金融:第三块我们没把它独立出来,现在放在阿里巴巴里面,就是数据业务:第四块是我们在外面一起做的物流体系. 但阿里巴巴的业务只是一个表象,我觉得阿里巴巴很了不起的是一批人管理的思想. 我们不是电子商务公司 我一直认为互联网不是一种技术,是一种思想.如果你把互联网当思想看,你自然而然会把你的组织

李彦宏透露百度有意收购小型英文搜索公司

新浪科技讯 3月28日上午消息,IT领袖峰会今日在深圳举行,在高端对话环节,百度CEO李彦宏透露有意收购一家小型英文搜索企业,向英文搜索发展. 不过李彦宏的这一意向暂时未能如愿,原因是虽然百度为了发展英文搜索,在需找小型英文搜索企业收购的机会,可是在市场上观察,发现除了bing和Google搜索,没有其他小型的英文搜索企业. "所以在中国互联网产业还是有很多机会的,虽然我们现在做的大一些,但是我们真的希望有很多新的企业出来."李彦宏说. 高端对话现场同时谈及百度垄断的问题,主持人吴鹰问

李彦宏91内部讲话:收购是因为趣味相投

8月14日消息, 腾讯科技多方获悉,http://www.aliyun.com/zixun/aggregation/11751.html">百度CEO李彦宏今日携高管在91召开内部全员大会,宣布百度与网龙已签署收购协议,李彦宏还透露,91和百度达成意向所花时间很短,接下去一个多月为业务交接期,希望双方在协作上能做得更好. 根据签署的并购协议,正式签约后如一切进展顺利,该交易 预计在2013年 第四季度完成,91无线将成百度全资附属公司,并继续在其当前 管理团队领导下作为独立公司运营. 另据

李彦宏否认百度将收购雅虎

据新华社深圳3月25日电 百度(微博)有没有可能http://www.aliyun.com/zixun/aggregation/8023.html">收购雅虎?25日,当2012中国(深圳)IT领袖峰会高端对话的主持人吴鹰向百度公司董事长李彦宏提出这个问题,立即引起了大家的兴趣. 吴鹰给出了看似合理的说法:目前百度市值约500亿美元,是雅虎的2.5倍.收购雅虎既存在可能,也有一举两得的效果.因为雅虎拥有阿里巴巴(微博)40%股权,收购前者可控制后者,化解阿里巴巴的竞争威胁,对腾讯也是巨大威

李彦宏拒绝谷歌收购:民族品牌发展的启示

近日,很多媒体都在报道百度创始人.CEO李彦宏的两次拒购:一次是百度上市前夕,李彦宏拒绝谷歌的并购,这个细节在2月28日央视虎年首期 对话节目中得到首次披露:一次是在百度国际化战略中,拒绝采用海外并购的方式,而是采取了从日本市场开始的海外自主发展之路.这也让笔者由此开始思考民族品牌的发展之路. 收购是打压中国品牌的惯用伎俩 2010年2月28日,央视经济频道<对话>节目昨晚推出虎年首期节目,百度董事长兼CEO李彦宏作为嘉宾做客节目.李彦宏首度谈及2005年百度上市前夕,谷歌CEO施密特曾秘密造

互联网企业发家史之一:李彦宏这样拿到第一笔投资

中介交易 SEO诊断 淘宝客 云主机 技术大厅 谁最早发现了百度? 1999年,当德丰杰正在为自己的DFJ ePlanet基金忙得不亦乐乎的同时,还从没有想到过公司将来的明星投资企业是中国的搜索引擎企业--百度. 同年,李彦宏受徐勇之邀来到硅谷,两人都是来自美国东部,在闯荡硅谷时结识,这一次,李彦宏是参加徐勇担任制片人的影片<走进硅谷>首映式,除了看片,两人还决定成立一家公司承载资源:一是可以让李彦宏手上的全球第二代搜索引擎核心技术"超链分析"专利得到利用;二是徐勇在拍摄&

马云:马化腾李彦宏都是“少年派” 好公司是管出来的

退休的事是真的.我想了9年,计划了6年,实施了3年. 我跟自己讲,我们到这个世界上不是来工作的,我们是来享受人生的,我们是来做人不是做事.如果一辈子都做事的话,忘了做人,将来一定会后悔.所以,我觉得48岁以前我的工作是我的生活,48岁以后我希望我的生活是我的工作. 不管事业多成功.多伟大.多了不起,记住我们到这个世界就是享受经历这个人生的体验.忙着做事一定会后悔.我不希望自己70.80岁还在公司开早会,我的同事很生气,又不好意思说. 昨天(2013年3月30日)晚上到的比较晚,晚上跟大家聊的特别