刘佳
当BAT(百度、阿里巴巴、腾讯)中的腾讯、阿里正在围绕移动入口广撒投资网“买未来”时,看似“掉队”的百度,却在从技术里“谋未来”。
“百度内部有个‘百度大脑’的项目,用技术模拟人脑思维,现在大约已经相当于2~3岁孩子的智力水平。随着计算成本的飞速下降和计算能力的飞速提升,未来十几二十年,这样的大脑或许比人脑还要聪明。”昨日,百度董事长兼CEO李彦宏表示。
“人们会习惯忽视量变,但质变的时候会被打得措手不及。”李彦宏说。他的一番表态从某种程度上,更像是对近来外界批评百度在巨头之争中“掉队”的回应。
像人类大脑一样思考
“现在已经可以看到一些端倪,如无人驾驶汽车、智能机器人,可以看到有机器人代替酒店的行李员帮你拿行李,很多事情现在就已经可以做。等过5年、10年,我们可以看到,更多的东西可以通过互联网的方式来完成,那时中国的社会也会发生更加根本的改变。”对于互联网的未来,李彦宏这样预测。
百度方面数据显示,百度大脑是百度人工智能的产品,融合了深度学习算法、数据建模、大规模GPU并行化平台等技术,实现了实时学习和成长,它拥有200亿个参数,构成了一套巨大的深度神经网络。
事实上,百度对深度学习的布局一年有余。2013年年初,百度成立深度学习研究院IDL(Institute of Deep Learning),李彦宏亲自任院长一职,出马延揽硅谷技术专家,如Facebook前资深科学家徐伟,美国新泽西州立大学统计学教授张潼,异构计算专家、AMD异构系统前首席软件架构师吴韧,“千人计划”国家特聘专家余凯等专家。
有趣的是,百度在美国硅谷设立的IDL,位于加利福尼亚州库比蒂诺附近,距离山景市的谷歌总部仅6英里,在当地被称为“谷歌后花园”。
到了2014年年初,百度通过“少帅计划”揽人才,面向全球招募9名30岁以下的人工智能领域青年精英,提供的是T9、T10职级,这意味着年薪百万元起步。
昨日,百度对外表示,深度学习在百度自身产品上已经开始应用。例如百度大脑已经可以理解语音、图像、文本形式的检索请求,根据相关性做搜索排序;以及通过CTR(广告点击率)预估,做广告的精准匹配。
目前最新的进展是,通过深度学习技术的百度大脑,在语音技术方面,相对错误率降低了25%以上,移动搜索中文语音识别率突破90%;图像技术方面,推出全网人脸搜索引擎;而在全流量上线广告CTR的预估方面也有提升。
大数据改变传统行业
在全球范围内,此前有斯坦福大学和IBM、Google、微软、Facebook四家科技巨头设立了同类的深度学习研究机构。
此前,Google科学家杰夫·狄恩(Jeff Dean)告诉《第一财经日报》记者,Google X利用由16000多个处理器、10亿个内部节点组成的虚拟大脑,分析了1000万帧从YouTube上随机抓取的无标签视频剪辑图片,经过了10天时间的运转,“大脑”终于认识了什么是猫,并从接下来输入的2万张图片中准确找出了猫的照片。
杰夫·狄恩对本报记者预计,这项机器学习技术未来将用以帮助实现高质量的语音识别、实用型计算机视觉、拦截垃圾邮件,甚至应用于谷歌自动驾驶汽车。
而百度的做法是把开放云、数据工厂、百度大脑组成“大数据引擎”,把大数据存储、分析和智能化处理等一整套核心能力通过平台化、接口化的方式对外开放。
例如,上传海量孩子的哭声,根据小孩的哭声数据库来预测可能的症状;通过用户的脉搏、血压、心电等数据积累,依据海量数据判断或预警用户可能产生的病情等等。
百度昨日称,其大数据引擎将经历逐步开放的过程,目前采取邀请制和免费模式,和政府、非政府组织、制造、医疗、金融、零售和教育等传统领域展开合作。
这些合作企业和机构将能够在线使用百度的大数据架构,处理自身积累的大数据,同时融合百度大数据技术进行挖掘处理,改造传统行业的企业管理、商业模式等环节。
昨日,中国疾病预防控制中心(CDC)副主任高福表示,双方将结合疾控大数据与百度大数据,建成中国首个流感预测系统。
一位百度内部人士则对记者表示,传统行业市场空间较大,大量行业的单行业产值都在万亿级以上,百度大数据核心能力开放的“野心”是打开万亿级产业升级的想象空间。
但当阿里已经逼近千亿市值,而腾讯市值也在微信的推进下节节攀升时,百度仍需耐得住寂寞。目前百度仍有巨大的前期投入,这已经在百度的财报中显现出来:2013年全年,百度在技术研发方面的投入达41.07亿元,比2012年增长78.2%。