网易科技讯 9月3日消息,百度世界大会2014在北京举行,会上百度副总裁王劲发表演讲,介绍“直达号”背后的百度大脑。
王劲表示百度大脑是由硬件和软件两部分组成的,硬件部分是由云计算中心和服务器组成,软件部分是由大数据和人工智能算法组成。百度大脑通过深度学习来模拟人类大脑的神经元,参数规模达到百亿级别。
王劲以识别图片来举例,“当我们拍一张花的照片,上传给百度,百度大脑把它转化成‘0101’的数字流,然后输入到深度神经网络里,经过层层的分析、复杂的学习算法和大数据比对,最后还原并识别出它是一朵花。百度大脑还可以告诉我们这朵花的名字,并在百度百科里面找到花的属性。”
而在更多的领域,百度大脑可以处理更多的问题,比如识别声音、诊断疾病、通过图片重构热门景点的三维场景,甚至未来还会应用在无人驾驶、机器人的身上。(易科)
以下是王劲演讲全文:
谢谢明远。刚才明远介绍了百度直达号,正如大家所看到的,百度直达号让购物、医疗、娱乐等人们生活的各个方面变得如此轻松,连接人和服务变得如此简单、便捷和智能。为什么百度直达号能实现智能的连接呢?这是因为直达号背后有百度大脑在支撑。下面我来给大家介绍一下百度直达号背后所发生的事情。
过去人们和电脑的交流基本靠自然语言,今天我们还能够通过图片、语音和电脑交流。当我们看到一片紫色的花海,过去我们拍个照后要到处问人,才知道这是什么花,而且不知道花名还无从搜索。今天我们可以拍张花的照片,上传到百度,百度大脑可以告诉我们这是什么花。百度大脑是智能的,当它知道我是一名学生,会通过百度百科让我了解花的各种属性;当它知道我喜欢养花种草,它会帮助我通过直达号连接到花店,我就能轻松地买到自己喜欢的花。这不仅仅让人们轻松地获得想要的产品,还能让店家在百度获得更容易的推广,把他们的服务提供出去,让店家把整个大自然变成他们的橱窗。
百度大脑不仅识别图片,还能辨识声音,这包括语言和音乐。在咖啡馆里,当我们听到一首喜欢的歌,可以录下来上传到百度,百度大脑就能够轻松地帮我们辨识这首歌的名字和歌手,比如这是陈奕迅的新歌《稳稳的幸福》。如果我很喜欢这首歌,就可通过百度直达号,到达音乐下载的网站,立即下载。百度大脑是智能的,如果知道我是陈奕迅的歌迷发烧友,还知道本地最近有他的演唱会,就可以帮我连接到票务直达号,去订票,选择座位,我就能一睹偶像的真容。这样,百度大脑轻松地把我的需求和商家的服务直接联系在一起。
除了娱乐之外,直达号能帮助人们解决日常生活中更大的难题。通过百度直达号,我们可以提供皮肤预诊服务。如果孩子的皮肤出现了问题,孩子爸爸妈妈很想知道严重不严重,应该到什么样的医院就诊,应该找哪位医生看病。现在他们可以简单地拿起手机拍一下患病的部位,上传到百度,百度大脑将照片和我们存储的数据库比对,给出初步的预诊建议,父母就知道自己该如何处理。通过百度直达号,推荐合适的医院和医生给父母。从我们的试运营期间效果来看,皮肤病预诊准确率达到93%。
当我们把视、听、说这三种能力都集成在一起,它就能把我们人类的感知能力提升到一个新的水平。BaiduEye就是这样一个产品,集成视听说于一体。我们可以把它提供给户外、博物馆、商场这些场所,让人们在这些地方的服务体验得到更好的提升。在户外和博物馆中,它能帮助我们识别出不认识的物体,介绍物体的属性和相关背后的故事,扩展我们的知识。在商场中,它就是虚拟的导购员,能根据我们的兴趣和偏好,推荐感兴趣的商品,随时随地在商场内给我们指路,还能识别并介绍我们关注的商品,帮助我们买到喜欢的商品。进一步对商家,它能够帮助商家更加了解自己的顾客,个性化地服务于自己的顾客。让大家来一起看看这段视频。
好了,百度大脑能强有力地支撑百度直达号,使人们寻找服务变得如此简单、便捷和智能。百度大脑是由什么做成的,为什么这么神奇?百度大脑是由硬件和软件两部分组成的,硬件部分是由云计算中心和服务器组成,软件部分是由大数据和人工智能算法组成。百度是全球首家将GPU用于人工智能和深度学习领域,全球首家规模化商用ARM服务器的公司。百度将它们整合在一起,形成强大的存储计算能力,从而使得百度能够超越竞争对手。百度云计算中心多次在行业评比中获得最高奖项。百度大脑通过深度学习来模拟人类大脑的神经元,参数规模达到百亿级别,这是世界上最大规模的深度神经网络。
百度拥有十几座大大小小的云计算中心。以我们六月底刚刚落成的阳泉云计算中心为例,大家看到它的设计非常漂亮。阳泉云计算中心拥有300万个服务器内核,可以存储和处理4000PB的数据。在绿色节能方面,它是中国最先进的云计算中心。国内其他家云计算中心使用千兆网络交换机,百度自主研发万兆交换机并投入使用,同时为了满足人工智能在计算和存储上的高要求,百度投入使用了4万兆交换机,并在探索10万兆交换机。大家可以看到,这座建筑不仅外形设计得美轮美奂,看上去像一座公园,而且具有高达99.99%的高可靠性。这座云计算中心总投资达到47亿元人民币。这里,我们有工程师7天24小时全天候值班,保障了服务和数据的安全。
百度大脑是怎么识别图片的呢?当我们拍一张花的照片,上传给百度,百度大脑把它转化成“0101”的数字流,然后输入到深度神经网络里,经过层层的分析、复杂的学习算法和大数据比对,最后还原并识别出它是一朵花。百度大脑还可以告诉我们这朵花的名字,并在百度百科里面找到花的属性。这是我们使用深度神经网络识别图像的例子。类似地,我们对语音的识别也是同样的道理。除了能够集成视、听、说的能力,可以做到过去做不到的事情,今后百度大脑能够为我们做得更多。
百度大脑和大数据结合,做了百度预测平台。在今年七月世界杯期间,我们对世界杯的结果进行了预测,这是一个热门的预测。当时有四家顶级技术公司拿出自己的顶级技术,在全球范围内强者同台竞技。我很高兴地告诉大家最后的结果,百度战胜了谷歌、微软、高盛,准确率排名第一。我们将预测平台用在流行病领域,结合中国疾病预防控制中心(CDC)提供的流感数据,得到疾病预测地图,为中国健康与医疗提供帮助。还有一个简单例子,我们将预测平台用在城市旅游上,提前两周预知热度,一方面帮助城市管理部门进行旅游宏观调控,另一方面帮助大家规划出行。经过我们不懈的努力,目前百度总共上线了7款预测产品,欢迎大家使用。
百度大脑还可以通过大数据,做到了我们过去想不到的事情。我们通过用户上传以及互联网存在的大量照片,对一些热门景点,通过一张张随意拍摄的海量照片,进行比对,百度大脑会重构成这些景点的三维场景。比如,人们拍了很多故宫太和殿的照片,有各种角度的,百度大脑读懂照片,去掉重叠和无用的信息,通过计算和想象,就能知道太和殿的里里外外,并能重构出太和殿的三维结构。这样,人们可以通过网上的虚拟游览,身临其境地感受故宫太和殿的宏伟。大家可以看看我们给大家带来的这段视频。随着上传的照片越来越多,可以说只要有足够的照片,百度大脑就能重构更多的景点。以后我们可以足不出户,便能体验三维虚拟旅游。
传统人工智能技术目前更多应用在数字世界中,例如图像、语音、自然语言处理、广告,尚未真正触及到真实的自然物理世界。如何让人工智能回归到我们触手可及的自然物理世界,正是我们努力的方向。大家也知道百度现在正在征服无人驾驶的挑战,这对人工智能的能力提出非常高的要求,不仅仅需要百度大脑具备感知和思考的能力,还需要决策和行动的能力。在真实的行驶过程中,这要求百度大脑不仅仅能准确实时地识别出静态的路面状况,如车道线、近处的交通指示牌等物体,还能看到远处的交通情况,超越人的视野范围。更重要的是,无人驾驶要求百度大脑不仅能360度全方位的检测识别出周边突发的状况,如左后方超车,还能够识别出行人和路障,及时做出正确的处理反应,保障行驶的安全。我们期望有了百度无人驾驶汽车,人们将永远告别疲劳驾驶和酒后驾车,大家来一起看看我们的努力。
把百度大脑放进有轮子的汽车,它就是无人汽车;放进飞机里面,它就是无人飞行器;放进人形机器里面,它就是机器人。机器人技术是制造业皇冠顶端的明珠。现在这个技术还很初级,但是它在不断进步,而且进步很快。
改变才刚刚开始,人类征服人工智能的道路还很漫长,百度需要汇集全球的人才,来赢得先机。我认识这样一个人,他出生在英国,长在香港、新加坡,求学、成名在美国。现在他不远万里,来到中国,加入百度。此刻他也来到了百度世界大会的现场,现在我们有请百度首席科学家吴恩达。