文/科技有一说一
刚刚结束的巴西世界杯上,首次出现了大数据预测世界杯的高科技,百度大数据不仅成功预测德国夺冠,而且在决赛之前的比赛结果预测中也是以超高的准确率被网友称作“预测帝”,让普罗大众在世界顶级赛事中见证了大数据的威力。
“数据已经成为一种新的经济资产类别,就像货币或黄金一样。”在两年前于瑞士达沃斯召开的世界经济论坛上,大数据的大影响已经是当时讨论的主题之一,并提出了这样的观点。
根据科技研究公司IDC作出的估测,数据一直都在以每年50%的速度增长,换而言之,也就是每两年就增长一倍。而仅在2012年,就有2.8 ZB的数据——约1021 字节,相当于24亿亿条微博——被新建和复制。每天更是有成百上千PB(1PB=1024TB,1TB=1024GB)的数据库读取。
欢迎来到“大数据时代”(Age of Big Data)。这是两年多《纽约时报》在一篇大数据科普文章中提出的口号。什么是“大数据”?《纽约时报》指出,这当然是一个带有文化基因和营销理念的词汇,但同时也反映了科技领域中正在发展中的趋势,这种趋势为理解这个世界和作出决策的新方法开启了一扇大门。
作为最大的中文搜索引擎和国内最大的互联网公司之一,百度不仅是天然的大数据企业,而且在开发和运营搜索引擎的过程中凭借雄厚的技术积累,形成了一整套的自主研发的大数据引擎系统,包括数据中心服务器设计、数据中心规划和设计、大规模机器学习、分布式存储、超大规模集群自动化运维、数据管理、数据安全、机器学习(特别是深度学习)、大规模GPU并行化平台等方面。同时这些技术的发展也像强大的“引擎”一样,推动着百度业务不断创新。
技术改变互联网,驱动创新,改变世界。百度大数据引擎可以对大数据进行收集、存储、计算、挖掘和管理,并通过深度学习技术和数据建模技术,使数据具有“智能”的技术能力。这些“智能数据”一旦被传统行业所利用,就能显著推动其行业升级和业务创新。
过去,百度“大数据引擎”一直在强有力地支持着百度及其合作伙伴的业务,充分证明了其引擎的先进性、开放性和安全性。大数据引擎如果”安装“在传统行业,就像在飞机上用“喷气式”发动机取代涡轮发动机那样,能极大地加速企业转型升级和商业创新,堪称互联网改造传统行业的核心利器。
今年4月,在以“大数据引擎驱动未来”为主题的百度第四届技术开放日上,百度宣布正式发布大数据引擎,将包括开放云、数据工厂、百度大脑三大组件在内的核心大数据能力开放,通过大数据引擎向外界提供大数据存储、分析及挖掘的技术能力,这是全球首个开放大数据引擎。依赖于百度公司的技术基因,基于“深度学习”的计算机模拟人脑项目“百度大脑”应运而生。作为百度大数据引擎的精华,代表人工智能水平的百度大脑(Baidu Brain)融合了全球领先的深度学习算法、数据建模、大规模GPU并行化平台等技术,实现了无时无刻不在学习与成长,它拥有200亿个参数,构造起世界上最大的深度神经网络。
世界杯结束之际,有媒体援引业内普遍观点认为,随着对大数据业务的发掘,2014年世界杯将成为国内大数据业务正式成熟的起点。根据市场研究机构IDG公布的2014年大数据企业调查和预测结果则显示,今年各大企业将在与大数据有关的项目上平均花费800万美元。该研究还发现,其中70%的大企业已经部署或者正在计划部署与大数据相关的项目和计划,56%的中小企业已经部署或正在计划部署大数据项目。
实际上,大数据的应用早已在改变着我们的经济生活,百度大数据已经在旅游、教育、赛事产业进行了多次尝试,部分产品有望在年内实现商业化。而继世界杯之后,百度大数据预测还将相继推出票房预测、房地产预测、金融预测、中小企业指数预测等一系列产品,并在9月中旬的时候推出预测开放平台,最大程度地开放百度在大数据领域的数据和技术能力,推动整个大数据行业的快速发展。