5月29日,百度董事长兼CEO李彦宏在召开的百度联盟峰会上称,互联网领域有两件事是BAT(百度,阿里巴巴和腾讯的简称)不做或者没有做好的事情:一是企业级软件; 二则是大数据。尽管大数据一词已被各行各业人士炒得火热,但真正将大数据“变现”的项目少之又少。
炒作大数据
五年前,谷歌的一个研究小组在全球顶级的科学杂志《Nature》上宣布了一个令人瞩目的成果。该小组可以追踪美国境内流感的传播趋势,而这一结果不依赖于任何医疗检查。他们的追踪速度甚至比疾控中心(CDC)要快的多。谷歌的追踪结果只有一天的延时,而CDC则需要汇总大量医师的诊断结果才能得到一张传播趋势图,延时超过一周。谷歌能算的这么快,是因为他们发现当人们出现流感症状的时候,往往会跑到网络上搜索一些相关的内容。
谷歌预测流感趋势的成功,很快就成为了商业、技术和科学领域中最新趋势的象征,并引起了人们对于一个行业概念——大数据的关注。
早在1997年,美国宇航局研究员迈克尔·考克斯和大卫·埃尔斯沃斯,就首次使用“大数据”这一术语来描述超级计算机生成的海量信息。今日,人们对大数据内涵的理解早已与考克斯和埃尔斯沃斯的提法不同。大数据的定义转变为:需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
终于,在2012年,“大数据”一词被大规模地提及。这一年,包括《纽约时报》、英国《金融时报》都集中谈及了大数据的相关话题,有关大数据的书籍也可谓是汗牛充栋。
“大数据”炒作周期图 资料来源:Gartner
国际权威IT研究顾问公司Gartner的最新调查报告显示,“大数据”在2012年已经接近炒作的最高值,到今年,“大数据泡沫”时代即将结束。
从Gartner绘制的新技术“炒作周期图”中可以看到:当一个新技术出现时,如果开发者宣称这一技术可以“改变一切”,那么它一定会占据各大报纸网站的头版头条,然后也会有许多调查机构进行相关调查;当这一炒作达到一定阶段时,便不会继续下去,即达到了期待顶点,关注度开始急速下降;随后的一两年之内,有些企业进入实战阶段,从实践中总结出确实可以“改变一切”,同时负面言论也越来越严重;18个月之后,这一新技术再次兴盛并稳定发展,从而提高生产力。
在2012年至2013年间,各行各业对大数据的疯狂讨论,将大数据的概念推至顶峰。而到了2014年,舆论热度回落,如何将大数据“变现”,便成为现实中各大企业真正需要面对的问题。
大数据变现难题
Gartner对全美720家企业进行了调查,结果显示,仅有8%的企业已经开展了大数据项目,其余大部分企业都尚处于准备阶段。
大数据的火热与其商业模式的艰难形成强烈对比。李彦宏在百度联盟峰会上表示,虽然在过去两年,人类生产的数据,是占全部人类文明史上所有数据总和的90%,“但我们每天产生的很多数据基本都是没价值的数据。”即使是像百度这样已经将大数据的相关技术布置就位的企业,李彦宏依旧认为真正想要的数据还是没被搜集上来,“搜集上来的数据也基本没有价值”。
中山大学心理学博士何凌南在最近几年一直跟踪观察大数据的发展状况,并与国内的凯迪数据服务中心等数据服务机构进行合作,他对记者表示:“对于大数据,数据本身并没有价值,挖掘数据才有价值,并且,并不是单纯地用统计方法就能分析数据,它需要更为深入的理论掌握。”
目前,除了几家大型企业外,大数据项目的数据采集与分析往往被分离开了,采集由商业公司来做,而分析则交给研究机构。这样的行业现状直接导致了大数据的应用与商业计划相脱节。
不过,何凌南博士对大数据项目的未来依然保持乐观,“目前,大数据的投入产出比比较低。从短期来看,做数据采集、分析,成本确实比较高,但长期看来,大数据的应用渐渐成熟以后,就能大大地节省成本,大数据的商业模式也会更加成熟。”
清华大学计算机系教授马少平认为:“虽然现在大数据被炒作的有些过分,但现状确实是数据一直在成倍地增长,大数据的实质不会有变化,”数据总会有价值。
中国高等教育学会教育信息化分会理事长蒋东兴对马少平教授的观点表示赞同,他认为:“当前阶段,大数据一定是要‘炒糊’的,之后再浪淘沙,这是客观规律。数据作为IT要素中最重要的因素之一,一定会长远地得到重视和利用。