2012年的中国电影市场,《泰囧》无疑成了最大黑马,然而几家欢笑几家愁,之前热炒的《1942》成了电影市场最落寞的看客。和上映之前很多影视专家人看好《1942》不同,当时一家新成立不久的通过社交媒体数据预测电影票房的网站最早做了票房预测分析,这家数据预测公司得出的结论是,《1942》票房不会超过4亿,想要挣钱估计很悬。
后来现实证明了一切,数据不会撒谎,那些埋藏在社交媒体中,零散的非结构化数据像巨大的宝藏,就看你有什么工具将其挖掘出来。而这家初创公司,正是海银资本的创始合伙人王煜全全力投资的基于社交媒体领域大数据分析的公司之一。
王煜全,Frost & Sullivan首席顾问,海银资创始合伙伙人。海银资本是与门孵化和投资社交网络应用企业的机构,已经孵化了超过15家社交网络企业,积极推进社交媒体和大数据相关的科学研究和应用研发。他是一个坚定相信数据和理性力量的人。
《大数据中国》近期对王煜全进行了专访,探求大数据遇上社交媒体所带来的巨大魅力和大数据背后究竟隐藏着多大的能量。
新瓶老酒,大数据一直存在
大数据之所以能火,因为大数据有实在的商业价值,并和技术不断的发展有关,原因有几点:过去也存在着庞大的数据,但却是有需求而没有数据来源,无法满足企业的需求。目前,通过现在的技术手段,可以获得这些数据,所以大数据是应运而生。尤其是智能手机的快速发展,通过终端,数据可以有效积累起来;再加上云计算技术的发展,云平台的支撑让大数据能够在上面进行更好的运行。
大数据就是让孤立的数据形成新的联系
现在社交关系网络的出现使得我们可以通过一个人看出更多其它人的关系。如果要对一个人进行分析,就要对其历史情况作出分析并延伸,比如,一个人做过的偶然性事件,以前做预测不敢延伸,只会预测他未来一定会做以前不断重复做的事,把偶然性完全排除,这样的预测结果是收敛的。但是有了社会化数据,每个人的数据都存在整体的数据池里。以前理解数据时是孤立的,你的行为和我的行为没有关系;但数据池里大数据是不能孤立理解的,你以前的数据,只能用来预测你,不能拿来预测我。但是现在基于社交关系,就变成了1度关系,即你的数据可以拿来预测我。大数据的整体理念是整体看问题的理念,就等于是从上帝视角看到所有问题,然后再来看某一个点。这种时候,这个点就在周围环境里。
社交媒体让数据产生关系,从而产生更大价值
大数据,实质上就是从最简单的理念去考虑问题。但从大数据叠加带来的加成效应来看,则完全是突破性的。创新点就在于,以前的数据积累是零散性,现在的数据积累为系统性,能够让我们从更加全局的角度去思考问题,考虑时间因素、人际影响的因素、潮流趋势的因素,考虑更多现实的因素。
谷歌做安卓是最典型的例子。谷歌要把包括在国外事务相关的业务在内的社交数据做起来。如果是孤立的数据,那你收的是一堆计算机信息,计算机和计算机虽然也有联系,但是不能代表太多东西,这是物理连接,而人和人的联系则意味着很多信息,彼此之间能相互影响。因此,谷歌把Facebook当成最大的竞争对手,谷歌的数据量可能比facebook还多,但数据的含金量却没facebook高。facebook是一张基于社交关系的网络,它把一个无序数据变成有序数据。
现代交通危险系数高,但是我们不可能再回到马车时代
数据采集不是完全没有规则,现在都在积累规则。新浪微博是一个特例,它本来是个开放数据,用户微博上的资料是公开性的,对于这种开放数据的获取是不受限制的。未来获取的规则会慢慢规范。现在政府开始做数据采集方面的规范,用户或者企业能获取多少数据,不再是平台自己说了算。未来到底能取多少数据,哪些是该取哪些是不该取,哪些会受约束?一方面行业会逐渐的规范起来,另一方面监管机构也会完善起来。新兴行业都是这样,刚开始的时候会乱,慢慢大家把规则摸清楚了,那监管就起来了。
大数据是一个发展趋势,虽然会遇到各种问题,但是趋势不可逆转,就像现代交通工具有弊端,但是大家不会回到马车时代。所以大数据也如此,即使有弊端隐患存在,但是也无法把它废掉。
大数据会加强我们对未知的探索
基于大数据的分析,会带来更多的预测。但是大数据实际上最能预测的是人类机械的部分,就像你今天几点起床,明天几点起床。大数据没有创意,人们会越来越重视数据的力量,但是多样性依然存在,创造力才是人类最伟大的价值。大数据基于规则做预测,大数据不能没规则做预测。实际上,恰恰是因为大数据把基于规则的事情都干了,才能让我们有更多的时间探讨不规则。
“如果大数据能预测我的行车路线有什么不好的,那么这样我就可以不考虑开车的问题,我就考虑创造性的事了,所以这会焕发我们的活力,会加强我们对未知的探索,因为我们有时间去探索了。”王煜全举例说。
学会利用数据,才有更好的未来
由于信息不透明的缘故, 以前的商业靠价格竞争,不过这在大数据时代没戏,以后竞争要靠服务的竞争,靠个性化竞争。服务个性化基于对大数据的理解,从别人的行为数据要分析出他的行为特征、需求,然后做个性化提供,这个时代变成了拥有算法优势的人具备更多发展机会。“大数据的金矿就在这儿,看你会不会挖,会不会炼。”
人亦是如此,要学会利用大数据。现在很多争论挺有意思,如,微博微信来了,把大家弄的都很烦,信息突然从不足到突然过剩,而且谣言满天飞。很多人就说过去那个时代多好啊,一聊就是《人民日报》,但是那个时代回不去了,所以你只有适应大数据时代。 实际上,未来人们对幸福的需求是一样的,但未来的成功跟我们不一样。在过去你能成功,在未来未必能成功,这个时候我们要面向未来去思考。在大数据时代,会解读数据,会理性思考,会利用工具,你就会优秀。
大数据是无形的宝藏,但不是哪都有金子
如果是纯粹技术的大数据,意义不大,我更看重大数据的商业价值。如理论上气象也是大数据,但我们没有兴趣,因为我们还是要实用,要改变世界,并去提供服务。我们要思考大数据到底能干什么,能解决那些现实生活中的问题。
挖土机都一样,你挖出沙子,他挖出金子,那就不一样了。能看出地下有沙子还是金子,这就是区别。国内有些搞技术研究的不问青红皂白,挖了再说,这是中国人不好的地方。国外的研究方式是先看哪儿可能有金子,所以你看尼古拉斯·克里斯塔吉斯(《大链接》一书作者,本书2013年已由中国人民大学出版社推出)琢磨一件事,他看到了基于强关系的一些现象,比如老两口老是一个去世,另一个就活的不久,他发现这个有意思,有价值,要去研究,他就会发现金子。哪儿可能有金子,要求我们对矿脉敏感,但在目前中国环境下我们对矿脉不敏感。