2013年被业内称为中国的大数据元年。“大数据”是继云计算、物联网之后IT产业又一次颠覆性的技术变革。在昨天甘肃卫视播出的《新财富夜谈》节目中,财经评论员叶檀、宏源证券[-1.51% 资金 研报]研究所副所长易欢欢、新财富舆情研究中心高级舆情分析师徐涛,共话大数据对生活和商业的颠覆。
无处不在的大数据
什么是大数据?互联网文本和文件、搜索、微博、微信和电商每天都产生海量的数据。美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年翻一番。除互联网外,手机、传感器网络、天文学、大气科学、生物化学等等也是大数据的来源。你见或不见,大数据就在我们身边。2013年两件大数据事件:美国波士顿爆炸案和中国雅安地震或许将阐明大数据巨大的作用。
叶檀:波士顿爆炸案是不是靠数据分析出来的?
易欢欢:波士顿各个地方都装有高清摄像头,异常的视频它会打上标签。当时就是一个黑色的背包莫名其妙的到了路边,这是一个异常信号,立马视频中心就报警了。爆炸之后回溯到这段视频,很快就看到是谁做了这么一个相应的行为,再连续性跟踪,没过多久就把犯罪嫌疑人给抓到了。这个案件里有几个因素与大数据相关:一是在海量的高清视频里面去提取这种异常节点的数据,在以前的传统技术里难度是比较大的;二是在多个非连续的摄像头中间,找到这个人相关的行动的轨迹,也需要通过新的技术处理方法。
徐涛:大数据有一个特点,就是它的非结构化数据快速增长。所谓非结构化数据,指的是图片、视频、文本、网页等。如何从这些非结构化数据里边去提取出有用的信息,这就考验大数据的计算和处理能力。
2013年4月20日雅安发生7.0级地震。很多人通过微博第一时间得知此消息。相比汶川地震,雅安的救灾更体现了社会化的机制。在大数据时代,每个人都是一个自媒体。网友的微博信息可以汇总到救灾指挥部进行数据分析,然后把更多的数据提供给公众,形成更有效的“自组织”。其中,手机成为了重要的救灾工具。中国联通[-1.61% 资金 研报]研究院副院长黄文良表示,地震后很快发现有3050个外地联通用户在雅安。
易欢欢:大数据的本质是实体社会的虚拟化。通过这一系列的传感设备把实体环境里面的状态虚拟化,最核心的标志就是以数据的方式来呈现的。
大数据正在开启一个重要的时代转型,它的风暴正席卷着各个拥有海量数据的行业。电影和电视也不列外。美国NETFLIX公司运用大数据投拍的《纸牌屋》大获成功,为中国的电影创作打开了一道刺眼的天窗。在今年上海国际电影节的论坛上,乐视影业执行董事张昭表示,在投拍或发电影是要做一些数据的调研。比如说《小时代》,你要知道它在文学网站上的点击量,什么样的人在点击,它在人人网、时光网上是多少评分,这样你就大概知道这个电影潜在的核心观众和第二圈、第三圈的外延观众在哪里。
大数据的跨界和颠覆
徐涛:现在国外用Twitter的情感因素去预测股市是涨还是跌。有一家公司通过这个去炒股,希望获得10%到20%的期望收益率。在中国,我们做舆情监测的是全网络的数据,包括股吧和微博。微博实际上是我们一个重点关注,很多负面新闻首先都是从微博开始传播,然后传统媒体介入,才把这个事情发酵扩大的。
利用大数据挖掘分析的舆情已经成为资本市场的“风向标”。6月20日,隔夜拆借利率突然疯涨至13.44%,盘中最高成交利率竟然高达30%!与此同时,各种传言漫天飞,与之相关的关键词排位靠前。据“新财富舆情研究中心”监测,从6月20日至7月1日,新浪、腾讯微博中的相关讨论分别为78万条和158万条,百度相关新闻约11万篇,股市也随之出现大幅波动。
叶檀:这么一说我觉得小股民没活头了,本来他是看技术指标,现在要看恐慌指标,要数据分析。数据分析不是一般人能做到的,要机构或者专业的数据分析公司来做。一般的股民去关注这么多微博,不太可能吧。
徐涛:这就给做工具的人提供了机会。
叶檀:大数据时代,哪些行业可能被颠覆?我先来说一个,我觉得金融行业会被颠覆。阿里小贷一出来我就觉得这玩意太可怕了。它海量的数据分析,无数的人在我这交易。现在银行做小微贷款成本多高,阿里成本太低了,完全不是一个数量级上的。如果说给阿里发一个银行牌照,所有的为小微公司服务的那些银行都要完蛋了。因为它数据分析太精准了,太方便了。
易欢欢:我觉得大数据会对医疗行业有非常大的影响。像苹果、谷歌会出来一款智能手表,无时无刻的采集你的体温,睡眠质量、血压、脉搏。这个数据可通过智能终端传递到远端,对你的健康进行良好的管理。还有智慧城市,我们之前去某大城市的交通管理委员会去调研,就发现交委拍摄的视频只能存两个星期,两个星期之后只能全部要删掉。所以视频的大数据的处理,现在就是交委最大力度的投资方向和重心。
上海交通大学计算机科学与技术系教授过敏意在第六届上海通信发展年会上表示,目前中国的大数据市场主要来自政府的部署、互联网行业、电信行业和金融。2012年到2016年,中国的大数据会迎来一个飞速的发展时期。2012年大数据产值已达到4.7亿,2013年的增长是138.3%,2016年一定会超过百亿。