听到“大数据”,你是否和大多数人一样,觉得多有耳闻又轮廓模糊?用美国数据可视化专家尼古拉斯·费尔顿 (Nicholas Felton)的话说,大数据就是超出传统数据管理工具处理能力的大规模、复杂的数据集合,衡量标准包括数据量、处理速度以及数据种类。
而大数据真像传说中的那么有用吗?在今年夏季达沃斯论坛上,一场名为“大数据还是大忽悠?”的辩论会如期登台,参会者热烈探讨大数据带来的机遇是否被过分炒作。
大数据有多有用
“非常有用!”现任日本情报通信技术政策担当大臣的山本一太在辩论之初就力挺大数据。“这次日本东京能够成功申办2020年奥运会,民众的支持非常重要。在申奥之初,支持申奥的日本民众只有50%至60%,为了提高民众支持度,东京成立了一支公关团队来推广申奥。通过推特、脸谱等社交网络宣传2020年东京举办奥运会的意义,效果非常好,到申奥之前民众支持率达到了83%。”提到申奥的成功,山本一太很兴奋,“这是运用大数据的功劳。”“除此之外,在政治竞选和应对自然灾害时,大数据也帮了不少忙。2011年日本3·11大地震波及很多城市,正是通过大数据的统计,我们妥善安置了所有灾民,并开展了后续的救援及重建工作。”山本一太补充道。
辩论场之外,大数据解决方案的供应商们描绘出一幅宏大又激动人心的场景:在零售行业,零售商如何知道不同类型消费者的消费习惯?首先要建立一个信息系统对客户的性别、年龄、收入水平、交易程度等基本资料进行全方位分析,并且通过长期的交易系统捕获消费者的消费习惯,再从不同维度分析他们的价格敏感性、消费时间,然后就可以提供相应商品满足不同层面的消费者需求。除了能够选择合适的促销时间、地点和促销商品,完善的消费者数据库还可以实现精确打击——精准营销。电商在这个领域有很大的施展空间,比如根据消费者在网页上的浏览记录,对不同的消费者推送不同的广告:同样打开自己的博客,男士看到了汽车的广告,而女士看到的是香水广告,都是他们各自感兴趣的品牌。这样的营销对企业来说无疑有很高的吸引力。
除了线上和线下的零售业,金融业这一基于数据的产业对大量数据处理分析一直都有旺盛的需求,而传统行业供应链管理和财务系统的升级需要数据搜集和处理能力的提升。在社会公共领域,从基础设施的规划设计、交通的疏导调控到灾难的应急管理,都需要收集和处理大量的数据。
三点质疑
没有人怀疑数据的作用,但质疑大数据的声音主要集中在三点。
首先,我们真需要这么多数据吗?美国Kaggle公司总裁兼首席科学家Jermy Howard认为,人类所需要的关系并不复杂,太多大数据分解了人们的注意力。“搜集这么庞杂的数据要花费很多时间,处理数据也是。最好的方式是只提取最重要的数据,不该把时间浪费在无关数据的搜集和处理上。”加纳MPedigree网络公司总裁Bright Si-mons也认为,大数据面临着集中化的危险,对于人们而言,更重要的是“洞察”能力,是个人的自主性,从繁杂的大数据中挑选出有用的部分。
第二个问题:个人隐私怎么办?在超市购物时,你的会员卡会记录你的消费信息,相关商品的打折促销活动会不定时发送到你的手机。上网时你的cookie信息被读取,如果一年前你在电商网站里浏览了一张沙发,直到现在很多网页上都会自动弹出沙发的广告和促销信息,不管你需不需要。你在微博、人人等社交网站上发了一条“写论文好辛苦”的状态,结果每天都有无数的论文代写机构找上门来。我们的个人信息被各种数据供应商收集,成了数据产业链上无偿的原料。更令人担心的是,在网上任何设置了隐私屏障的信息在技术上都是可以被获取的。大数据时代,我们没有隐私,没有秘密。
于是引发了第三点质疑:如何保证数据安全?只要以数据形态存在,就天生带有安全隐患。数据库可能被盗、被黑、被扭曲、被替换。网上订了一份鸡肉饭送来了鱼丸粗面都是小事,结婚纪念日送太太的鲜花被写上了别人的名字就可能引发一场血案……而涉及到国家安全的信息,更是十分敏感。一旦数据安全受到危险,大数据会产生大隐患。
技术是无辜的
回头看看,大数据概念从兴起到火爆不过短短几年时间。2009年,“大数据”这个说法逐渐开始在互联网圈内传播。美国奥巴马政府在2012年高调宣布其“大数据研究和开发计划”标志着大数据真正开始进入主流的传统线下经济。2009年至2012年这段时间正是电子商务全球全面开花的时期,正是互联网与传统经济的碰撞,才真正催生出了今天几乎全民关注的“大数据”。
大数据不仅仅等于“数据海量”,还包括跨领域数据的交叉融合和数据的流动,而这样的数据不仅包括形式整齐的结构化数据,还包括以声音、图片、文字、数字等多种形式存在的非结构化数据。对这样庞杂的信息进行收集和处理,通过分析创造价值,谁也不怀疑这样的技术会深刻影响人们的日常生活。
但怎样使用这项技术,却与技术本身无关。一位大数据工程师不无遗憾地说道:“本来非常期待大数据技术能为社会带来一些变革,比如在城市规划、交通规划等方面的应用可以极大地便利人们的生活,但目前大数据技术的商业应用良莠不齐。电商对消费者数据的使用有点操控消费者的意思,而我们帮很多银行做的大数据平台也主要是面子工程或者应对监管的需要,大数据的影响力并没有真正发挥出来。”
北京大学光华管理学院副教授苏萌认为,现在大数据仅仅应用于服务行业,而实际上大数据可以应用到比如医疗、能源、保障等社会各个层面。目前的问题,一是大数据没有流动起来,在企业内部形成孤岛式的、独立的数据,没有发挥大数据的更大作用。其二是缺少一个完整的生态系统,没有形成从采集、挖掘、分析到应用的产业链,最后是缺少专业性人才,“大数据时代还没有真正到来。”