大数据最大的价值在">商业服务领域,商业通过大数据透视了用户深层次的特征和无法显见的内在需求。这与传统的数据分析有相似性却完全不同。传统的数据分析更多的是因果关系的追溯,通过数据所呈现出来的趋势了解某种行动所产生的某类结果。
与传统数据分析的逻辑推理研究不同,大数据研究是对数量巨大的数据做统计性的搜索、比较、聚类和分类等分析归纳,因此继承了统计科学的一些特点。统计学关注数据的相关性或称关联性,所谓“相关性”是指两个或者两个以上变量的取值之间存在某种规律性。“相关分析”的目的是找出数据集里隐藏的相互关系网(关联网),一般用支持度、可信度和兴趣度等参数反映相关性。两个数据A和B有相关性,只反映A和B在去取值时相互有影响,并不能告诉我们有A就一定有B,或者反过来有B就一定有A。这种分析方法决定了大数据所分析的是全局数据,不需要太多的考量精度,通过对所有数据的分析就能洞察细微数据之间的相关性,从而提供指向型商业策略。
正因为大数据时代全局数据分析的的这种特质,让用户隐私保护几乎是一个伪命题。互联网时代我们都清楚我们在网络上的一切行为都可以被服务方知晓,当我们浏览网页、发微博、逛社交网站、网络购物的时候,所有的一举一动实际上都被系统监视着。就像亚马逊监视着我们的购物习惯、谷歌监视着我们的网页浏览习惯,Twitter了解我们的心中所好,FACEBOOK似乎什么都知道,包括我们的社交关系网。所有这些网络服务都会通过对用户洞察获取商业利益,例如用户在电商网站上购买了衬衫,相关的衬衫推荐就会在未来一段时间内推荐给用户;用户在社交网络上提到某种产品或服务,这类型的产品或服务就能主动找到用户。所有这种商业行为本质上就是机构通过对用户隐私的洞察来获取商业收益。
如果说互联网时代人们的隐私受到了威胁,那么大数据时代无疑加深了这种威胁。如果不是大数据,这些服务方依然会对用户的数据进行分析,但更多的是针对某个特定的数据来关联服务。而大数据时代是完全不同的数据收集、分析方式是,是对用户的全景洞察,通过对用户所有数据的分析了解各因素之间的相关性。例如通过社会化网络数据的全景分析,了解用户在下一时段的购买倾向,甚至通过对所有用户购物行为的分析,清楚的提炼到底那些用户在未来一个月需要购买什么类型产品、需要多少数量。这种大数据的价值潜力,使得个人信息被更多采集、更久存储、更彻底利用。甚至有些看似无关紧要的信息,关联在一起就能精准定位到具体的某个人。
随着互联网逐渐成为人们生活的必需品甚至依赖品,而对于互联网企业来说,不掌握用户隐私对其来说是巨大的资源浪费和缺失。在大数据时代越来越多的互联网企业开始意识到,掌握更多的用户隐私,意味着更靠近成功的门口。互联网的下一波竞争是隐私之战,用户的隐私就是它们的核心竞争力。只有掌握用户在互联网的一举一动,才能实现对用户的洞察,如果放弃对隐私的控制,对它们而言无异于釜底抽薪。在这种情况下,杜绝互联网服务企业收集用户隐私几乎是不可能的。