在美国,从政府颁布的社会安全号、私营部门管理的个人信用记录,到互联网企业对于公开数据的应用,“大数据”已经渗透到居民生活的方方面面。
美国个人信用记录是美国人经济生活的“生命线”,小到开银行账户、办手机卡,大到买保险、贷款买房买车,甚至找工作、婚恋交友,都离不开个人信用记录。然而,个人信用记录只是美国“大数据”的一部分。如果要说个人信息数据最重要的一环,那还得从社会安全号——即美国人的“身份证号”说起。
在美国,几乎每一位合法居民都对应着一组9位数的社会安全号(社安号)。这组由美国社会安全管理局(社安局)统一分配的号码,与美国居民的社会福利和税收紧密相关,同时也逐渐运用到医疗、租房、贷款和办理信用卡等日常生活中,成为美国居民事实上的“身份证号”。(与我国的身份证不同,印有社安号的社安卡上并没有个人照片,也不能作为实际的身份证使用。一般而言,美国居民使用的“身份证”是各州颁布的驾照。)
作为罗斯福新政社会安全计划的一部分,美国的第一组社安号于1936年发布。美国政府建立社安号体系的初衷是记录居民的薪资水平,看其是否有资格获得社会福利保障。在社安号创立之初,社安局曾明令禁止该号作为身份证明来使用,直到1972年才取消这一规定。
随着社安号覆盖人群日益广泛,美国国会在上世纪60年代批准将社安号当作纳税人识别号来使用,自此社安号兼有税号的功能。相应地,美国的税收部门要求所有雇主必须取得员工的社安号,以方便缴纳个人所得税。雇主在法律上也有权拒绝雇佣没有社安号的人。
随后,美国的银行、保险公司等金融机构的介入进一步扩大了社安号的应用范围。这些机构将用户的社安号作为身份识别号录入系统,社安号由此成为查阅个人信用记录的关键信息索引。
时至今日,社安号已成为美国适用范围最广的编码体系。美国公民在出生之日即可办理社安号,其他永久居民和临时居民也可以凭此号在美国境内工作、纳税和生活。截至2011年,美国社安局已发放超过4.53亿个社安号,每年约发放550万个。
近年来,随着互联网数据的爆发式增长,坐拥海量用户数据的美国互联网企业也开始了越来越多的大数据应用。它们一方面通过收集、存储并分析用户数据,得出信息间的关联性,用于归纳并预测用户习惯、消费趋势等等,来制定商业决策;另一方面则推出大数据相关的产品和服务,为各领域应用大数据提供工具和解决方案。
以美国互联网巨头谷歌为例,近些年谷歌在公共医疗等领域的大数据应用颇为抢眼。2009年,在甲型H1N1流感在美国爆发前几周,美国公共卫生部门尚未公布流感数据,谷歌便宣布通过分析用户的搜索记录观测到了流感的传播,并准确预测了在各个州的传播情况。
据了解,谷歌把5000万条美国人最频繁检索的词条和美国疾控中心在2003年至2008年间季节性流感传播时期的数据进行了比较,希望通过分析人们的搜索记录来判断这些人是否患上了流感。为了测试这些检索词条,谷歌总共处理了4.5亿个不同的数学模型。在将预测与2007年、2008年美国疾控中心记录的实际流感病例进行对比后,谷歌发现,当将他们所筛选的45条检索词条组合用于一个特定的数学模型后,他们的预测与官方数据的相关性高达97%。就这样,在甲型H1N1流感爆发时,与滞后的官方数据相比,谷歌基于大数据的分析和预测显得更加及时有效。
本文转自d1net(转载)