关于大数据的概念,尽管有被炒作过度的嫌疑,但让我们不可否认的一点是,全球的数据量正在以每18个月翻一倍的惊人速度增长,世界正在走向高速数字化时代。面对这个时代,如何掘金大数据是所有个人、企业和国家的机遇和挑战。事实上,从建筑设计到影视制作,从城市交通到空气质量,无论我们承认与否,大数据分析应用已经无容置疑的渗透到我们生活的方方面面,并将改变人类社会的命运,大数据就在脚下,尽管很多时候我们压根就没有意识到。下面介绍的八个改变我们生活的大数据应用。
一、Netflix:推出史上首部大数据制作的电视剧《纸牌屋》
Netflix是美国最大的商业视频网站,拥有2900万个用户。Netflix本身也是一个大数据运营商,每天采集海量的用户数据,不仅包括人们喜欢看什么类型的视频,在哪看,用什么设备看等,还包括你何时快进,何时暂停,是否看完整个影片等。Netflix还拥有全球最优秀的用户推荐系统,并在大数据竞赛网站Kaggle以百万美元悬赏能够提高其推荐准确率的算法。
正是因为有了大数据分析这件武器,Netflix才敢斥巨资推出《纸牌屋》,彻底颠覆影视发行业。《纸牌屋》是首个“胆敢”一次性播出整季剧集的在线电视剧,而不是像普通的电视剧那样逐集拍摄播放,根据观众意见进行剧情和演员阵容调整。因为有了强大的大数据分析支持,Netflix已经完全可以预测受众和市场反应,将原版《纸牌屋》的粉丝和凯文史派西与导演大卫芬奇的粉丝整合到一起,而《纸牌屋》也是堪称史上首部“大数据制作”。参考阅读:纸牌屋探秘:Netflix的大数据炼金术
二、家谱网站Ancestry.com
Ancestry.com帮助人们寻找家族亲人,整理家谱,这看上去似乎并没有什么科技含量,但实际上,这意味着需要维护超过110亿条记录和超过4PB的内容,包括历史记录、生日、死亡记录、战争和移民记录甚至手抄的年历。Ancestry.com使用先进的内容处理技术索引内容,使其便于搜索。Ancestry.com还根据追加的DNA(例如一试管口水)分析产生新的数据流,并在数据库中进行比对分析,帮助用户找到亲人。总之,Ancestry.com从头到脚都是标准的大数据应用案例。
三、西奈山医疗中心
西奈山医疗中心(Mount Sinai Meddical Center)是美国最大最古老的教学医院,也是重要的医学教育和生物医药研究中心。该医疗中心使用来自大数据创业公司Ayasdi的技术分析大肠杆菌的全部基因序列,包括超过100万个DNA变体,来了解为什么菌株会对抗生素产生抗药性 。Ayasdi的技术使用了一种全新的数学研究方法:拓扑数据分析(Topological data analysis),来了解数据的特征。
四、加州电网系统运营中心
加州电网系统运营中心(ISO, Independent System Operator)管理着加州超过80%的电网,像3500万用户每年输送2.89亿兆瓦电力,电力线长度超过25000英里。该中心采用了Space-Time Insight的软件进行智能管理,能够综合分析来自包括天气、传感器、计量设备等各种数据源的海量数据,通过可视化界面,用户可以以最优的方式优化和利用可再生能源,平衡全网的电力供应和需求,并对潜在危机做出快速响应。