2012年以来,“大数据”一词越来越多地被人们提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。大数据、人工智能、云计算,这些原本听起来离大众生活非常遥远的it专业术语,如今正实实在在地改变着人们的生活。正如马云所说,大家还没搞清pc时代的时候,移动互联网来了,还没搞清移动互联网的时候,大数据时代来了。
大数据有何价值?
巨大的数据价值是大数据最重要的特点。只要合理利用数据并对其进行准确的分析,将会带来很高的价值回报。
例如,沃尔玛公司利用计算机对其公司销售商品的分析,发现纸尿布和啤酒在销量上呈正相关。沃尔玛公司进一步研究发现,美国家庭大多由年轻爸爸下班后到超市买纸尿布,会顺便买几瓶啤酒回家享用。于是,沃尔玛公司就把纸尿布和啤酒摆在一起,提高了两者的销量;谷歌公司应用了大数据技术,比美国政府的公共卫生部门早两周时间预告2009年甲型h1n1流感的暴发。企业尚且如此,对国家来说,大数据更具巨大价值,有识之士已将大数据定义为新兴的战略性资源。
从浩如烟海且形式各样的数据中,迅速获得有价值数据的工作,需要许多计算机集群才能共同完成。21世纪初兴起的云计算及相应软件的出现,才使大数据中有用价值的提取成为现实。依托于云计算实时采集的大数据可以通过这一平台向数十、数百或甚至数千的电脑分配工作,原本很难处理和使用的大数据被利用起来了,大数据得以实用化。
大数据将带来哪些变革?
美国未来学家阿尔文?托夫勒1980年在其著作《第三次浪潮》中,就曾预言过未来将产生信息大爆炸,揭示了大数据时代即将来临。2011年麦肯锡总结大数据现象并发布报告,点燃大数据热潮。
大数据是人与互联网活动的产物,未来它将对人类的科技、生产、社会活动乃至人类的生活产生较大的变革,将会对人们的生产过程和商品交换过程产生颠覆性影响。“大数据”的本质是基于互联网基础上的信息化应用,其真正的“魔力”在于信息化与工业化的融合,使工业制造的生产效率得到大规模提升。传统制造业有了大数据,可以从“制造”向“智造”升级――从产品设计端到最终销售,都可以通过大数据进行智能分析。企业可以快速响应市场需求、科学研发产品,并且精准营销。目前汽车行业已在借助大数据,对数亿网民与汽车相关的请求进行大数据挖掘,形成行业指数和分析报告,帮助汽车企业了解消费者需求。由于有了大数据,手机、电视、冰箱等传统电子和电器产品变得智能化,激发了用户新的消费需求。
又如,传统统计学只能以尽可能少的数据,证实尽可能大的事实,其覆盖面、随机性、代表性与真实性常受到质疑;而由大数据得出的统计,其广泛性、代表性与即时性都无可置疑。大数据对传统医学带来冲击,未来可穿戴医疗设备将个人即时采集的数据传上云端,存入个人数据库;数十年伴随个人成长与衰老的巨量数据,是每一个人的宝贵财富,能够迅速提供全面的动态数据,帮助医生做出诊断。
如何应对大数据带来的挑战?
“大数据”不能生产出新的物质产品,也不能创造出新的市场需求,但能够让生产力大幅提升。大数据将成为提升机构和公司竞争力的有力武器,企业与企业的竞争已经演变为数据的竞争,工业时代引以为豪的厂房与流水线,变成信息时代的服务器。
从2012年开始,美国、英国、日本等国积极资助大数据研发。3月22日,奥巴马政府宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家战略。截至2012年12月,共有54个国家加入了由美国发起的“开放政府计划”。
大数据信息平台的建设可以消除政府各部门间、政府与市民间的隔阂,消减信息孤岛现象,从而提高政府各机构的协同办公效率,提高政府决策的科学性和精准性,提升社会治理和公共服务能力。
在中国,2011年底工信部发布的《物联网“十二五”发展规划》中,把信息处理技术作为四项关键技术创新工程之一被提出来,其中就包括海量数据存储、数据挖掘、图像视频智能分析。今年8月14日,中国数据中心产业大会召开,会议的宗旨是以引领数据中心发展、分享数据中心创新成果、促进数据中心洽谈交易,为推动我国数据中心产业持续发展作重要支撑。当前,在我国全面建成小康社会的征程中,工业化、信息化、城镇化、农业现代化任务很重,建设下一代信息基础设施,发展现代信息技术产业体系,推进信息网络技术广泛运用,是实现“四化”同步发展的保证。大数据时代已经来临,让我们满怀激情地关注大数据,利用大数据,开发大数据。(市老科协)
大数据
2011年全球数据若刻成dvd,排起的长度可往返地球至月亮
大数据(bigdata),又称巨量资料、海量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理的资讯。
国际数据公司定义了大数据的四大特征:海量的数据规模(vast)、快速的数据流转和动态的数据体系(velocity)、多样的数据类型(variety)和巨大的数据价值(value)。仅从海量的数据规模来看,全球ip流量达到1eb所需的时间,在2001年需要1年,在2013年仅需1天,到2016年则仅需半天。全球新产生的数据每年递增40%,全球信息总量每两年就可翻番。而根据2012年互联网络数据中心发布的《数字宇宙2020》报告,2011年全球数据总量已达到1.87zb(1zb=10万亿亿字节),如果把这些数据刻成dvd,排起来的长度相当于从地球到月亮之间一个来回的距离。