大数据是“啤酒+尿布”?解读“大”的三维特征

“大数据”这一概念最初起源于美国。这里的“大”通常用来描述数据的三维特征:第一维指信息的数据体量日益庞大;第二维指信息的种类繁多;第三维指数据变为可用信息,并且可以分析速度越来越快。

早在1969年,全球零售巨头沃尔玛便利用计算机对消费者的购物行为进行数据分析,结果发现男性顾客在购买婴儿尿布时,常常会顺便“搭配”几瓶啤酒来犒劳自己,于是推出了将啤酒与尿布捆绑销售的促销手段。如今,这一“啤酒+尿布”的数据分析成果,已成为科学家通俗解释“大数据”技术的经典案例。

“‘大数据’具有多种多样的定义方式,这一概念最初起源于美国,是由思科、威睿、甲骨文、IBM等公司倡议发展起来的。这里的‘大’通常用来描述数据的三维特征:第一维指信息的数据体量日益庞大,如今已从TB级升到EB级,又将跃升到zettabytes级;第二维是指信息的种类繁多;第三维是指数据变为可用信息,并且可以分析的速度越来越快。”在接受本报记者采访时,美国加利福尼亚大学里弗赛德分校计算和通信专家杨鸣博士强调,“最近媒体常常议论的大数据,其实专指大数据的第四维特性,即数据的使用价值,主要体现在数据的智能分析上。”

杨鸣说,智能分析是一种对未来智慧的投资,分析的最终目标是做出更明智的决定。有些人误以为大数据只是数据技术处理的升级,即如何存储和备份拥有的数据,但大数据的真正意义在于用新的方式对数据进行分析,并作出合理解释。

大数据所涉及的信息与人密切相关。与人有关的信息占世界上所有数据的90%,主要包括电子邮件、视频文件、社交网络、博客内容、呼叫中心的对话等等,它正以惊人的速度增长,年复合增长率高达62%。大数据的应用,将有助于决策人灵活应对现实世界中“数据海啸”引起的机遇和挑战。

“人类信息”将引起信息技术(IT)的再次进化。多年来,科技界一直在改变信息技术(IT)中技术,也就是“T”的含量。例如,引进大型计算机、客户端服务器、网络供应(IP)、云计算等技术。大数据技术第一次使信息,也就是“I”在IT中发生了变化,从传统的信息(Information)之“I”向着智能(Intelligence)之“I”发展。

对人类信息进行“技术理解”,需要从根本上采取新方法和新技术,以便为人类无时无刻不在增加的信息提供洞察力、想法和直觉。未来的信息计算将以大数据模式,引起人类社会信息交互方式的根本性转变,以智能分析为前提的信息应用将会以更大规模解读人类,挖掘人类信息的价值。

当通过信息搜寻来揭露犯罪时,破案人员可以从犯罪嫌疑人的电子邮件中寻找证据;当试图理解客户群时,营销人员可以搜寻和分析客户公开的所有信息,既可以是研究者自己数据库所掌握的,也可以是被调查者公开在微博或博客上的信息。这一图景使我们看到,在当今信息爆炸的社会中,信息流动和分析正变得越来越复杂。

美国白宫科技政策办公室在去年3月29日发布了《大数据研究和发展计划》,同时组建“大数据高级指导小组”,显示美国已把应对大数据技术革命带来的机遇和挑战提高到国家战略层面。

去年8月,对1105家美国企业和集团进行的调查显示,63%的受访者认为只有实施和使用大数据技术才能完成各自机构的使命,49%的受访者表示将增加他们的大数据预算,46%的受访者计划至少保持他们现有的大数据预算水平。

杨鸣对本报记者表示,对于像中国这样的发展中国家来说,在高科技领域追赶国际先进水平应该还是比较容易的,应当在大数据研究上加大力度。主要包括两个方面,一是在作为大数据技术基础的云计算方面,要着力应用开发;二是在数据处理方面,不仅要重视结构性数据(即已经数字化了的信息),而且要重视在电子邮件、博客等非数字化的人文数据分析。

(责任编辑:蒙遗善)

时间: 2024-08-03 20:19:09

大数据是“啤酒+尿布”?解读“大”的三维特征的相关文章

企业需要哪些大数据人才?如何解读大数据?

假如你是一家麵包店的老闆,你会怎么解决以下这些问题: 问题1. 烤箱的产能有限,该选择生产哪些种类的麵包? 问题2. 想在网上行销麵包店,哪一种广告比较有效? 问题3. 怎么从麵包判断,麵包师傅有没有偷工减料? 用管理的语言来说,以上分别是「预估需求分配产能」「评估行销方案成效」和「产品品管」问题,也是工作场合中经常会遇到的情境.这些问题,乍看之下似乎和统计无关,但是其实每一个问题都可以应用统计的观念和方法,来构思解决之道. 如果你具备统计思维的话,这几个问题的思考方向如下: 1. 列出最受欢迎

“银发”出行大数据还须全面解读

10月9日重阳节,<旅行社老年旅游服务规范>正式实施一月有余,备受关注的老年人出行现状如何?去哪儿网8日发布<2016年度"银发"出行大数据报告>显示,60周岁及以上老年人出行目的地多在国内,今年超一半老人出游无子女随行.(据10月9日<北京日报>) "超一半老人出游无子女随行"作为新闻标题颇为夺目,尤其在重阳节尊老爱老的氛围下,白发老人自行出游多多少少显得有点"孤寂". 然而,"银发"出行

2014大数据热点话题与趋势解读

世界范围的信息化变革使得几乎每个行业都面临着大数据问题.为了有效地应对大数据带来的全方位挑战,同时充分利用这一前所未有的大好机遇,国内外的产业界.科技界甚至各国政府都在积极布局.制定战略规划.2012年3月,美国政府宣布了2亿美元的"大数据研究与发展计划",对大数据的研究上升为国家意志.欧盟也出台了类似的举措.在这样的背景下,中国计算机学会于2012年10月成立了CCF大数据专家委员会,意在探讨大数据的科学与技术问题,推动大数据学科方向的建设与发展,同时构建面向大数据产学研用的学术交流

最新大数据行业鸟瞰图及解读

原标题:Matt Turck:大数据行业信息图以及一些思考 本文来自潘星键投稿(@星键V:微信:akavir),他在汤森路透从事数据质量分析工作近7年,文章编译自Matt Turck<The State Of Big Data in 2014: a Chart>,Matt Turck曾任Bloomberg Ventures常务董事,现为FirstMark Capital合伙人. 从我第一次尝试为繁荣发展的大数据生态系统绘制一张信息图已经过去了两年, 而这期间大数据行业发生了很多巨大的变化. 我

大数据产业迅猛发展 解读2017年八大趋势

弗雷斯特研究公司的研究人员发现:2016年,近40%的公司在实施大数据技术,并且扩大了采用力度.另有30%的公司计划在未来12个月内采用大数据技术. 迅猛发展的互联网将我们带入了大数据时代,大数据已经成为发展中不可或缺的力量支撑,那些专注于数据挖掘和数据服务的公司同样成为不可低估的新兴力量.在已经走完的2016年里,我们见证了大数据的应用与变革,2017年,大数据的世界又将发生怎样的变化? 大数据的发展 在预测未来之前,先来看看大数据近四年的发展.2013年被成为大数据元年,发展至今,新的技术不

大数据时代DT+成为大趋势

文章讲的是大数据时代DT+成为大趋势,大数据已经成为整个社会的底层架构和标配,其上的一切都必须按照大数据的要求进行重构,大数据在解决大问题方面尤为有效,目前在语音搜索.智慧城市建设.互联网金融治理等方面取得了长足的进展,未来更多的领域都必将被大数据所革命和重构. 1989年,当万维网出现之后,给我们带来了第四次传播革命,互联网以其海量的空间.互动的方式,使得信息数量急剧增加,根据ZDNET的数据显示,2013年中国产生的数据总量超过0.8ZB,2倍于2012年,相当于2009年全球的数据总量,而

大数据有大价值 顶尖公司大数据收入榜单

据了解,互联网上每一秒钟传输的视频,需要花费一个人5年的时间才能看完.可以说,用"海量.爆炸性增长"来形容大数据,已经不是什么新鲜事了.(以下数据来自:2015年中国大数据交易白皮书) 据统计,2014年全球大数据市场规模达到285亿美元,实现53.23%的增长,2015年,全球大数据总体加速发展趋势不变,预计大数据市场规模将达到421亿美元;到2020年,全球大数据市场规模将达到1263.21亿美元,同比增长17.51%. 大数据已成为全球IT支出的新增长点,这块不断增大的蛋糕开始吸

与主流同行,参加2014中国大数据技术大会的十大理由(议题攻略)

从2008年仅60人参加的技术沙龙到当下的数千人技术盛宴,作为业内极具实战价值的专业交流平台,已经成功举办七届的中国大数据技术大会忠实地描绘了大数据领域内的技术热点,沉淀了行业实战经验,见证了整个大数据生态圈技术的发展与演变. 12月12-14日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所与CSDN共同协办的2014中国大数据技术大会(Big Data Technology Conference 2014,BDTC 2014)将在北京新云南皇冠假日酒店如

大数据时代分析师 Splunk助大数据落地

文章讲的是大数据时代分析师 Splunk助大数据落地,近日,Splunk公司在北京举办了一场"大数据如何落地研讨会",为大数据技术在中国企业的落地带来了诸多的前沿观点.可以参考的实施路径以及丰富的案例. 数据爆炸时代的来临 在当前全球经济形势下行的背景下,中国的经济形势也不甚乐观,但正因为如此,中国企业对挖掘大数据价值的渴求尤为强烈,希望以此提高客户体验,促进业务的增长.根据国内市场研究机构计世资讯的研究,2012年中国大数据市场增长率为52.4%,市场规模达到3.2亿元.55%的受访