您,误解大数据了吗?

  时常听创业者说自己的公司每天会生产/记录很多的数据,虽然他们暂时还没想明白怎么用这些数据,但把这些数据都先存起来了。他们经常还说,通过这些数据他们的产品/服务将得到很大的提升,仿佛这些数据就是公司的救世主一样。本文不想讨论这种观点正确与否,但想在这里解释两个关于大数据的常见误解:

  一、数据不等于信息

  经常有人把数据和信息当作同义词来用。其实不然,数据指的是一个原始的数据点(无论是通过数字,文字,图片还是视频等等),信息则直接与内容挂钩,需要有资讯性(informative)。数据越多,不一定就能代表信息越多,更能不能代表信息就会成比例增多。我们来看两个简单的例子:

  备份。很多人如今已经会定期的对自己的硬盘进行备份。这个没什么好多解释的,每次备份都会创造出一组新的数据,但信息并没有增多。

  多个社交网站上的信息。我们当中的很多人在多个社交网站上活跃,随着我们上的社交网站越多,我们获得的数据就会成比例的增多,我们获得的信息虽然也会增多,但却不会成比例的增多。不单单因为我们会互相转发好友的微博(或者其他社交网站上的内容),更因为很多内容会十分类似,有些微博虽然具体文字不同,但表达的内容十分相似。

  二、信息不等于智慧(Insight)

  好吧,现在我们去除了数据中所有重复的部分,也整合了内容类似的数据,现在我们剩下的全是信息了,这对我们就一定有用吗?不一定,信息要能转化成智慧,至少要满足以下三个标准:

  可破译性。这可能是个大数据时代特有的问题,越来越多的企业每天都会生产出大量的数据,却还没想好怎么用,因此,他们就将这些数据暂时非结构化(unstructured)的存储起来。这些非结构化的数据却不一定可破译。比如说,你记录了某客户在你网站上三次翻页的时间间隔:3秒,2秒,17秒,却忘记标注这三个时间到底代表了什么,这些数据是信息(非重复性),却不可破译,因此不可能成为智慧。

  关联性。我们曾经对关联性的重要性进行过解释。这里不再赘述了,无关的信息,至多只是噪音。

  新颖性。这个和我前文举的那个社交网站的例子类似,不同的是,这里的新颖性很多时候无法仅仅根据我们手上的数据和信息进行判断。举个例子,某电子商务公司通过一组数据/信息,分析出了客户愿意为当天送货的产品多支付10块钱,然后又通过另一组完全独立的数据/信息得到了同样的内容,这样的情况下,后者就不具备新颖性。不幸的是,很多时候,我们只有在处理了大量的数据和信息以后,才能判断它们的新颖性。

123456下一页全文 本文导航第 1 页:您,误解大数据了吗?第 2 页:大数据时代来袭第 3 页:全球十四个大数据公司全面盘点第 4 页:大数据已成红海?!第 5 页:大数据知名厂商之惠普第 6 页:如何发掘大数据的潜力?

时间: 2024-10-29 13:27:07

您,误解大数据了吗?的相关文章

美媒:关于“大数据”的五大误解

文章讲的是美媒:关于"大数据"的五大误解,美国<外交政策>杂志网站5月9日刊登微软研究院首席研究员.麻省理工学院公民媒体中心客座教授凯特·克劳福德的一篇文章,文章说,"大数据"是当前的时髦术语,是技术界用来解决世界上最难处理的问题的全能办法. 文章说,这个术语一般用来描述对海量信息进行分析,从而发现规律.收集有价值的见解和预言复杂问题答案的技巧与科学.它也许听起来有些乏味,但是从制止恐怖分子,到消除贫困,到拯救地球,对于大数据的鼓吹者来说,没有什么问题是

关于大数据的常见误解

我时常听创业者说自己的公司每天会生产/记录很多的数据,虽然他们暂时还没想明白怎么用这些数据,但把这些数据都先存起来了.他们经常还说,通过这些数据他们的产品/服务将得到很大的提升,仿佛这些数据就是公司的救世主一样.我不想讨论这种观点正确与否,但想在这里解释两个关于大数据的常见误解: 一.数据不等于信息 经常有人把数据和信息当作同义词来用.其实不然,数据指的是一个原始的数据点(无论是通过数字,文字,图片还是视频等等),信息则直接与内容挂钩,需要有资讯性(informative).数据越多,不一定就能

高层管理者对于大数据的6个误解

大数据已经成为一个如此普遍的流行词,但有人认为其几乎是毫无意义的. 一名IT行业专家表示,其曾从事信息技术工作超过十年,并记得当时订购新的驱动器和存储设备来处理文件和电子邮件,那时读取上千兆字节的信息,当时以为这样大量的数据就是大数据. 经过七年职业生涯的变迁,这个IT专家就职于亚马逊公司,并在他们的数据仓库中运行SQL查询.该数据库的范围之广,让其甚至花费一个星期的时间汇总数据,而无需再采用Excel表格.他以为明白了什么是大数据,但事实证明,并没有任何线索. 大数据如此普遍已经成为一个流行词

微众银行大数据爽约? 回应:这是一种误解

近日,微众银行征信查询屡遭质疑.微众银行人士回应称,"微众银行互联网大数据爽约是一种误解,微粒贷的征信数据是多维度的".同时表示,为方便客户理解,就贷款余额为零达到一定时间的客户,微众银行会向央行报送"结清"状态,直至客户再次新借. 雁过无痕,但一条征信查询引发的讨论似乎并没有停歇. 近日,有关微粒贷查询客户征信信息是否合规.是否会影响用户在他行进行贷款的话题受到关注,很多人也趁机科普了一下循环贷款在征信记录上与普通贷款的不同之处. "我们银行在审批贷款时

大数据“流言”:解析Hadoop和大数据的七误解

对于Hadoop技术而言,可以说是开源领域的传奇,然而如今业界还伴随着一些流言,这些流言可能会导致IT高管们带着"有色"的观点去制定策略. 如今,数据量在以惊人的速度增长,从IDC分析师报告中2013年数据存储上的增长速度将达到53.4%,AT&T更是声称无线数据的流量在过去的5年内增长200倍,从互联网内容.电子邮件.应用通知.社交消息以及每天接收的消息都在显著的增长,这也是众多大企业都聚焦大数据的原因所在. 毫无疑问,Hadoop成为解决大数据需求的主要投资领域之一,而类似

人们对大数据的几点误解

如今,"大数据"的概念已经存在一段时间了,但是很多人似乎仍觉得它被神秘面纱所笼罩.因此,在本文我们将揭示出一些人们对于顶级大数据技术与应用的误解. 每个企业都需要访问数据,从交易.移动.财务和行为数据到客户调查数据和社交媒体数据.更重要的是,越来越多的数据随着技术的发展和购买趋势的变化变得可用,而大数据恰好拥有将这些数据转化为可操作数据的宝贵能力. 大数据使企业能够分析监控趋势并相应地调整其策略,它有助于创造新的产品和服务,以满足日益增长的客户需求,同时它还提供详细的见解来帮助企业减少

《驾驭大数据》一8.2 对分析专家常见的误解

8.2 对分析专家常见的误解 驾驭大数据列出分析专家最重要的特征时,大多数人都会加上学历这一点.通常,我们会认为优秀的分析专家应该是学统计学.数学.计算机科学.运筹学或者其他类似的专业.而且,我们经常还会认为他们得有个硕士学位或者博士学位什么的.我们经常关心的另一点是编程经验.我们认为优秀的分析专家应该可以使用多种语言编程进行分析.这种认识背后的逻辑是,普通分析人员所使用的工具,分析专家肯定用得更好. 人们普遍都会选择列出上述这两点,但这是不正确的.优秀的分析专家需要很强的数学和统计学背景知识.

洞悉大数据:Hadoop和云分析七大误解

七大误解:大数据与hadoop 对于Hadoop技术而言,可以说是开源领域的传奇,然而如今业界还伴随着一些流言,这些流言可能会导致IT高管们带着"有色"的观点去制定策略. 从IDC分析师报告中2013年数据存储上的增长速度将达到53.4%,AT&T更是声称无线数据的流量在过去的5年内增长200倍,从互联网内容.电子邮件.应用通知.社交消息以及每天接收的消息都在显着的增长,这也是众多大企业都聚焦大数据的原因所在. 毫无疑问,Hadoop成为解决大数据需求的主要投资领域之一,而类似

困扰企业的关于大数据的五个误解

在这有着轻微寒意的秋天,我们都知道万圣节马上就要到了,但有什么能比幽灵或者鬼屋更恐怖呢?对于很多IT经理来说,大数据就是一场噩梦.其实,只要部署了正确的工具和策略,大数据能够为企业带来很多机会,下面让我们来看看困扰着企业的5个大数据误解: 误解1:"我们是一家小公司,我们还不需要担心大数据问题." 从新闻报道中我们了解到很多大型企业的大数据项目,但企业不应该他们的做法吓到了.各种规模的企业都可以并且应该像大型企业一样捕捉数据.毕竟,无论你是财富500强企业还是小公司,你都想要了解你的客