正确认识四个大数据神话

似乎每家软件厂商、每家咨询公司,以及每个思想领袖都在尝试着对“大数据”做出准确的定义。尽管目前还没有出现这样的定义,但是打破关于大数据的神话将有助于我们正确认识大数据。

1:你能够获得所有的数据

在许多方面,我们正生活在一个前所未有的时代当中。我们从来都没有像现在这样能够获得如此多的数据。此前一直被人们所忽视的兆字节、拍字节和艾字节数据如今已经出现了。在如今的工业化社会中,平均每个人一天所消费的信息量超过了生活在十五世纪的人一生所消费的信息量。

目前还没有一个人或一家公司能够存储和检索关于某一特定主题的全部数据,更不要说是所有数据了,包括谷歌在内。谷歌索引的只是表层网中的信息,而不是深层网中的信息。专家估测,后者的规模是前者的25倍。因此,在我们进行搜索时,我们所获得的信息量仅仅是互联网信息量中的4%~6%。 

2:你需要所有的数据

毫无疑问,数据越多帮助越大,但这并不意味着在做商业决策时你需要所有的数据。正在高效利用大数据的公司已经认识到,他们不需要获得所有的相关信息。

几乎每天都会涌现出大量新的数据源,但是并不是所有的数据都有价值。例如,电子邮件信息常常为我们提供了洞察企业状况的宝贵信息。精明的公司正在挖掘个人信息,以评估员工的情绪,以及谁可能会辞职。但这并不是说所有的电子邮件都具有相同的价值。因为分析垃圾邮件没有任何意义。你并不需要所有的数据。数据当然是越多越好,但是请不要浪费时间尝试做这一不可能实现的事情。

3:大数据会给我们明确的答案

我们经常听到这样一句商业格言是“处理你能够处理的数据,并从中获得更多信息。”我们在利用所获信息做商业决策时会遇到许多问题。实际上,我们根本无法利用这些信息完全准确地预测出公司的并购、产品的发布、新的风险投资,以及员工入职等情况。

但这并不是说,存在不确定性,大数据就不能为我们提供帮助了。请不要将减少不确定性和消除不确定性混为一谈。大数据能够帮助我们消除不确定性的这一天还没有到来,可能这一天永远也不会到来。对海量非结构性数据进行分析或许能够帮助公司更好的理解客户的情绪。但是请不要误认为大数据能够为我们排除所有的可能性。生命的无常和业务的起伏将会破坏我们制订出的完美计划。

4:大数据只是昙花一现

Nate Silver可以说是大数据领域中的代表人物,至少在他离开《纽约时报》之前是这样。在2012年的美国总统大选中,尽管许多人预测奥巴马和罗姆尼在得票率方面将旗鼓相当,但是身为统计学家的Silver却预测,奥巴马将以90%的选举人票赢得2012年的美国总统大选。由于Silver的预测模型极为精准,以至于如今许多人在遇到事情后都来向他寻求帮助。

虽然大数据和数据科学的定义在今后几年仍然不会确定下来,但是可以肯定的是,人们在2013年消费的数据量超过了2012年所消费的数据量。许多公司已经认识到了大数据的重要性,拒绝大数据可能将会导致公司在竞争中被淘汰出局。

时间: 2024-07-30 18:13:30

正确认识四个大数据神话的相关文章

离完美有点远 破解四个大数据神话

文章讲的是离完美有点远 破解四个大数据神话,迄今为止,大数据一直都存在争议.似乎每家软件厂商.每家咨询公司,以及每个思想领袖都在尝试着对"大数据"做出准确的定义.尽管目前还没有出现这样的定义,但是打破关于大数据的神话将有助于我们认识大数据. 神话1:你能够获得所有的数据 在许多方面,我们正生活在一个前所未有的时代当中.我们从来都没有像现在这样能够获得如此多的数据.此前一直被人们所忽视的兆字节.拍字节和艾字节数据如今已经出现了.在如今的工业化社会中,平均每个人一天所消费的信息量超过了生活

大数据何去何从:人民日报四问大数据

问题一:大数据属于谁? 杜小勇:获取.记录数据需要耗费资源,因此,数据也就具有了资产的属性.在大数据出现以前,数据依附于具体业务而存在,人们更多的关注在使用数据的软件系统上.没有软件的使用,就没有数据的价值.当时有关数据的归属问题并不那么突出.在大数据时代,数据可以作为一种独立的存在,其"资产"性价值越来越引起人们的重视. 数据是物理世界客观事物性质.状态的反映,这是客观存在.你去收集了,有特定的表达形式,自然特定格式的数据就是你的.个人.企业.政府.组织都可以合法地去收集数据.如果违

CIO们最应该消除的八个大数据神话

文章讲的是CIO们最应该消除的八个大数据神话,Gartner分析师Mark Beyer认为:企业CIO们如果想在2020年实现大数据常态化,那么就要从消除关于大数据的八个神话开始. 让十位首席信息官去定义大数据,你会得到十个不同的答案. Gartner分析师Mark Beyer说,这是因为大数据对企业的IT专业人员来说仍然并不规范. Beyer在今年Gartner的Symposium / ITxpo会议上说."当事情变得很常见,那它就开始正常化了,我们的工作,作为IT专业人士,就是在2020年前

CIO需要消除八个大数据神话

Gartner分析师markbeyer认为:企业cio们如果想在2020年实现大数据常态化,那么就要从消除关于大数据的八个神话开始. 让十位首席信息官去定义大数据,你会得到十个不同的答案.gartner分析师markbeyer说,这是因为大数据对企业的it专业人员来说仍然并不规范. beyer在今年gartner的symposium/itxpo会议上说."当事情变得很常见,那它就开始正常化了,我们的工作,作为it专业人士,就是在2020年前使大数据变得正常化." 首席信息官们可以通过从

四问大数据?

问题一:大数据属于谁? 杜小勇:获取.记录数据需要耗费资源,因此,数据也就具有了资产的属性.在大数据出现以前,数据依附于具体业务而存在,人们更多的关注在使用数据的软件系统上.没有软件的使用,就没有数据的价值.当时有关数据的归属问题并不那么突出.在大数据时代,数据可以作为一种独立的存在,其"资产"性价值越来越引起人们的重视. 数据是物理世界客观事物性质.状态的反映,这是客观存在.你去收集了,有特定的表达形式,自然特定格式的数据就是你的.个人.企业.政府.组织都可以合法地去收集数据.如果违

聚沙成塔 集腋成裘----四谈大数据时代

在地球任意地方捡起一块石头,都可以验出铁元素.但是,说世界遍地都是铁矿一定是胡扯.只有石头中铁含量超过一定比例,而石头数量又达到相当规模,这堆石头才能称为铁矿,人们才会对它产生投资开采的兴趣.如果铁矿石埋藏不是太深,开采和运输的成本不是太高,市场有长期稳定的购买需求,那么铁矿开采的兴趣才会变成行动,成为一个有利可图的商业活动. 同样的道理也适用于对于大数据由来的分析.有了互联网,也就有了网络数据.随着网民的增加和网络服务的日益丰富,网络数据也就丰富起来.做个网站,上面罗列些服务,无论它们是新闻资

聚沙成塔集腋成裘——四谈大数据时代

在地球任意地方捡起一块石头,都可以验出铁元素.但是,说世界遍地都是铁矿一定是胡扯.只有石头中铁含量超过一定比例,而石头数量又达到相当规模,这堆石头才能称为铁矿,人们才会对它产生投资开采的兴趣.如果铁矿石埋藏不是太深,开采和运输的成本不是太高,市场有长期稳定的购买需求,那么铁矿开采的兴趣才会变成行动,成为一个有利可图的商业活动. 同样的道理也适用于对于大数据由来的分析.有了互联网,也就有了网络数据.随着网民的增加和网络服务的日益丰富,网络数据也就丰富起来.做个网站,上面罗列些服务,无论它们是新闻资

揭秘10个大数据神话

如果数据有一点点就不错了,那么数据是海量的话就一定棒极了,对不对?这就好比说, 如果一个炎日夏日里的微风让你感觉凉爽,那么你会为一阵一阵的凉风感到欣喜若狂.以下为译文: 也许对大数据更好的一个类比是它就像一匹意气风发的冠军赛马: 通过适当的训练和天赋的骑师,良种赛马可以创造马场记录–但没有训练和骑手,这个强大的动物根本连起跑门都进不了. 为了确保你组织的大数据计划保持正轨,你需要消除以下10种常见的误解. 1. 大数据就是'很多数据' 大数据从其核心来讲,它描述了结构化或非结构化数据如何结合社交

贵阳市四个大数据地方标准立项

日前,贵阳市申报的4个大数据标准通过贵州省地方标准立项. 记者7月11日从市质监局获悉,为服务全省大数据产业发展综合试验区建设,经市政府同意,由市工信委.市质监局.中国电子技术标准化研究院联合申报的<政府数据核心元数据第1部分:人口基础数据><政府数据核心元数据第2部分:法人单位基础数据><政府数据分类分级指南><政府数据脱敏指南>4个标准通过贵州省地方标准立项. 下一步,我市将按照<地方标准管理办法>和贵州省地方标准制修订程序要求,做好4个标准