大数据时代你需要知道的7个大数据定义

文章讲的是大数据时代你需要知道的7个大数据定义,大数据究竟是什么?很多人可能仍然有些混淆,本文让我们来看看大数据的一些主要的定义。首先要注意的是,行业内的所有人都普遍认同,大数据不只是更多的数据。

  (1) 最初的大数据

  大数据的特征可以用很多词来描述。2001年Doug Laney最先提出“3V”模型, 包括数量 (Volume)、速度(Velocity)和种类(Variety)。在那以后,业界很多人把3V扩展到了11V,还包括有效性、真实性、价值和可见性等。

  (2) 大数据:技术

  为什么12年前的老术语突然被放在聚光灯下?这不仅是因为我们现在拥有比十年前更多的数量、速度和种类。而是因为大数据受到新技术的推动,特别是快速发展的开源技术,例如Hadoop和其他存储和处理数据的NoSQL方式。

  这些新技术的用户需要一个术语来将它们区别于以前的技术,于是大数据成了他们的最佳选择。如果你去参加大数据会议,你肯定会发现,涉及关系型数据库的会议会很少,无论他们鼓吹多少个V。

  (3)大数据与数据的区别

  大数据技术的问题是,大数据有些含糊不清,以至于行业中的每个供应商都可以跳进来声称自己的技术是大数据技术。以下是两种很好的方法来帮助企业理解现在的大数据与过去单纯的大数据的区别。

  •交易、交互和观察:这是由Hortonworks公司负责企业战略的副总裁Shaun Connolly提出的。交易是我们过去收集、存储和分析的主要数据。交互是人们点击网页等操作得到的数据。观察是自动收集的数据。

  •过程介导数据、人类产生的信息以及机器生成的数据。

  (4)大数据:信号

  SAP公司的Steve Lucas认为,应该根据意图和时机来划分这个世界,而不是根据数据的类型。“旧世界”主要是关于交易,当这些交易被记录时,我们已经无法对它们采取任何行动:企业都在不断管理“失效的数据”。而在“新世界”,企业可以使用新的“信号”数据来预测将会发生什么,并进行干预来改善情况。

  相关的案例有,追踪社交媒体上人们对品牌的态度,以及预测性维护(用复杂的算法帮助你决定何时需要更换零部件)。

  (5) 大数据:机会

  这是来自451 Research的Matt Aslett,他将大数据定位为“之前因为技术限制而被忽略的数据”。(虽然在技术上,Matt使用了“暗数据”,而不是大数据,但已经非常接近)。这是笔者最喜欢的定义,因为它符合大部分文章和讨论中的说法。

  (6) 大数据:隐喻

  Rick Smolan在其书中写道,大数据是“帮助这个星球生成神经系统的过程,其中我们人类只是另一种类型的传感器”。很深奥吧?

  (7) 大数据:新瓶装旧酒

  很多项目基本上是使用以前的技术,这些过去被称为BI或者分析的技术突然跳入大数据的行列中。

作者:邹静  

来源:IT168

原文链接:大数据时代你需要知道的7个大数据定义

时间: 2024-10-26 02:00:53

大数据时代你需要知道的7个大数据定义的相关文章

每个人都应该知道的25个大数据术语

如果你初来乍到,大数据看起来很吓人!根据你掌握的基本理论,让我们专注于一些关键术语以此给你的约会对象.老板.家人或者任何一个人带来深刻的印象. 让我们开始吧: 1.算法."算法"如何与大数据相关?即使算法是一个通用术语,但大数据分析使其在当代更受青睐和流行. 2.分析.年末你可能会收到一份来自信用卡公司寄来的包含了全年所有交易记录的年终报表.如果你有兴趣进一步分析自己在食物.衣服.娱乐等方面具体花费占比呢?那你便是在做"分析"了.你正从一堆原始数据中来吸取经验,以帮

除Hadoop外你还需要知道的9个大数据技术

Hadoop是大数据领域最流行的技术,但并非唯一.还有很多其他技术可用于解决大数据问题.除了Apache Hadoop外,另外9个大数据技术也是必须要了解的. Apache Flink Apache Samza Google Cloud Data Flow StreamSets Tensor Flow Apache NiFi Druid LinkedIn WhereHows Microsoft Cognitive Services Apache Flink:是一个高效.分布式.基于Java实现的

大数据时代:用制造业智能将沉睡的数据唤醒

导语:大数据时代,制造企业应借力制造业智能(MI)技术,充分发掘沉睡在数据背后的巨大商业价值.提升http://www.aliyun.com/zixun/aggregation/9139.html">产品品质,降低质量成本,以期在激烈的市场竞争中脱颖而出. "大数据时代,制造企业必须重新审视自己的生产质量数据,在制造业智能(MI)技术的帮助下,发掘沉睡在数据背后的巨大商业价值.借助数据的力量,提升产品品质.降低质量成本,从而在激烈的市场竞争中脱颖而出."盈飞无限(Inf

大数据时代的挑战:企业社交化和数据竞争

摘要: 过去50年,纽约时报共产生了30亿单词,而现在Twitter每一天都产生80亿单词;人类每一天产生约15拍数据,是全美学术类图书馆图书的8倍.自从2004年社交媒体出现之后,所有的情况都改变 过去50年,纽约时报共产生了30亿单词,而现在Twitter每一天都产生80亿单词;人类每一天产生约15拍数据,是全美学术类图书馆图书的8倍.自从2004年社交媒体出现之后,所有的情况都改变了.今天80%的数据都是非结构化的数据,并且这些数据都是个人行为的数据. 11月4日,由金蝶承办的"2012中

Shell在大数据时代的魅力:从一道百度大数据面试题想到的点滴

对于在Linux下开发的同学来说,Shell可以说是一种基本功. 对于运维的同学来说,Shell可以说是一种必备的技能,而且应该要非常熟练的书写Shell.对于Release Team,软件配置管理的同学来说,Shell也起到了非常重要的作用.尤其是分布式系统发展的如火如荼,很多开源项目都开展的如火如荼(好像不是分布式的系统都不好意思拿出来说事).分布式系统的配置,管理,Shell也起到了非常重要的作用,虽然只是简单的文件拷贝,但是谁让Shell天生是做这些的呢? 当然了,以上不是本文的主题.本

技巧:你未必知道的IE8九大功能

微软为IE8赋予了不少新的功能,其中一个就是使得这些新功能的实现更加实用和简便.其中有很多优化功能,可能你没有完全留意到.不过,你完全不用去阅读那些详细的功能使用说明,我们在为你提供这些功能介绍的同时,还将补充一个微软都没有提到过的重要技巧--如何为IE8增添强大的广告过滤工具. 1.键盘选择文本 在旧版本的IE浏览器中,通常很难或者无法准确地选中你想要复制的邮件或者文件中的某些文本.当你拖曳鼠标选择文本的时候,你常常也会选中其它相邻的段落或者词句.现在,通过模仿Firefox的"插入浏览&qu

何帆:大数据时代正聚集改变的能量

以下内容来自社科院世界经济与政治研究所副所长何帆的一次讲座. 大数据时代需要重视统计学 我们现在要开始重视大数据,要重视统计学,因为在数据足够大了之后,我们突然发现一切社会现象到最后都有统计规律,它不像物理学那样可以准确的去描述因果的关系,它从本质上来说就是一个统计的规律.统计学学好了,你再去学别的都战无不胜,因为一切社会现象到最后都是一个统计规律. 为什么要强调统计学呢,因为我们的认知能力中最差的是统计思维.人的大脑有一些功能优良得超过我们的想象,比如我们的语言能力.著名的语言学家乔姆斯基曾说

大数据时代,你准备好了吗?

近日网上流传这么一个故事:一名小伙子专门应聘上海高档小区的物业管理,自己配了扫描枪,每天就盯着小区垃圾堆,看见有条形码就扫描,晚上回家把数据整理出来,得出小区居民喝什么水.吃什么油.买什么衣服,整个小区的消费品类和品牌偏好一清二楚,再形成报告卖给大公司,报告价值数十万. 这是大数据价值的微小表象之一. 2013年被认为是世界的大数据元年,数据被称为新的石油,在未来,数据将会像土地.石油和资本一样,成为经济运行中的根本性资源.美国人维克托·迈尔·舍恩伯格撰写的<大数据时代>指出,大数据带来的信息

兵家必争大数据,争来争去是大数据时代的话语权

大数据时代,谁拥有数据,谁拥有对数据的解释权,谁就有可能在未来的竞争中占得先机. 近日,一出顺丰与菜鸟的"互怼",将大数据话语权的争夺战摆在了公众眼前.与此同时,共享单车"免押金扫码租车"之争同步上演:一方认为共享单车应该通过与芝麻信用等信用机构的信息共享来减免押金,消除"押金池"金融风险;另一方则认为这是征信业务范畴,而征信只宜用于在借钱还钱中防范信用违约风险,而不宜广泛用于政府.企业和个人等经济行为人的内部经营管理. 中国信息协会大数据分会秘