《大数据导论》——第1章理解大数据

第1章
理解大数据
大数据是一门专注于对大量的、频繁产生于不同信息源的数据进行存储、处理和分析的学科。当传统的数据分析、处理和存储技术手段无法满足当前需求的时候,大数据的实践解决方案就显得尤为重要。具体地说,大数据能满足许多不同的需求,例如,将多个没有联系的数据集结合在一起,或是处理大量非结构化的数据,抑或是从时间敏感的行为中获取隐藏的信息等。
虽然大数据看起来像是一门新兴的学科,却已有多年的发展历史。对大型数据集的管理与分析是一个存在已久的问题—从利用劳动密集方法进行早期人口普查的工作,到计算保险收费背后的精算学科,都涉及这个方面的问题,大数据就由此发展起来。
作为对传统的基于统计学分析方法的优化,大数据加入了更加新的技术,利用计算资源和方法的优势来执行分析算法。在当今数据集持续地扩大化、扩宽化、复杂化和数据流化的背景之下,这种优化十分重要。自《圣经》时代以来,统计学方法一直在告诉我们通过抽样调查的手段能够粗略地测量人口。但计算机科学目前的发展使我们完全有能力处理那样庞大的数据集,因此抽样调查的手法正在逐渐“失宠”。
对于大数据的数据集的分析是一项综合数学、统计学、计算机科学等多项专业学科的跨学科工作。这种多学科、多观点的混合,常常会使人对大数据及大数据分析这门学科所涵盖的内容产生疑问,每个人都会有不同的见解。大数据问题所涵盖的内容范围也会随着软硬件技术的更新而变化。这是因为我们在定义大数据的时候考虑了数据特征对于数据解决方案本身的影响。比如30年前,1GB的数据就称得上是大数据,而且我们还会为这份数据专门申请计算资源,而如今,1GB的数据十分常见,面向消费者的设备就能对其进行快速的存储、转移、复制或者其他处理。
大数据时代下的企业数据,常常通过各种应用、传感器以及外部资源聚集到企业的数据集中。这些数据经过大数据解决方案的处理后,能够直接应用于企业,或者添加到数据仓库中丰富现有的数据。这种大数据解决方案处理的结果,将会给我们带来许多深层知识和益处,例如:
运营优化
可实践的知识
新市场的发现
精确的预测
故障和欺诈的检测
详细的信息记录
优化的决策
科学的新发现
显然,大数据的应用面和潜在优势十分广阔。然而,在何时选用大数据分析手段的问题上,还有大量的问题需要考虑。当然,我们需要去理解这些存在的问题,并与大数据的优势进行权衡,最终才能做出一个合理的决策并提出合适的解决方案。这些内容我们将在第二部分单独讨论。

时间: 2024-08-01 02:20:55

《大数据导论》——第1章理解大数据的相关文章

《大数据导论》一第1章 理解大数据

  本节书摘来自华章出版社<大数据导论>一书中的第1章,第1.1节,作者托马斯·埃尔(Thomas Erl),瓦吉德·哈塔克(Wajid Khattak),保罗·布勒(Paul Buhler),更多章节内容可以访问"华章计算机"公众号查看. 第1章 理解大数据 大数据是一门专注于对大量的.频繁产生于不同信息源的数据进行存储.处理和分析的学科.当传统的数据分析.处理和存储技术手段无法满足当前需求的时候,大数据的实践解决方案就显得尤为重要.具体地说,大数据能满足许多不同的需求,

《大数据导论》一第一部分 大数据基础

 本节书摘来自华章出版社<大数据导论>一书中的第1章,第1.1节,作者托马斯·埃尔(Thomas Erl),瓦吉德·哈塔克(Wajid Khattak),保罗·布勒(Paul Buhler),更多章节内容可以访问"华章计算机"公众号查看. 第一部分 大数据基础 大数据具有改变企业性质的能力.事实上,有很多公司仅仅依靠着能够提出一些深刻的见解而存在,而这些见解只有通过大数据才能实现.第一部分的四章主要从商业的角度阐述了大数据的基本要素.企业需要理解大数据,不仅仅与技术相关,也

《大数据导论》——第1部分大数据基础

第一部分大数据基础大数据具有改变企业性质的能力.事实上,有很多公司仅仅依靠着能够提出一些深刻的见解而存在,而这些见解只有通过大数据才能实现.第一部分的四章主要从商业的角度阐述了大数据的基本要素.企业需要理解大数据,不仅仅与技术相关,也与如何通过这些技术推动公司的发展相关.第一部分由如下4章组成:第1章主要介绍一些关键性的概念和术语,定义了大数据技术中的许多基本元素,并且阐述了大数据处理复杂的商业中蕴含的深层知识的能力.同样,第1章也介绍了辨别大数据的数据集的许多特征,并且定义了很多能够作为大数据

大数据导论之为何需要引入大数据

一.引言 最近各种客户咨询项目中,往往涉及大数据引入必要性和价值意义的深层次挖掘,客户有数据,有平台,但是不知到底要不要上大数据,为何要上大数据和大数据可以带来哪些价值和意义.本文关于大数据的必要性进行阐述,来源实际项目,算是分享吧. 二.突破技术瓶颈 互联网技术催生了大数据时代的来临,大数据时代的数据形态有四大特点:首先数据体量巨大,非结构化数据的超大规模和增长占总数据量的80%至90%,比结构化数据增长快10到50倍:其次.大数据的异构和多样性,比如图片.新闻.博客.微博.微信等,比大更重要

《大数据导论》——1.2节大数据特征

1.2 大数据特征大数据的数据集至少拥有一个或多个在解决方案设计和分析环境架构中需要考虑的特征.这些特征大多数由道格·兰尼早在2001年发布的一篇讨论电子商务数据的容量.速率和多样性对企业数据仓库的影响的文章中最先提出.考虑到非结构化数据的较低信噪比需要,数据真实性随后也被添加到这个特征列表中.最终,其目的还是执行能够及时向企业传递高价值.高质量结果的分析.

如何宏观理解大数据的流通版图

数据大规模流通与交易将会盛行,很大程度上已成为了业界对大数据未来应用模式的一个共识. 连在<中共中央关于制定国民经济和社会发展第十三个五年规划的建议>和国务院印发<促进大数据发展行动纲要>中,都作出了关于推进数据资源开放共享的战略规划,要求各级政府引导培育大数据交易市场,开展面向应用的数据交易试点,探索开展大数据衍生产品交易,鼓励产业链各环节的市场主体进行数据交换和交易,促进数据资源流通,建立健全数据资源交易机制,规范交易行为等一系列健全市场发展机制的思路与举措. 虽然上有政策.下

如何理解“大数据时代”?

问:编辑同志,您好.继"物联网"."云计算"之后,"大数据"一词被越来越多地提及.大家都在谈论"大数据",谁都想用好"大数据",俨然进入了"大数据时代".请问如何理解"大数据时代"? 大数据"只是一种提法,其形态本身是数据云.人们用它来描述.定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新.让我们看网上的一组数据,就能够对"大数据&q

大数据时代 每家公司都要有大数据部门吗?

在大数据时代 每家公司都要有大数据部门吗?如果这个问题换做是:在电气时代,每家公司都要有个发电厂吗?是不是会更好回答一些? 事实上每一种重大技术的出现,都会对产业产生大的变化.在蒸汽时代,采矿机采用蒸汽机后,会带来生产效率的极大提升,而轮船加上蒸汽机,再也不需要靠风才能航海了.在电气时代,电灯代替了蜡烛,电报代替了快马送信,而报纸也被广播和电视所侵蚀. 可以说是现有产业加上新技术,形成了新产业. 我们回过头来看这两次工业革命,生产蒸汽机的企业只有少量几家,而发电的企业在美国也只有通用电气和西屋电

《大数据导论》一第2章 采用大数据的商业动机与驱动

第2章 采用大数据的商业动机与驱动 在当今世界的许多组织中,业务可以像其所采用的技术那样进行"架构".这种观念上的转变体现在当今企业架构领域的不断扩大,即过去只与技术架构紧密结合,而现在却也同样包含业务架构.尽管如今人们还只是从一个机械系统的视角来审视一批批的业务,即一条条指令由行政人员发布给主管,再传递给前线的员工们,但是,基于链接与评测的反馈循环机制为管理决策的有效性提供了保障. 这种从决策到实施再到对结果的测评的循环使得企业有机会不断优化其运营.然而事实上,这种机械化的管理观点正