Hadoop如何走得更远? - 产品和技术

Hadoop如何走得更远? 发布时间:2012.05.11 12:52 &">nbsp;    来源:赛迪网     作者:赛迪网

存储技术已经发展和成熟起来,并开始在许多数据中心处于近乎商品的地位。然而,今天的企业面临着存储技术的不断变化带来的诸多问题一个例子是推动大数据分析,一项给大型数据集带来商业智能BI功能的举措。

大数据分析过程需要如下超出典型存储范式的能力—典型存储范式,简而言之,即传统的存储技术,如SAN、NAS和其它无法在本地处理伴随着大数据的挑战而来的TB级和PB级的非结构化信息的存储技术。除此之外,成功的大数据分析需要更多的东西——种新的处理大容量数据的方法,换言之,一种新的存储平台。

Hadoop是一个开源项目,它提供了处理大数据的平台。虽然Hadoop的出现已经有一段时日了,但是很多企业现在才开始使用Hadoop。

Hadoop平台旨在解决海量数据引起的问题,尤其是那些混合了复杂、非结构化、结构化信息的数据,这些数据的结构导致其不适合存储在表中。Hadoop在需要支持深度和计算广泛的分析比如集群和定位的情况下运作良好。那么Hadoop对那些寻求充分利用大数据的IT专业人员意味着什么?简单的回答是Hadoop解决了与大数据相关联的最常见的问题:高效的存储和访问海量数据。

Hadoop的内在设计允许其作为一个能够在大量不共享任何内存和磁盘的计算机之间工作的平台运行。考虑到这一点,就能很容易看到Hadoop如何提供额外的价值——网络管理员可以简单的购买许多商品服务器,将它们放在机架上,然后在每台服务器上运行Hadoop软件。

更何况,Hadoop有助于减少大型数据集相关联的管理开销。在操作上,一旦企业的数据加载到了Hadoop平台,软件就会把数据分解成可管理的片段,然后自动将这些数据分配给不同的服务器。数据天然的分布式性质意味着从单一的服务器访问数据是不可能的。Hadoop跟踪数据驻留的位置,并通过创建多个存储副本进一步保护这些信息。这样,系统的伸缩性增强了:如果某个服务器脱机或者失败了,数据可以自动复制已知的正常副本。

Hadoop如何走得更远?

Hadoop进一步分多个步骤处理数据。例如,限制关联传统的、集中式的数据库系统,该数据库系统可能包括了连接到具有多个处理器的服务器级系统的大型磁盘驱动器。在这种情况下,由于磁盘的性能限制,数据分析是有限的,并且,最终还要忍受可购买的处理器数量。

在部署了Hadoop后,集群中的每个服务器都可以通过Hadoop传播分布在集群中的数据的功能参与数据的处理过程。换句话说,一个索引作业向集群中的每个服务器发送代码,然后每个服务器在属于自己的一块数据上进行相关操作,随后处理结果作为一个整体交付。有了Hadoop,过程被视为MapReduce,在MapReduce中,代码和进程被映射到了所有的服务器上而操作结果被减少到了单个数据集上。

Hadoop之所以能够处理海量数据就是因为这个过程。Hadoop传播数据并且能够利用所有的可用集群处理器并行工作来处理复杂计算问题。

时间: 2024-11-30 01:26:35

Hadoop如何走得更远? - 产品和技术的相关文章

大数据引发存储限制 Hadoop如何走得更远?

存储技术已经发展和成熟起来,并开始在许多数据中心处于近乎商品的地位.然而,今天的企业面临着存储技术的不断变化带来的诸多问题一个例子是推动大数据分析,一项给大型数据集带来商业智能BI功能的举措. 大数据分析过程需要如下超出典型存储范式的能力-典型存储范式,简而言之,即传统的存储技术,如SAN.NAS和其它无法在本地处理伴随着大数据的挑战而来的TB级和PB级的非结构化信息的存储技术.除此之外,成功http://www.aliyun.com/zixun/aggregation/14294.html"&

适应时势的产品才能走的更远

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 从互联网到移动互联网,从易趣到淘宝,从博客到空间,从微博到微信,从淘宝到天猫,一个又一个新的互联网产品诞生,适应了一段有一段互联网的发展历程.从最初的聊天室到qq的2013版本,qq经历了一次又一次的升级与应用的更新,qq囊括了购物以及支付方式财付通,微博,空间,朋友网,邮箱,手机生活,游戏,音乐,视频,团购,电脑管理,圈子等众多应用.说明一

模糊 PaaS 和 SaaS 界限才能走得更远

结构决定性质,这似乎是条放之四海而皆用的准则,在云平台还不甚成熟.云计算还不能支持复杂企业环境的现在,关注云平台架构的细节就显得尤为必要. 云计算的本质是服务,按服务种类可以划分云平台的三层架构 从起源的角度来看,云计算是将计算资源变成能源形式加以利用的方式;从用户的角度来看,云计算强调的是 IT 服务的交付和使用模式.所以,云计算提供的本质应当是服务.按照云平台提供的服务种类,可以划分出云平台的三层架构,即:Infrastructure as a Service(IaaS,基础设施即服务),P

提高访客对站点的忠诚度 让中小型站点走的更远

摘要: 在与大家畅谈站点的访客忠诚度之前,我们先来谈谈国内大多数中小型站点的发展谋生之路.我们可以简单的归纳为三大方面:内容.访客与搜索引擎,这三者唇齿相依缺一不可,而相 在与大家畅谈站点的访客忠诚度之前,我们先来谈谈国内大多数中小型站点的发展谋生之路.我们可以简单的归纳为三大方面:内容.访客与搜索引擎,这三者唇齿相依缺一不可,而相较于大型站点的资源丰富,中小型站点的发展重点往往都是集中于搜索引擎的优化.对此这些中小型站长们每天围绕着站点优化,站点排名而奋斗着,但是作为中小型站长的你是否想摆脱这

做好数据收集与分析让营销推广之路走的更远

中介交易 SEO诊断 淘宝客 云主机 技术大厅 说起数据收集与分析,之前的我可能就认为是一件非常简单的事情,也就是简单的一份数据报表,分析的话也就按照平时做seo的思路简单的分析一下它的外链.收录.快照.pr等.我想可能很多人也有跟我同样的想法吧,经过这次的培训让我知道数据收集与分析并不是一件简单的事情,数据分析在我们网络推广中非常的重要,学会数据收集与分析让营销推广之路走的更远. 我们知道数据分析是我们做网络推广必须要掌握的技能,一个网站能否成功运营首先就要看是否有一份完整有实质的数据,任何网

专注 让易电网走得更远

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 一说到B2C电子商务,也许你就会想起当当.卓越等综合性电子商务商城.他们以包罗万象的商品而著称. 但随着电子商务市场的不断细分,垂直类B2C更显优势 .垂直类B2C往往因为只专注本行业或几类行业产品而在产品和售后服务上显得尤为专业.并且其专业的企业形象在消费者心智中也较容易形成. 红孩子.农爸爸.易电网都垂直类B2C中的佼佼者.他们在短短的时

女性电子商务,谁能把工作做细,谁就能够走得更远!

近两年来,一批颇有攻势的垂直女性网站开始崛起,并且正在大量蚕食门户网站的广告份额. 为什么在互联网大行业中女性网站的崛起相对较晚呢?Onlylady唐海荣告诉记者,相对于男性,女性对互联网的接受速度偏缓,但是数量一直在逐渐增加,而且黏性非常高,接触频率高. 有利的数据不断传来,根据美国网络流量统计公司ComScore的数据,专门面向女性群体的网站流量,去年高速增长35%,高于任何其他类别的网站,仅落后于政治类.此外,女性网站今年7月份的访问量高达8400万人次,比去年同期高出27%.女性网站广告

拼车+社交,天天用车想在共享经济上走得更远

摘要: 在共享经济里,商业仿佛已经退居其次,人与人的沟通.连接奠定了整个交易流程.Airbnb打造的共享经济让人们愿意去邀请陌生人进入自己的生活,也让每个人都可以同时成为消费者和 在"共享经济"里,商业仿佛已经退居其次,人与人的沟通.连接奠定了整个交易流程.Airbnb打造的共享经济让人们愿意去邀请陌生人进入自己的生活,也让每个人都可以同时成为消费者和生产者,而后者提供了产生收入的潜力.从共享居住空间到共享运载余力,拼车正在成为契合共享经济理念的下一个热点. 天天用车(iOS / An

2014年端游营收增长率为13.5%,疲态已现差异化才能走得更远

以2001年盛大代理<热血传奇>为起点,中国客户端网游市场已经走过了将近15年的时间,在这15年的时间里,潮起潮落,数以万计的产品登上舞台,跻身百万在线俱乐部者有之,转瞬即逝者有之,默默无闻者有之,可以说这15年,中国的端游产业很精彩. 但近些年来,受移动端崛起导致用户时间分配分流,端游的发展有些步履维艰起来,根据相关数据显示,2011年开始端游玩家的增长数量为10.1%,此后开始一直在10%的增长率左右徘徊,一直到2014年增长率仅为3.9%.甚至强如暴雪,立项研发的MMORPG大作<