Hadoop扩展过程中的7个危险信号

  本文作者Raymie Stata是Hadoop即服务公司Altiscale的创始人兼CEO,也是雅虎前任CTO,协助雅虎完成开源策略,并参与Apache Hadoop项目的发起。Hadoop的扩展和运维是非常复杂的过程,在其具体的实施过程中隐藏着潜在的危机,Raymie根据经验罗列了7项危机信号和相应的解决方案,帮助使用者提前避免灾难的发生。

  以下为译文:

  Hadoop扩展是一个非常复杂的过程,这里罗列了7种常见问题和解决方案。

  所有Hadoop实施都存在着潜在的危机,包括一些非常棘手的Hadoop运行问题。这类问题出现在投入生产环境前会导致Hadoop被弃用,但是如果发生在投入生产环境后,则意味着一场“成功的灾难”(其实更有可能是一场纯粹的灾难)。

  Hadoop的扩展和实施是非常复杂的。但是如果你能确切的认识到问题根源所在,还是可以避免“灾难”的发生,以下是根据经验总结出的一些危机信号。

  危机信号1:无法投入生产环境

  从概念验证到生产环境使用是大数据工作流程的重要一步。Hadoop扩展工作充满了挑战,较大的工作量往往不能被及时完成,测试环境不能完全覆盖真实运行环境,例如数据测试中常见的一种问题是:概念验证经常使用不切实际的小型或单一的数据集。

  在投入生产环境之前,需要进行规模及压力测试,通过这类测试的应用程序具备可扩展性及容错能力,也可协助开发自身容量规划模型。

  危机信号2:开始延期

  第一个应用程序投入生产环境标志着你能够轻松实现SLA,但随着Hadoop集群数量增加,其运行时间变得不可预知,首次延期问题很容易被忽略,而随着时间的推移,这种情况变得越来越糟,最终导致危机出现。

  千万不要等到危机爆发后再采取行动。在容量遭到挑战之前,可适当的扩展容量或优化程序。调整预期容量模型,尤其注意要在最糟糕的性能环境下进行容量检测,使其具备更加贴近现实的性能。

  危机信号3:开始告诉客户不可能保存所有数据

  危机爆发的另一征兆是减少数据保留需求。起初你希望为每年的数据分析保留13个月的数据,但由于空间限制,你开始缩减保留数据的时间,这在某种程度上等价于丢失了Hadoop大数据分析能力的优势。

  缩减数据保留时间并不能解决问题,要避免这种问题必须要及早行动,重新审视容量模型,寻找预测失败原因,然后调整模型以便更好的追踪问题根源所在。

  危机信号4:数据科学家们失去地位

  过度使用Hadoop集群会扼杀创新,会导致数据科学家没有足够的资源去运行大型作业,没有足够的空间为科学家们存储大量运算结果。

  容量规划经常容易被忽视,数据科学家的作用也经常被忽视。被忽视加上生产环境负载规划不足,意味着数据科学家经常被边缘化。请确定你的需求里包括对数据科学家的需求,并能在容量问题出现早期发挥作用。

  危机信号5:数据科学家通过Stack Overflow解决问题

  在Hadoop实施初期,运维团队和数据科学家协同工作。随着Hadoop实施的成功,运维团队的维护压力随之增加,科学家们必须自己解决Hadoop的问题,通常会通过Stock Overflow寻找处理方法。

  随着Hadoop扩展及关键任务的增加,维护的工作量开始增加,如果想要保证数据专家们集中在数据研究上,则需要重新调整运维团队的大小。

  危机信号6:服务器温度升高

  分配服务器电力供应时,我们常常假设它们不会满负荷运行,但是大型的Hadoop作业很可能让服务器满载数个小时,严重威胁到你的电网(冷却方面也有类似的问题)。所以请确保你的Hadoop集群可长时间在全功率环境下运行。

  危机信号7:开支失控

  在基于IaaS部署的Hadoop环境中,排名第一的“成功灾难”是开支失控。你会突然发现账单费用是上个月的三倍,严重超出预算。

  容量规划是基于IaaS的Hadoop实施中相当重要的一步,不仅仅是为了管理容量也为了管理成本。但好的容量规划只是一个开始,如果你想要扩展基于Iaas的Hadoop实施,最好要像Netflix那样大力投资系统来追踪并优化成本。

  平缓Hadoop扩展

  Hadoop计划通常低估了保持Hadoop集群稳定运行所需的工作量,这种误判是可以理解的。传统企业应用程序的初始优化实施成本比后续的维护与支持高出许多个数量级,人们通常误认为Hadoop遵循同样的模式,实际上Hadoop的维护非常困难,需要大量的运维工作。

  优质的容量规划是必不可少的;拥有良好容量模型的同时,还需要及时的更新以避免其偏离实际应用场景;不要让创新成为后期问题,给予数据科学家足够的支持;扩容不是解决问题的唯一办法,管理使用情况也同样重要;让用户(及业务所有者)做足够的作业优化,一点点的优化都可以降低现有成本。

时间: 2024-09-23 10:06:03

Hadoop扩展过程中的7个危险信号的相关文章

前雅虎CTO:Hadoop扩展过程中的7个危险信号

ZDNet至顶网软件频道消息:本文作者Raymie Stata是Hadoop即服务公司Altiscale的创始人兼CEO,也是雅虎前任CTO,协助雅虎完成开源策略,并参与Apache Hadoop项目的发起.Hadoop的扩展和运维是非常复杂的过程,在其具体的实施过程中隐藏着潜在的危机,Raymie根据经验罗列了7项危机信号和相应的解决方案,帮助使用者提前避免灾难的发生. 以下为译文:  Hadoop扩展是一个非常复杂的过程,这里罗列了7种常见问题和解决方案. 所有Hadoop实施都存在着潜在的

大家在做Hadoop优化过程中数据都是哪里获取的

问题描述 大家通过什么方式进行数据的仿真,大家所需的大数据都是哪里获取的,比如并行实现了某项算法或者优化了副本的数量,大家的实验数据来源都是在哪里找到的.还有在实验条件有限的环境下可以租用免费的服务器进行试验吗,自己配置的完全分布式环境太小了. 解决方案 解决方案二:读研时没搞这方面,数据来源不清楚,但是机器实验室还是有几个的,实验室没机器就没辙了~~~

Hadoop-2.8.0集群搭建、hadoop源码编译和安装、host配置、ssh免密登录、hadoop配置文件中的参数配置参数总结、hadoop集群测试,安装过程中的常见错误

25.集群搭建 25.1 HADOOP集群搭建 25.1.1集群简介 HADOOP集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起 HDFS集群: 负责海量数据的存储,集群中的角色主要有NameNode / DataNode YARN集群: 负责海量数据运算时的资源调度,集群中的角色主要有 ResourceManager /NodeManager 25.1.2服务器准备 本案例使用虚拟机服务器来搭建HADOOP集群,所用软件及版本: ü Vmware 11.

Hadoop遭遇瓶颈的七大危险信号

文章讲的是Hadoop遭遇瓶颈的七大危险信号,大多数企业大数据应用案例尚处于实验和试点阶段,对于少数首次在生产环境部署Hadoop系统的用户来说,最常遇到的就是扩展问题,此类问题往往导致企业因噎废食,终止大数据应用项目. 部署和扩展Hadoop系统是一件高度复杂的事情,如果用户能提前对Hadoop扩展可能会遇到的各种问题和危险信号有所了解,就能避免很多"救火"场面. 以下是Altiscale的Raymie Stata为我们总结的Hadoop大数据系统出现扩展问题的七大危险信号: 危险信

Hadoop大数据系统的七大危险信号

大多数企业大数据应用案例尚处于实验和试点阶段,对于少数首次在生产环境部署Hadoop系统的用户来说,最常遇到的就是扩展问题,此类问题往往导致企业因噎废食,终止大数据应用项目. 部署和扩展Hadoop系统是一件高度复杂的事情,如果用户能提前对Hadoop扩展可能会遇到的各种问题和危险信号有所了解,就能避免很多"救火"场面. 以下是Hadoop大数据系统出现扩展问题的七大危险信号: 危险信号一: 永远进入不了生产阶段 大数据应用从概念验证到生产环境是一个巨大的飞跃,Hadoop系统的可扩展

安装过程中的IIS与asp安全防护

IIS是Internet Information Server的缩写,它是微软公司主推的服务器,最新的版本是Windows2000里面包含的IIS 5,IIS与WindowNT Server完全集成在一起,因而用户能够利用Windows NT Server和NTFS(NT http://www.aliyun.com/zixun/aggregation/19352.html">File System,NT的文件系统)内置的安全特性,建立强大,灵活而安全的Internet和Intranet站点

麦奇:网站优化过程中需要掌握的几点策略

从网站开始策划起,就应该对网站运营作出一个详细的运行方案,为后期的推广.网站内容等作出一个指导.特别是在搜索引擎优化过程中,更应该讲求执行效率和策略,如果没有目标的开展工作,会导致后期的SEO偏离网站运营主旨,造成不必要的时间和资源浪费.通过几年的网络营销研究和实战经验,麦奇搜索引擎优化分享几个网站优化过程中需要掌握的几点策略. 第一.网站关键词策略 一个网站优化的成败,很大程度上取决于前期关键词的选择.有不少人热衷于关键词优化,也就是选择几个比较热门的关键词使其在搜索引擎获取一个好的排名.其实

外链建设过程中站长必需知道的八大法则

上个月写的一篇文章全新解读网站权重的实质及常见误区进入A5排行榜,被转载的次数相当多,在SEOWHY.落伍等站长平台此文章被许多朋友反复转载和发布,很多站长说读一星期的文章不如读这一篇收获的多,梦东风感到非常欣慰.许多朋友提出让我写一篇怎么提升网站权重的文章,近期由于上新网站耽误了,所以一直没来得及写,笔者认为提升网站权重无外乎于两个方面,一个是站内,另一个是站外,只有站内站外双修才能有效提高网站权重.今天先说站外,站外主要是依靠外链的建设来提升网站权重,现在流行的说法很多,比如内容是王,外链是

浅谈百度百科撰写过程中需要谨记的要点

昨天看到了一篇文章,标题忘记了,不过文章内容倒是很新颖,讲的是作者劝告站长朋友不要太迷信百度百科,新站建立完成之后立即就去编写百科,这样对于网站的发展并不利.原因也很简单,那就是百度照顾自家产品,百科的排名会一直凌驾于你主站之上.作者朋友话说的有一定道理,但是作为草根站长,百科的提交成功绝对是利大于弊,首先会在一定程度上提升网站的权重,其次对于网站专业度以及信任度也有一定的辅助作用,所以百度百科的撰写对于网站来说还是很重要的. 这个时候一个令人纠结的问题就出现了,当我们不怕百科的"坏影响&quo