集群管理工具经得起考验吗?

如今集群设计遍地都是。最典型的例子包括软件定义存储、虚拟化架构、超级融合、公有云与私有云,以及众所周知的大数据。集群以横向扩展的方式来构建基础设施,使用商业产品,如服务器和JBOD。横向扩展的设计能够实现容量与性能递增,与大部分纵向扩展的基础架构相比,有着巨大的成本规模效益。

大集群因为其支持大规模融合与整合,可以协助优化整体资本支出,而不断吸引业内目光。那么为什么我们不把现在所有的IT基础设施都集群化呢?大规模集群管理和运维都相当复杂,尤其是在开始将工作负载和租户结合后。如果建造了一个大集群,就必须确保期能充分得到利用,也意味着需要托管大量工作负载。一旦出现这种情况,IT需要搞清楚如何合理的优先或公平分配资源。这从来不是一件简单的事——实施、配置与优化管理共享集群架构的总运营成本,通常会高于部署完全独立或向上扩展产品的总成本。

当集群在虚拟化基础架构中,虚拟化管理程序负责加强共享、隔离吵闹的邻居、动态迁移和/或重新启动受影响,甚至突然飙升的工作负载,还扮演交警的角色。这几年我们发现了该领域的长足进步,可以在虚拟机层面和虚拟存储卷级别(如VMware VVOL)上,动态执行用户指定的服务质量(QoS)。

当然,可以把基础架构云(如OpenStack)作为大型、优化管理集群资源作为整体思路。尽管如此,虚拟化和云基础架构平台需要数年时间才能成熟,目前仍然不完美。在开发云管理工具的路上还有很长的路要走,要实现在专属设备上部署系统的简化。而且在虚拟化环境内,仍然难以确保虚拟机内的应用程序能够提供最终用户可靠的响应时间。

针对大数据的集群管理工具

有效的集群管理设计对大数据尤其重要,这关系到引入企业IT规模扩展的HPC技术。Hadoop、Spark和其他可扩展NoSQL工具旨在让所有人都实现分布式处理。然而,生产大数据应用程序目前要求应用程序性能的一致性。当大数据应用支撑着关键业务流程时,运营与性能的可靠性和稳定性将成为问题。

在种类繁多的大数据工具如Hadoop集群,每个大数据作业都争夺相同的资源。到目前为止,很多Hadoop集群只是简单处理小型单一的大数据处理流程或只对小部分用户服务,通常用于非生产环境的数据科学。但随着大数据集群移入生成环境,就意味着它们需要承载更多的任务并且服务多个租户——就如大型虚拟化或云集群。而当这种集群被共享,管理大数据将成为一大挑战。

经常看到新的大数据集群管理和操作方案并不稀奇。集群管理工具一般分为几类。起步于高性能计算领域的Bright Computing公司,现在正协助企业从裸机上部署、配置与管理大型集群。

但真正的关键在于性能管理,秘诀在于了解都是谁,以及在什么时候做什么事。至少,还有标准的工具可以从集群的日志文件(通常十分巨大)中生成报告。但随着日志的增长,这个方法的效果会降低。而且当谈及运营性能,真正要做的实际上是优化混合租户与混合工作负载环境的QoS和运行时。例如,Pepperdata能生成实时运行视图,展示集群里正在发生什么,然后可以动态的控制和分配集群资源。这样可以保证优先级应用程序满足服务器级别协议,同时最小化集群基础设施的规模。

在更高的级别,大数据需要有自己专属的应用程序性能管理程序。例子之一是Concurrent的Driven,可以跟踪和回溯应用程序执行轨迹,还可以直接监控业务流程和应用程序级的工作流,应用程序之间的内部依赖、运行时和失败。这样有助于识别代码瓶颈,规划和修复工作流执行窗口,并协助数据管理。

随着横向扩展架构在数据中心内落地,集群管理工具的价值将增长——降低资源共享所需的资本支出,同时保障承诺性能和其他大数据处理业务的QoS。在某些情况下,IT没有这些集群专用工具协助,是可能无法有效处理这些大数据集群的。

总的来说,我们认为大型集群管理这十年成熟的非常快,它借鉴了虚拟化管理来解决高优先级的生产工作负载。通过学习这些虚拟化和云计算前辈,甚至可以取代他们,产生一个更为完整的集群数据中心愿景。

作者:Mike Matchett 翻译:陈德文

来源:51CTO

时间: 2024-09-25 10:05:32

集群管理工具经得起考验吗?的相关文章

synctool 5.2发布 集群管理工具

synctool 是一个集群管理工具,使集群中所有节点的配置文件保持同步.节点有可能是一个逻辑组或类的一部分,此时他们需要一个配置文件的特定子集.synctool可以按照需要时重新启动守护进程,前提是如果相关的配置文件已被更改,它也可以用于补丁管理或其他系统管理任务. synctool 5.2该版本修复了DSH-PKG命令解析错误,Nagios的检查脚本已完成. 软件信息:http://www.heiho.net/synctool/ 下载地址:http://www.heiho.net/synct

synctool 5.1发布 集群管理工具

synctool是一个集群管理工具,使集群中所有节点的配置文件保持同步.节点有可能是一个逻辑组或类的一部分,此时他们需要一个配置文件的特定子集.synctool可以按照需要时重新启动守护进程,前提是如果相关的配置文件已被更改,它也可以用于补丁管理或其他系统管理任务. synctool 5.1该版本修复了一些在以前版本的错误.在命令行上的节点和组的逗号分隔列表不正确的解析问题已修复.每当输出打印到stderr,节点名称将不会被印在前面的信息.dsh-ping现在支持fping和Solaris pi

Google披露:大规模集群管理工具Borg的细节

Google最近发布了一篇名为"Google使用Borg进行大规模集群的管理"的论文,披露了这个在过去极少提及的技术的细节. Borg是一个集群管理器,它负责对来自于几千个应用程序所提交的job进行接收.调试.启动.停止.重启和监控,这些job将用于不同的服务,运行在不同数量的集群中,每个集群各自都可包含最多几万台服务器.Borg的目的是让开发者能够不必操心资源管理的问题,让他们专注于自己的工作,并且做到跨多个数据中心的资源利用率最大化.下面这张图表描述了Borg的主要架构: Borg

雅虎推出 Kafka 集群管理工具 —— Kafka Manager

Kafka Manager 是 Yahoo 推出的 Kafka 管理工具,支持: 管理多个集群 轻松检查集群状态 (topics, brokers, replica distribution, partition distribution) 执行复制选举 生成分区指派,基于集群的状态 分区的重新指派 该项目基于 Play Framework 框架开发. Cluster Management 文章转载自 开源中国社区 [http://www.oschina.net]

使用Linux集群管理工具pssh批量管理服务器

当你有多台服务器,如果一台一台登录上去管理那就说不出的麻烦,所以批量管理工具就应运而生了.只要你设置了SSH无密码登录: ssh-keygen -t rsa ssh-copy-id user@host 将密钥分发到响应的host上就可以实现无密码ssh登录和操作了. pssh是使用Python编写的,运行它前需要确保机器上已经安装了Python环境. 使用wget下载编译安装: wget http://parallel-ssh.googlecode.com/files/pssh-2.3.1.ta

Docker 开源集群管理和容器编排工具 SwarmKit

最近Docker公司开源了Docker集群管理和容器编排工具SwarmKit,其主要功能包括节点发现.基于raft算法的一致性和任务调度等. 基本概念 服务器上运行SwarmKit工具的swarmd命令后,即可将其加入到服务器集群中,该服务器就成为集群中的一个节点.SwarmKit将节点分为两类: 工作节点负责通过执行器运行任务.SwarmKit的默认执行器为Docker容器执行器(Docker Container Executor); 管理节点负责接收和响应用户的请求,将集群状态调节成最终状态

[喵咪Liunx(5)集群管理利器pssh

[喵咪Liunx(5)集群管理利器pssh 前言 哈喽大家好呀!大家在管理服务器的时候如果只是一两台还好,当你管理三台以上的服务器的时候,你安装任何一个软件更改任何一个配置文件就要无比麻烦的每一台机器都去执行命令(当然用docker等的请无视),pssh可以帮我们解决这些问题,可以吧准备好的脚本批量在所有机器上进行执行,帮助你批量管理服务器集群! 附上: 喵了个咪的博客:w-blog.cn pssh官网地址:http://www.theether.org/pssh/ 1. 安装 pssh和mon

【RAC】集群验证工具cluvfy 实践之二

Cluster Verification Utilit(CVU)是Oracle所推荐的一种集群检验工具.该检验工具帮助用户在Cluter部署的各个阶段验证集群的重要组件,这些阶段包括硬件搭建.Clusterware的安装.RDBMS的安装.存储等等.我们既可以在Cluster安装之前使用CVU来帮我们检验所配置的环境正确可用,也可以在软件安装完成后使用CVU来做对集群的验收. 1.获取集群验证工具cluvfy的帮助信息 grid@rac1:/home/grid>cluvfy -help USAG

Java微服务开发指南 -- 集群管理、失败转移和负载均衡的实践

集群管理.失败转移和负载均衡的实践     在前一章节中,我们快速的介绍了集群管理.Linux容器,接下来让我们使用这些技术来解决微服务的伸缩性问题.作为参考,我们使用的微服务工程来自于第二.第三和第四章节(Spring Boot.Dropwizard和WildFly Swarm)中的内容,接下来的步骤都适合上述三款框架. 开始     我们需要将微服务打包成为Docker镜像,最终将其部署到Kubernetes,首先进入到项目工程hola-springboot,然后启动jboss-forge,