又是干货,这个春节感觉吃饱了。各方面---RHCS集群理论


什么是集群?
    集群是一组(>2)相互独立的,通过高速网络互联的计算机组成的集合。群集一般可以分为科学集群,负载均衡集群,高可用性集群三大类。
    科学集群是并行计算的基础。它对外就好象一个超级计算机,这种计算机内部由十至上万个独立处理器组成,并且在公共消息传递层上进行通信以运行并发应用程序,像中国的银河,曙光超级计算机。
    高可用性集群,当集群中的一个系统发生故障时,集群软件迅速作出反应,将该系统的任务分配至集群中其它正在工作的系统上执行,通过消除单一故障点和节点故障转移功能来提供高可用性,次节点通常是主节点的镜像。
    负责均衡集群将服务请求分摊处理到集群中的多个节点上。如软件型LVS,硬件型F5。
    在实际生产环境中,这三种集群相互交融,如高可用性集群也可以在节点之间均衡用户负载。
什么是RHCS?
    RHCS即REDHAT CLUSTER SUITE,中文意思即红帽集群套件。它是一套综合的软件组件,可以通过在部署时采用不同的配置,以满足你的对高可用性,负载均衡,可扩展性,文件共享和节约成本的需要。
    RED HAT公司在2007年发布RHEL5时,就将原本作为独立软件发售的用于构建企业级集群的集群套件redhat cluster suite(RHCS)集成到了操作系统中一同发布。
RHCS提供如下两种不同类型的集群:
1、应用/服务故障切换----通过创建N个节点的服务器集群来实现关键应用和服务的故障切换
2、IP负载均衡----对一群服务器上收到的IP网络请求进行负载均衡

RHCS技术要点:
1、最多支持128个节点(红帽3和4支持16个节点)
2、可同时为多个应用提供高可用性
3、NFS/CIFS故障切换:支持UNIX和WINDOWS环境下使用的高可用性文件
4、完全共享的存储子系统:所有集群成员都可以访问同一个存储子系统
5、综合数据完整性:使用最新的I/O屏障(barrier)技术,如可编辑的嵌入式和外部电源开关装置(power switches)。
6、服务故障切换:它可以确保及时发现硬件停止运行或故障的发生并自动恢复系统,同时,它还可以通过监控应用来确保应用的正确运行并在其发生故障时进行自动重启。

RHCS组件说明:


分布式集群管理器(cman)
    Cluster manager 简称CMAN,是一个分布式集群管理工具,运行在集群的各个节点上,为RHCS提供集群管理任务。
    它用于管理集群成员、消息和通知。它通过监控每个节点的运行状态来了解节点成员之间的有关系。当集群中某个节点出现故障时,节点成员关系将发生改变,CMAN及时将这种改变通知底层,进而做出相应的调整。
    CMAN根据每个节点的运行状态,统计出一个法定节点数,作为集群是否存活的依据。当整个集群中有多于一半的节点处于激活状态时,表示达到了法定节点数,此集群可以正常运行,当集群中有一半或少于一半的节点处于激活状态时,表示没有达到法定的节点数,此时整个集群系统将变得不可用。
CMAN依赖于CCS,并且CMAN通过CCS读取cluster.conf文件。
锁管理(DLM)
    Distributed Lock Manager,简称DLM,是一个分布式锁管理器,它是RHCS的一个底层基础构件,同时也为集群提供了一个公用的锁运行机制。DLM运行在每个节点上,GFS通过锁管理器的机制来同步访问文件系统的元数据。CLVM通过锁管理器来同步更新数据到LVM卷和卷组。
DLM不需要设定锁管理服务器,它采用对等的锁管理方式,大大提高了处理性能。同时,DLM避免了单个节点失败需要整体恢复的性能瓶颈。另外,DLM的请求是本地的,不需要网络请求,因此请求会立即生效。最后,DLM通过分层机制,可以实现多个锁空间的并行锁模式。
配置文件管理(CCS)
    Cluster configuration system 简称CCS,主要用于集群配置文件管理和配置文件在节点之间的同步。CCS运行在集群的每个节点上,监控每个集群节点上的单一配置文件/etc/cluster/cluster.conf的状态。当这个文件发生任何变化 时,都将些变化更新至集群中的每个节点上,时刻保持每个节点的配置文件同步。
    Cluster.conf是一个XML文件,其中包含集群名称,集群节点信息,集群资源和服务信息,fence设备等。
栅设备(Fence)
    通过栅设备可以从集群共享存储中断开一个节点,切断I/O以保证数据的完整性。当CMAN确定一个节点失败后,它在集群结构中通告这个失败的节点,fenced进程将失败的节点隔离,以保证失败节点不破坏共享数据。它可以避免因出现不可预知的情况而造成的“脑裂”(split-brain)现象。“脑裂”是指当两个节点之间的心跳线中断时,两台主机都无法获取对方的信息,此时两台主机都认为自己是主节点,于是对集群资源(共享存储,公共IP地址)进行争用,抢夺。
    Fence的工作原理是:当意外原因导致主机异常或宕机时,备用机会首先调用fence设备,然后通过fence设备将异常的主机重启或从网络上隔离,释放异常主机占据的资源,当隔离操作成功后,返回信息给备用机,备用机在接到信息后,开始接管主机的服务和资源。
    RHCS的Fence设备可以分为两种:内部Fence和外部Fence。内部fence有IBM RSAII卡,HP的ILO卡,以及IPMI设备等;外部FENCE设备有UPS,SAN switch ,Network switch等。
栅设备实例
    当节点A上的栅过程发现C节点失效时,它通过栅代理通知光纤通道交换机将C节点隔离,从而释放占用的共享存储。
    当A上的栅过程发现C节点失效时,它通过栅代理直接对服务器做电源power on/off,而不是去执行操作系统的开关机指令。
rgmanager管理
    它主要用来监督、启动、停止集群的应用、服务和资源。当一个节点的服务失败时,高可用集群服务管理进程可以将服务从这个失败节点转移至其点健康节点上,这种服务转移能力是自动动,透明的。
    RHCS通过rgmanager来管理集群服务,rgmanager运行在每个集群节点上,在服务器上对应的进程为clurgmgrd。
    在RHCS集群中,高可用生服务包括集群服务和集群资源两个方面。集群服务其实就是应用,如APACHE,MYSQL等。集群资源有IP地址,脚本,EXT3/GFS文件系统等。
在RHCS集群中,高可用性服务是和一个失败转移域结合在一起的。由几个节点负责一个特定的服务的集合叫失败转移域,在失败迁移域中可以设置节点的优先级,主节点失效,服务会迁移至次节点,如果没有设置优先,集群高可用服务将在任意节点间转移。
    说了这么多,初学者可能还是不明白RHCS组件之间的关系,所以整个图给大家作感性认识一下,RHCS组件可以归到以下图示中:


集群配置和管理工具
    RHCS提供了多种集群配置和管理工具,常用有基于GUI的system-config-cluster,conga等,还提供了基于命令行的管理工具。
    System-config-cluster由集群节点配置和集群管理两个部分组成,分别用于创建集群节点配置文件和维护节点运行状态,一般用于早期的RHCS版本中。
    Conga是新的基于网络的集群配置工具。它是web界面管理的,由luci和ricci组成,luci可以安装在一台独立的计算机上,也可安装在节点上,用于配置和管理集群,ricci是一个代理,安装在每个集群节点上,luci通过ricci和集群中的每个节点通信。
    GFS是RHCS为集群系统提供的一个存储解决方案,它允许集群的多个节点在块级别上共享 存储,多个节点同时挂载一个文件系统分区,而使文件系统数据不受破坏,单一的ext2或ext3无法做到。
    为了实现多个节点对一个文件系统同时进行读写操作,GFS使用锁管理器(DLM)来管理I/O操作:当一个写进程操作一个文件时,此文件被锁定,其它进程无法进行读写操作,操作完成后,RHCS底层机制会把此操作在其它节点上可见。
有GFS就有RHCS,但建立RHCS时,如果不用共享存储,就没有必要用GFS。
资源(Resource)
脚本(script),IP Address,File system可以用来定义一个高可用的web服务功能

时间: 2024-12-25 22:58:07

又是干货,这个春节感觉吃饱了。各方面---RHCS集群理论的相关文章

国际牛奶日,从吃饱到营养

□董莉莉 在提倡健康生活的今天,饮食健康一直是人们关注的焦点.牛奶这一颇具营养价值的饮品,逐渐深入到普通百姓的生活中,成为不可或缺的日常消费品. 即将到来的5月23日是"国际牛奶日",许多市民可能并不知晓.在我市,随着人们对牛奶营养价值认识的提高,牛奶渐渐普及到千家万户,成为普通人生活中必不可少的营养品.现在,无论是在华联购物中心.爱家购物中心.喜盈门购物广场等各大超市还是在小商铺,各个品牌.不同包装的乳制品随处可见,购买的消费者络绎不绝.在当今社会,营养和健康对于大众的意义,非同一般

小米手机“吃”饱了 饥饿营销玩够了

小米手机"吃"饱了,饥饿营销玩够了.从6月7日开始,小米手机开始实施7×24小时全面开放购买,不再限量,还有优惠政策.在营销策略上,对米粉来说,似乎来得有些突然,有点让米粉受宠若惊. 小米手机,始终立足于互联网的角度做手机.可如今,站在互联网做手机的厂商不止一家,盛大.阿里巴巴.百度等互联网大佬们也紧随其后,推出了自有品牌手机.而且,与高性价比的小米手机相比,其价格更优惠,产品性能也不相上下,加之各家都在布局高考后的购物浪潮,小米此时不开放还待何时? 或许,小米手机之所以会被津津乐道,

吃饱就睡害处多_生活健康

晚餐与入睡的时间间隔,可直接影响人的健康.根据临床资料显示,泌尿系结石.胃及十二指肠球部溃疡 出血.结肠癌.冠心病.高血压.神经衰弱等疾病的发生,与这一时间间隔有一定关系.  有些人习惯于"吃饱了就睡",这无异于"睡以等病".因为晚饭后不久就睡眠,机体大部分组织器官开 始进入代谢缓慢的"休整"状态,而胃肠道却被迫处在"紧张工作"中,造成机体部分状态不平衡.这样 不但影响了睡眠,更易导致消化不良."吃饱了就睡"

Weblogic 12C 集群访问速度慢,明显感觉没有单机的TOMCAT快的问题

问题描述 我现在用三台linux64位配置了weblogic集群,清单是这样的:172.16.129.24:7001管理控制台172.16.129.24:8080使用weblogic自带的代理服务器,没有配apache,还不知道性能上有没有差异172.16.129.24:7003受管服务器1172.16.129.65:7004受管服务器2172.16.129.61:7005受管服务器3我们有一个CIS的java应用,部署到集群上,感觉访问总是没有单机的TOMCAT快,有哪位大虾知道原因么?htt

《舌尖2》周五已开播 导演提示“吃饱再看哟”

时隔两年,<舌尖上的中国> 终于回归,迫不及待的观众选择边回顾第一季边等待,还未亮相,<舌尖上的中国>第二季在豆瓣上已经刷到了9.2的高分.总导演陈晓卿说,"<舌尖上的中国>第二季将通过展示人们日常生活中与美食相关的多重侧面,描绘与呈现中国人的文化传统.家族观念.生活态度与故土难离.人们收获.保存.烹饪.生产美食,并在其过程中留存和延续食物所承载的味觉记忆.饮食习俗.文化样态与家常情感."<舌尖上的中国>第二季第一集昨天在北京举行了小型看

日本熊本地震:索尼跌倒,三星吃饱

4月17日消息,本月16日,日本熊本县发生了7.3级地震.因为熊本县有很多半导体工厂,所以有着日本硅岛之称.此次地震,对熊本县的半导体工厂造成了严重冲击. 索尼上周日表示,公司位于于日本南部熊本县的图像传感器工厂依旧处于暂时停产状态,位于长崎和大分的图像传感器工厂已恢复运营.众所周知,目前大多数智能手机采用的图像传感器均出自索尼之手,而熊本地震的发生,自然会对索尼工厂的生产和出货量造成影响,进而影响各个手机厂商的产品产能.摩根士丹利甚至还分析称,iPhone7的发布可能会因此推迟. 不过IT之家

吃饱才能改变世界!思杰三云带来什么?

背景介绍: 2011年10月26日至28日,思杰公司在西班牙巴塞罗那召开Citrix Synergy 2011行业盛会.Citrix Synergy大会每年举办两次,一次在欧洲,一次在美国,大会内容主要聚焦于思杰公司整个企业的动态以及未来的蓝图和规划,并探讨如何跟合作伙伴一起,运用虚拟化技术.云技术等帮助客户应对复杂的世界,实现企业业务的转型和发展. 为了让国内用户更好地了解本届巴塞罗那Citrix Synergy大会的相关内容,思杰公司在北京召开了媒体沟通会.在沟通会上,思杰系统公司大中华区总

全是干货---Linux 高可用(HA)集群基本概念详解

http://www.linuxidc.com/Linux/2013-08/88522.htm 高可用集群的衡量标准    HA(High Available), 高可用性群集是通过系统的可靠性(reliability)和可维护性(maintainability)来度量的.工程上,通常用平均无故障时间(MTTF)来度量系统的可靠性,用平均维修时间(MTTR)来度量系统的可维护性.于是可用性被定义为:HA=MTTF/(MTTF+MTTR)*100%   具体HA衡量标准: 99% 一年宕机时间不超

【干货】Apache Hadoop 2.8 完全分布式集群搭建超详细过程,实现NameNode HA、ResourceManager HA高可靠性

最近在自己的笔记本电脑上搭建了Apache Hadoop分布式集群,采用了最新的稳定版本2.8,并配置了NameNode.ResourceManager的HA高可用,方便日常对Hadoop的研究与测试工作.详细的搭建过程如下: 1.安装docker,创建docker容器,用于搭建hadoop节点 docker真是个好东西啊,当要在自己的笔记本上搭建分布式集群时,由于CPU.内存.磁盘有限,无法在VMware上虚拟出太多节点,这时使用docker创建几个容器,就能轻松搭建一个分布式集群了. (1)