在虚拟环境下配置集群及故障恢复体系

虚拟数据中心的高可用性(HA)是一个多层次的任务,它涉及到在线备份(live backup)、故障恢复功能或集群等等。在本文中,将探讨如何在虚拟环境下配置集群 (cluster),建立故障恢复体系(failover structure)。

虚拟化的高可用性有两个层面。我们既可以在子机层操作,依赖OS和应用灾难恢复能力;也可以在主机层操作,从而面对一系列新的问题。

在子机层执行HA配置的过程几乎与在物理机环境下一样,需要解决一些技术问题。例如,为每个虚拟网络接口设置静态MAC地址。此外,还需要突破一些限制因素,这些 限制因素取决于所选的虚拟化平台和HA软件。不过,虚拟集群创建基本上都是可以完成的,甚至可以创建混合式(mixed)虚拟集群。在混合式虚拟集群中,有一个或多个节 点是虚拟机,其它节点则均为物理机。

主机的高可用性更有必要性,不过也更加复杂。在这样的情况下,以故障恢复为例,运行于主机中的虚拟机必须被复制到另一台主机,而且要保持持续性同步,复制虚拟 磁盘和虚拟内存修改。这个操作与在线备份有同样的问题,而且还更加复杂,需要尽可能快、尽可能多地重复进行此操作。

这样,Vizioncore再一次成为了主角。它有esxReplicator,能够将正在运行的虚拟机从一台VMware Server复制到另一台VMware Server,而且不需要集中存储设备。不 幸的是,这款产品不能处理网络修改(network modification),而执行故障恢复时需要用到网络修改,所以我们只能手动切换出错主机和冷备份(cold standby)主机。

VMware自身也提供了一个更加强大的解决方案,推出了ESX Server 3和VirtualCenter 2,这是一个基于VMotion的故障恢复选项。VMware HA不像Vizioncore esxReplicator,它可以自动重启出错主机中的虚拟机。不过很遗憾,VMware HA在配置方面非常费力。它必须要有VirtualCenter和VMotion,而且虚拟机必须存储于光纤通 道SAN环境,否则它就无法工作。

其它高可用性方法

另一方面,P2V迁移工具可以帮助我们执行P2V迁移。因此,我们可以配置P2V迁移工具,以便复制虚拟机到其它主机。

在这种情况下,PlateSpin是一个比较好的选择。它提供了Windows操作系统的动态迁移功能(live migration)。此外,还可以利用这个技术进行灾难恢复。然而不幸的 是,PlateSpin跟Vizioncore一样,也不能处理故障恢复的每个方面,所以我们还得手动干预。

使用故障恢复固然是个不错的方法,但是最可取的HA配置方法毫无疑问当属集群。在集群中,多台主机担当共享虚拟机的一个执行前端。如果其中一个主机出错,不会造 成服务中断。因为还有其它主机可以正常工作,虚拟机总是可用。

利用虚拟化平台的自身功能或第三方解决方案,我们可以在主机层执行集群。

例如,在Microsoft Virtual Server中,Windows是主机操作系统,微软允许通过Cluster Service执行虚拟化物理节点集群。

相反,VMwareESX Server没有这样的功能。不过,它有一些外部解决方案可以完成这个任务,如Symantec Veritas Cluster Service。最近EMC公司发布了Rainfinity, 这让我们看到了希望,有一天RainWall技术终将可以用于执行ESX集群。

目前,虚拟化集群解决方案还远不够成熟,在采用之前一定要进行严格的测试。

时间: 2024-08-06 09:58:22

在虚拟环境下配置集群及故障恢复体系的相关文章

Oracle 11gR2 RAC Database使用emca配置集群dbconsole

下面的步骤详细的说明了在Oracle 11gR2 RAC Database环境下使用emca配置集群dbconsole遇到的部分问题及解决的方法. 1.数据库环境.Oracle Exadata Machine x4-2Oracle RAC Database 11.2.0.4.6 for Linux x86_64bit[root@dm01db01 ~]# uname -r2.6.39-400.126.1.el5uek 2.使用EMCA创建EM.[root@dm01db01 ~]# su - ora

centsos6.5下 memcache集群安装magent代理服务错误

问题描述 centsos6.5下 memcache集群安装magent代理服务错误 报错信息gcc -Wall -O2 -g -c -o magent.o magent.cmagent.c:64:19: error: event.h: No such file or directorymagent.c:123: error: field 'ev' has incomplete typemagent.c:153: error: field 'ev' has incomplete typ有哪位大侠能

云环境下的集群负载分析及调度策略研究

云环境下的集群负载分析及调度策略研究 杭州电子科技大学 应俊 本文首先研究了传统数据中心的特点及其缺点,分析了云数据中心的特点,接着研究了云集群的负载监控技术以及基于libvirt的虚拟机负载搜集技术.介绍了云环境下调度的概念和特征,并以OpenStack云平台为例详细分析了云环境下的调度机制.以CloudSim为例分析了云模拟技术,并研究了其中的主要模块. 随后,为了能深入理解云数据中心负载特征,本文搜集了实际公有云中生产集群的负载数据,涉及1082个虚拟机实例和100台物理机,时间跨度为20

weblogic10.3下的集群,切换过于频繁,大家遇到过吗?

问题描述 weblogic下的集群,用的是weblogic的自带的代理,一共6个节点,基本上登上去没多久就会被集群切换到其他节点上去,请问大家遇到过类似的问题吗?补充:集群的各个节点都没问题,不是说出现问题再切换的,是无缘无故切换. 解决方案 解决方案二:这点描述看不出什么问题.以前有过一个情况就是:不是server本身问题,是weblogic出问题一直切换解决方案三:菜鸟问下如何才能看到更明确的诊断信息呢?解决方案四:1.故障:2.负载(cpu+内存+网络):解决方案五:太笼统了啊,大家能具体

云环境下产业集群信息服务平台的新模式

云环境下产业集群信息服务平台的新模式 王玉: 刘春: 赵海军 文章分析了现有产业集群信息服务平台的政府主导.行业协会联盟主导及信息技术公司主导3种模式的服务内容与服务状况,针对其存在的局限性,构建了云环境下产业集群的信息服务平台新模式,分析了新模式的信息服务内容及运营模式. 云环境下产业集群信息服务平台的新模式

Linux下Storm集群搭建配置教程

准备服务器 4台服务器,在每台hosts配置,命名为storm storm1 storm2 storm3,storm用作nimbus,drpc,admin等 java环境要配置好 部署zookeeper集群 为每台zookeeper目录建立data.log目录,并在data下新建文件myid,内容分别为1,2,3 zoo.cfg配置 dataDir=/usr/local/zookeeper/data dataLogDir=/usr/local/zookeeper/log server.1=sto

tomcat配置集群

在Tomcat中使用集群功能相对简单.最简单的用法是直接在server.xml文件的或节点下添加 <Cluster className="org.apache.catalina.ha.tcp.SimpleTcpCluster"/> 配置,这意味着集群相关的配置都使用默认的,它其实等同于 <Cluster className="org.apache.catalina.ha.tcp.SimpleTcpCluster" channelSendOption

Windows2003配置集群详解

原文: http://blog.csdn.net/xunyn/article/details/7388900    集群是在一组计算机上运行相同的软件并虚拟成一台主机系统为客户端与应用提供服务:计算机通过缆线物理连接并通过集群软件实现程序上的连接,可以使计算机实现单机无法实现的容错和负载均衡.集群技术在企业组织部署关键业务.电子商务与商务流程应用等领域,具有举足轻重的作用.     本文主要带领大家一起,参与到基于Windows2003操作系统的集群配置中来,从以下的配置过程中,希望读者朋友能切

nginx tomcat 配置集群负载

开发的应用采用F5负载均衡交换机,F5将请求转发给5台hp unix服务器,每台服务器有多个webserver实例,对外提供web服务和socket等接口服务.之初,曾有个小小的疑问为何不采用开源的apache.Nginx软件负载,F5设备动辄几十万,价格昂贵?自己一个比较幼稚的问题,后续明白:F5是操作于IOS网络模型的传输层,Nginx.apache是基于http反向代理方式,位于ISO模型的第七层应用层.直白些就是TCP UDP 和http协议的区别,Nginx不能为基于TCP协议的应用提