解决单点故障 NEC虚拟机高可用解决方案

  

 随着CPU多核技术的日臻成熟,强大的硬件能力使单机运行多个独立应用平台更显游刃有余。并且,使用虚拟机作服务器可以提高机器的使用效率,大幅节省硬件成本。使用虚拟机作服务器的好处非常突出,但是缺点也很明显。

因为多台虚拟机共用同一台物理计算机,所以一台物理计算机的故障会导致多台虚拟服务器业务停止。因此避免单点故障保证业务的连续运行就显得尤为重要。使用NEC的面向虚拟机的高可用集群解决方案,在故障发生时能够自动将业务或虚拟服务器整体切换到备机上,可以很好地解决单点故障的问题,保证系统能够365天24小时不间断运行。

方案内容

产品组成

NEC的虚拟机高可用解决方案由虚拟机产品VMware和高可用集群产品EXPRESSCLUSTER组成。

EXPRESSCLUSTER可以全面监视虚拟服务器以及物理服务器上的各种软、硬件资源(包括虚拟硬件资源)的状态。一旦被监视项目发生故障,则可以根据故障类型,在虚拟服务器之间或物理服务器之间自动进行切换,保证业务连续运行。同时,可以通过EXPRESSCLUSTER来统一管理虚拟服务器,通过特定设置,在故障发生时将信息通知管理员,方便系统管理员的管理,降低维护成本。

此外,通过结合使用VMware的虚拟架构管理中的VMotion功能,可以在保证系统高可用性的同时进一步减少系统计划内宕机时间。

功能特点

全方位实时故障监视

可以监视网络、存储、服务器、操作系统、应用软件、VMware、EXPRESSCLUSTER自身服务状态,以及待机服务器上的软硬件资源的状态。EXPRESSCLUSTER的独特的内核心跳技术,在进行服务器之间的状态探测时,可以不受系统负荷的影响。另外,除了支持网络心跳外,还可以通过COM口、存储设备上的特定分区、以及Ping第三方的方式确认服务器的状态。

丰富的应用程序监视选件

EXPRESSCLUSTER的监视选件通过Agent模块定期对应用程序进行实际访问处理,探测应用的响应时间、返回结果等状态。可以对应用进行深层次状态监视,实现迅速准确的故障诊断。EXPRESSCLUSTER的监视选件可以支持数据库服务器,互联网服务器,文件服务器,应用服务器这4个领域内的几乎全部主流应用。

灵活的集群配置方式

EXPRESSCLUSTER可以支持在虚拟机软件的GuestOS之间进行故障切换,也可以用虚拟机对物理服务器作备份。此外,通过EXPRESSCLUSTER的镜像同步通能,可以对虚拟机上的特定分区的数据进行实时镜像复制,保证数据资产的安全。

简便的维护操作

利用EXPRESSCLUSTER基于B/S结构的集中管理工具,可以进行跨平台远程管理与操作。并且可以可同时管理多个集群(Windows与Linux集群均可)的状态。EXPRESSCLUSTER简便易用的集群配置工具实现了集群配置信息的导入导出和离线编辑,在构筑大量结构相似的集群的时候,只要将一个集群的配置信息,复制后作简单修改就可以导入到其他的集群。对于减少配置操作的工作量非常有效。

技术路线

虚拟机技术可将一台物理计算机虚拟成多台计算机,它可以使多个不同的操作系统同时、独立地运行。

随着CPU多核技术的日臻成熟,强大的硬件能力使单机运行多个独立应用平台更显游刃有余。并且,使用虚拟机作服务器可以提高机器的使用效率,大幅节省硬件成本。下图就是一个将5台服务器用虚拟机整合到1台双CPU的物理计算机上的实际案例,硬件利用率明显提高。

使用虚拟机作服务器的好处非常突出,但是缺点也很明显。因为多台虚拟机共用同一台物理计算机,所以一台物理计算机的故障会导致多台虚拟服务器业务停止。因此避免单点故障保证业务的连续运行就显得尤为重要。

使用NEC的面向虚拟机的高可用集群解决方案,在故障发生时能够自动将业务或虚拟服务器整体切换到备机上,可以很好地解决单点故障的问题,保证系统能够365天24小时不间断运行。

成功案例

在某大型图书馆的管理系统中,有一台Windows平台的图书管理服务器和一台Linux平台的数据库服务器,一直处于单机运行状态。虽然系统负荷并不大,但是由于平台不同,如果要实现系统高可用必须再购买两台服务器。而我们利用该解决方案,使用两个不同平台的虚拟机对这两台服务器进行备份,就只需要一台物理服务器,最大程度地减少了硬件成本支出。

 

作者:FOXL

来源:51CTO

时间: 2024-09-25 22:50:23

解决单点故障 NEC虚拟机高可用解决方案的相关文章

xen虚拟化实战系列(十二)之xen虚拟机高可用之在线迁移

原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://koumm.blog.51cto.com/703525/1286643 xen虚拟化实战系列文章列表 xen虚拟化实战系列(一)之xen虚拟化环境安装xen虚拟化实战系列(二)之xen虚拟机安装xen虚拟化实战系列(三)之xen虚拟机复制xen虚拟化实战系列(四)之xen虚拟机扩展磁盘空间一法xen虚拟化实战系列(五)之xen虚拟机扩展磁盘空间再一法xen虚拟化实战系列(六)之x

Mesos高可用解决方案剖析

Mesos高可用架构概述 首先,我们来参考Mesos官方给出的设计架构,如图1所示. Mesos采用的也是现在分布式集群中比较流行的Master/Slave主从集群管理架构,Mesos master节点是整个集群的中枢,它责管理和分配整个Mesos集群的计算资源,调度上层Framework提交的任务,管理和分发所有任务的状态.这种主从架构设计简单,能够满足大多数正常情况下的集群运作需求,目前仍然存在于很多分布式的系统中,比如Hadoop.MySQL集群等.但是这种简单的设计存在一个致命缺陷,就是

PostgreSQL 金融行业高可用和容灾解决方案

背景 金融行业高度依赖共享存储来解决高可用,数据0丢失以及异地容灾的问题. 开源数据库PostgreSQL基于复制的解决方案能不能解决0丢失,高可用以及容灾的问题? 完全可以,而且更灵活,更可靠. PostgreSQL 金融场景实现 如图1 主备同步通过流复制实现,可靠性指标包含反馈维度的指标和一致性维度的指标. 反馈指标 1. L1,备库接收到REDO并写入XLOG BUFFER. 2. L2,备库接收到REDO并落盘. 3. L3,备库接收到REDO落盘后并恢复. 以上三个指标,对事务的时延

AIX的存储高可用和容灾解决方案实现

基本技术介绍 AIX LVM Mirror 本地存储高可用解决方案介绍 Logical Volume Manager(LVM)是 AIX 上用于逻辑卷管理的软件.LVM 本身提供 Logical Volume (LV)数据在多个 Physical Volume (PV)之间做数据镜像的功能,以达到存储的本地高可用性.在 LVM Mirror 方案中写 I/O 与底层设备交互如下图所示. 图 1. LVM Mirror 方案架构 当服务器发出写 I/O 时,该 I/O 在 Parallel 模式下

数据库高可用和分区解决方案-MySQL 篇

许春植(Luocs) (阿里巴巴高级数据库管理员,7年以上数据库运维管理经验,擅长MySQL.Oracle及MongoDB数据库,目前主要研究并建设MongoDB一套完整的运维体系) 编辑手记:感谢许春植授权独家转载其精华文章,这是系列文章之一,与大家分享其个人学习与经验总结,编辑时略有修订与节略.也欢迎读者朋友向我们投稿. 首先我们看一下数据库以及常看到的 HA 以及分布式架构方案: 数据库类型 架构方案 架构类型 MySQL Keepalived+MySQL Replication HA M

高可用系统设计精要: 定个能达到的小目标,比如先读完本文

在<这多年来我一直在钻研的技术>(http://coolshell.cn/articles/17446.html)这篇文章中,我讲述了一下,我这么多年来一直在关注的技术领域,其中我多次提到了工业级的软件,我还以为有很多人会问我怎么定义工业级?以及一个高可用性的软件系统应该要怎么做出来?这样我也可以顺理成章地写下这篇文章,但是没有人问,那么,我只好厚颜无耻地自己写下这篇文章了.哈哈.   另外,我在一些讨论高可用系统的地方看到大家只讨论各个公司的技术方案,其实,高可用的系统并不简单的是技术方案,

秒级故障切换!用MHA轻松实现MySQL高可用(一)

作者介绍 郝朝阳,运维工程师,专注于运维自动化的实现.现就职于宜搜科技,负责前端运维工作.虽然多方面开花,却致力于形成自己运维体系思想.     1 MHA简介 MHA是由日本人youshimaton(原就职于DeNA,现就职于FaceBook)开发的比较成熟的MySQL高可用方案.MHA能够在30秒内实现故障切换,并能在故障切换中,最大可能的保证数据一致性.目前淘宝也正在开发相似产品TMHA,目前已支持一主一从.   2 MHA架构 MHA由MHA Manager和MHA Node组成.如下图

秒级故障切换!用MHA轻松实现MySQL高可用(三)

作者介绍   郝朝阳,运维工程师,专注于运维自动化的实现.现就职于宜搜科技,负责前端运维工作.虽然多方面开花,却致力于形成自己运维体系思想.   在上一篇的MHA介绍中提及过其它一些MySQL的高可用解决方案,只是略微介绍了以下,在这里详细地介绍.   MySQL复制是异步或者半同步的.当master故障时,一些slave可能并没有收到最新的relay log,也就意味着每个slave可能处于不同的状态.手动处理这些一致性问题是小事,因为不修复这些问题,就不能开始复制.但是手动修复这些问题,花费

keepalived实现服务高可用

第1章 keepalived服务说明 1.1 keepalived是什么? Keepalived软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP功能.因此,Keepalived除了能够管理LVS软件外,还可以作为其他服务(例如:Nginx.Haproxy.MySQL等)的高可用解决方案软件. Keepalived软件主要是通过VRRP协议实现高可用功能的.VRRP是Virtual Router RedundancyPr