在云中针对System x和System p实现基于SLA的高可用性

高可用性 (HA) 是经常与云">基础架构解决方案一起出现的一个词汇,主要是指业务的连续性和最短的停机时间。具体而言,任何云基础架构中的 HA 应当具有以下目标:

减少计划内停机
防止计划外停机 快速从宕机中恢复 持续的可用性

支撑云基础架构的是现代的虚拟机管理程序,它提供了实现 HA 的大部分功能和特性。本文将简要介绍 IBM SmartCloud Enterprise+ 如何处理计划内和计划外的服务器宕机,如何从宕机事件中恢复,以及如何确保持续的服务器可用性。然后,本文将描述 IBM SmartCloud Enterprise+ 中虚拟机 (VM) 的 HA 实现,这些虚拟机运行在 IBM System x 和 System p 平台上的 VMware 和 AIX (LPAR) 逻辑分区之上。

减少计划内停机

计划内宕机通常是为了进行软件维护或发布、更新或进行预定的设备维修。大多数云供应商都安排了一些计划内宕机,但是由于公司的运营基于高正常运行时间,所以计划内宕机需要保持在一个最低的水平。

IBM SmartCloud Enterprise+ 提供了一种自动化方法提供 VM 补丁,并对 OS 进行安全和非安全的更新。它会按照预先定义的周期自动部署更新(由客户决定在该周期内对哪些 VM 安装补丁),不需要任何人工干预。这种完全自动化的补丁方式极大地减少了计划内宕机的次数,使 VM 能够长时间可用,从而确保了业务的持续性。

防止计划外停机

引起云环境中计划外停机的原因有很多种。主要原因是虚拟机管理程序基础架构故障、OS 故障和网络故障。

IBM SmartCloud Enterprise+ 可以在最短的停机时间内处理大多数常见的故障。正如本文后面将介绍到,System x 上的监视代理和 System p 上的本机 daemon 可以检测 OS 故障;而 System x 上的 VMware 心跳时间间隔和 System p 上的一些本地 daemon 可以检测网络故障。

快速恢复宕机

对于计划外停机引起的宕机,恢复速度取决于故障的性质。宕机可能是主机平台故障或存储故障引起的,也可能是 OS 故障或网络故障引起的。如果云供应商没有进行恰当的规划,那么由主机平台故障或存储故障引起的宕机将会导致严重的数据和运行时丢失。

IBM SmartCloud Enterprise+ 中的故障转移机制能够使系统从主机平台和存储故障中快速恢复。故障主机平台上的所有工作负载都会分配到其他主机平台,并且停机时间很短。存储故障由镜像后的数据存储处理。VM 中的所有数据都将在两个数据存储中复制;如果一个数据库出现故障,那么 VM 可以启动并运行另一个复制的数据存储。

持续的可用性

减少计划内和计划外停机,并从宕机中快速恢复,这些都有助于实现持续的可用性,服务器(在平台即服务云中)正是靠这一点才能在大部分时间保持活跃状态,并且只需要非常短的停机。持续可用性可以通过以下方式实现:

在底层虚拟机管理程序中适当地配置 HA 特性 使用操作系统提供的特性实现某些故障检测 监视服务可以监视任何 OS 故障 应用程序监视有助于实现应用程序高可用性

IBM SmartCloud Enterprise+ 使用了大多数由虚拟机管理程序提供的 HA 可用性特性,如主机平台上的故障转移机制、重启优先级、心跳间隔、OS 监视和故障检测,以及死机检测。

时间: 2024-08-01 05:01:24

在云中针对System x和System p实现基于SLA的高可用性的相关文章

从“System.DBNull”到“System.Guid”的强制转换无效。

问题描述 我用了NHibernate技术做简易留言薄,数据库字段为ifexists(select*fromdbo.sysobjectswhereid=object_id(N'[dbo].[tbGuestBook]')andOBJECTPROPERTY(id,N'IsUserTable')=1)droptable[dbo].[tbGuestBook]GOCREATETABLE[dbo].[tbGuestBook]([ID][uniqueidentifier]NOTNULL,[UserName][v

java中System.getenv和System.getProperties有什么区别

System.getenv获取的是系统的环境变量(就是用户在操作系统中设置的环境变量),windows和linux下环境变量的设置就不说了哦. System.getProperties获取的是系统的相关属性.在java api文档中已经列出了如下属性 如果我们要在java程序启动就能获取自定义的系统属性我们可以使用 java –Dname=zhuhui 这样我们就在系统属性中设置了名称为myname值为zhuhui的系统属性,那么就可以通过System.getProperty("name&quo

javase-Java System.out与System.err同时使用时输出乱序

问题描述 Java System.out与System.err同时使用时输出乱序 public class Test { public static void main(String[] args) { for (int i = 0; i < 2; ++i) { System.out.println("normal"); System.err.println("error"); } } } 在IDE下有时运行结果是: normal normal error e

电脑问题-电脑因丢失一部分文件即 system 32/confing/system而不能正常启动系统该怎么办

问题描述 电脑因丢失一部分文件即 system 32/confing/system而不能正常启动系统该怎么办 在使用计算机的过程中,屏幕突然跳出来一个对话框,我想也没想就叉掉了,谁知道后来计算机显示丢失了一些文件,系统不能正常启动了,对了,我的系统是XP的,我希望能保存电脑里的资料,希望各位大神能帮帮我........ 解决方案 判断丢失的文件是哪一个,添加进去,例如,双系统/U盘启动等方式 也或者重装,现在重装系统不是全都会提示备份文件的吗 解决方案二: 用U盘的winPC模式登入系统,修复系

asp.net-System.Web.Mvc.HtmlHelper`1[System.Object]转换为System.Web.Mvc.HtmlHelper

问题描述 System.Web.Mvc.HtmlHelper`1[System.Object]转换为System.Web.Mvc.HtmlHelper 无法将System.Web.Mvc.HtmlHelper`1[System.Object] 的对象强制转换为类型 System.Web.Mvc.HtmlHelper ASP.NET MVC4 下使用DevExpress 开发的第三方控件出错 代码: @{ var grid = Html.DevExpress().GridView(settings

求助?无法在System.int32和System.string上执行“like”操作

问题描述 错误提示:无法在System.int32和System.string上执行"like"操作.跟踪也不知道是哪的错误! 解决方案 解决方案二:我也不知道哪错了解决方案三:什么叫like?我没明白.是SQL里的吗?1:SQL里int类型是无法like的,要char系列的才行:2:SQL里string类型的方法是:select*fromtablewheretextFieldLike'%T%';解决方案四:错是在int类型无法用Like来匹配,int的解决办法还不知道但是要是改成va

请求“System.Net.SocketPermission, System, Version=2.0.0.0, Culture=neutral, Public

问题描述 在执行用户定义例程或聚合"SendSisenMessage"期间出现.NETFramework错误:System.Security.SecurityException:请求"System.Net.SocketPermission,System,Version=2.0.0.0,Culture=neutral,PublicKeyToken=b77a5c561934e089"类型的权限已失败.System.Security.SecurityException:在

“System.String”到“System.Guid”的强制转换无效。各位路过的请帮忙看看!

问题描述 大家帮我看一下,谢谢.调试后老是出现下面错误:从"System.String"到"System.Guid"的强制转换无效.说明:执行当前Web请求期间,出现未处理的异常.请检查堆栈跟踪信息,以了解有关该错误以及代码中导致错误的出处的详细信息.异常详细信息:System.InvalidCastException:从"System.String"到"System.Guid"的强制转换无效.源错误:行59:publicvo

System.ArgumentException: 类型“System.Boolean”的对象无法转换为类型“System.Byte[]”。

问题描述 異常:System.ArgumentException:类型"System.Boolean"的对象无法转换为类型"System.Byte[]".我做了個FORMVIEW控件,裡面放了個RadioButtonList,將它的SelectIndex屬性值綁定到數據庫的表TB_1中的Ispublic列(為bit類型),為什么提交的時候總出現這個異常呢,我把bit改為char也不行 解决方案 解决方案二:代码贴出来看看