云宕机战略:构建冗余

云服务并不完美。甚至像亚马逊Web服务这样的领导者都经历了各种宕机事件。好消息在于使用云计算,你同样可以以某种途径保护自己的服务远离云服务提供商宕机的影响,这种方法可能不适用于传统的服务器托管。要记住在你的云计算宕机战略中最重要的就是冗余。

除了传统备份之外,对云宕机最有利的防卫就是计划冗余。想法非常简单:如果一个服务器宕掉,其他服务器来接管,终端用户甚至都不会注意到这个问题。

实现冗余的技术有很多。选择之一就是把你的服务器放到朵个数据中心中。亚马逊Web服务(AWS)为例,让你来选择可以把服务器托管在哪里。在这个案例中,可以把一个服务器放到弗吉尼亚的数据中心,将冗余服务器放在俄勒冈的数据中心。如果你的服务提供商不提供多种数据中心,你应该在其他厂商中分布冗余,一些服务器放在AWS上运行,一些放在Rackspace上。

下一步,准备一个管理系统和合适的基础架构,以便冗余能够真正的在宕机事件中运作。

像VMware的vCloud Director、Microsoft的System Center以及BMC的Cloud Lifecycle Management都可以持续监控服务器。如果一个服务器宕机了,可以将其从活跃服务器集中取出,直到你找到备份。为了实现这项工作,你需要配置你的域名系统(DNS)服务器,以便当一个客户端,比如一个浏览器,为一个URL寻IP,其地址能够返回到寻址的那一个服务器。这样就能够将客户同活跃服务器;连接,跳过宕机服务器。

大型企业很可能已经使用DNS配置,但是更小的公司并没有使用复杂管理软件,但仍有办法实现容易。让第二服务器准备运作,但是关掉。一些云厂商对于关掉的服务器不收费。在宕机事件中,启动冗余服务器,直接到你的DNS管理器,并转换IP地址指向新的服务器。效果可能不是立刻的,但是通过现在的DNS服务器,应该可以快速工作。DNS管理器可以在变更发生前24小发出警报,但是在实际中,通常是15分钟。要指出的是:如果你维护的传统服务器断电了,你要确保用最新版本软件定期升级。

提前采取正确的措施和计划协助企业能够更好的应对云宕机。如果宕机发生了,终端用户只会经历短时间宕机或者根本就不会体验到。

(责任编辑:施柏鹏)

时间: 2024-09-20 08:07:12

云宕机战略:构建冗余的相关文章

云中漫步需安全 BMC推预防云宕机新功能

BMC软件公司(NASDAQ: BMC)日前宣布在其云生命周期管理全面解决方案中新增功能,以确保云计算的服务质量;并在简化云管理的同时防范诸如云宕机.云性能和容量问题带来的风险. 最近一系列因为云宕机导致巨大损失的事件,致使许多公司开始关注云管理解决方案如何能够防范潜在事故和宕机;而业内分析师也列出一些成功运维云计算服务的必要条件. Gartner咨询公司研究副总裁Cameron Haight表示:"只有通过专门针对云计算的运维而设计的与时俱进的管理流程和解决方案,才能有效地发挥云计算实现成本优

冗余——云宕机重要战略

云服务虽然受到各个企业广泛运用及创新,但云服务并不完美.就连亚马逊Web服务这样的领导者也都经历了各种宕机事件.好消息在于使用云计算,你同样可以以某种途径保护自己的服务远离云服务提供商宕机的影响,虽然这种方法可能对于传统的服务器托管并不适用.不过,有一点你要记住,冗余--你的云计算宕机最重要战略. 除了传统备份以外,对云宕机最有利的防卫就是计划冗余.想法非常简单:如果一个服务器宕掉时,连忙用其他服务器来接管,这样终端用户甚至都不会注意到这个问题. 实现冗余的技术有很多.选择之一就是把你的服务器放

阿里云如何进行云服务器宕机排查

云服务器宕机排查 启动机器,看能否登陆.如果能登陆,请检查以下可能的原因: 应用程序导致内存溢出或泄露 进程过多或者不断创建,资源耗尽 数据库程序死锁,连接数过多 应用程序异常 流量负载过大 遭受黑客入侵攻击 误操作 如果无法查看故障现场,可以查询系统日志查看是否有异常记录.

云服务频频发生宕机 谁的利益最受影响?

云服务是基于互联网的相关服务的增加.使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源.它最大的特点,是通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行将与互联网更相似.这使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统. 2012年云服务开始正式内测,时至今日已经成为与企业和用户息息相关的技术.目前,亚马逊AWS.微软Azure.阿里云.腾讯云等是市场主流的云计算服务商,提供包括弹性计算.数据库.域名.CDN.存储等支

避免在云迁移过程中宕机

在公共云迁移期间,IT团队需要采取谨慎的步骤,以避免听到"系统宕机"这种可怕的提示. 随着组织迁移到基于云计算的基础设施,IT团队需要在迁移过程中保持可用性.但是,考虑到所有复杂性,在云计算迁移过程中,防止宕机或最小化停机时间并不容易.云计算团队需要考虑数据不一致,监控不同的软件版本,并检查其网络连接是否成功. 如果企业的应用程序崩溃,业务往往会停止.虽然精确的指标因企业和应用的情况而异,但调研机构Gartner公司在2014年发现,网络停机时间平均每分钟的损失为5,600美元.停机时

云服务宕机后果严重 用户如何防范于未然

前段时间出现的不管是云服务宕机还是数据中心遭受自然灾害,都说明即使再靠谱的运行商也有飞来横祸的一天,所以为了我们的数据安全,不要在选择一个运营商后就觉得高枕无忧了,还要做好以下三件事,才不至于在意外来临时措手不及.   数据备份 传统数据备份还将继续存续下去.在某些环境下,它还可以很好地发挥作用,现在还没有理由和/或预算去替换它. 云存储.云备份等产品及服务的确为众多企业,尤其是中小企业带来了便利,但云存储同时又是一把双刃剑,在发生问题时给企业带来等影响和损失也是非常巨大的.因此,如果你在云端存

微软亚马逊云服务因雷电袭击遭遇大规模宕机

北京时间8月9日晚间消息,据美国科技资讯网站Techflash报道,上周日爱尔兰遭遇雷电袭击,首都都柏林的一个大型数据中心http://www.aliyun.com/zixun/aggregation/6229.html">电力供应临时中断,导致微软和亚马逊在欧洲的云计算网络出现大规模宕机. 宕机事件使得采用亚马逊EC2云服务平台和微软企业办公在线套件(BPOS)的多家网站长时间关闭.BPOS服务在数小时后便恢复了正常,但EC2云服务平台用户目前仍在等待亚马逊恢复这项服务.据Techfla

阿里云服务器经常CPU跑满,服务器宕机彻底解决方法

阿里云服务器经常CPU跑满,服务器宕机彻底解决方法 要解决这个问题首先先要知道问题出在哪里下面给大家介绍一下CPU跑满的一个案例 解决方法在文章最下方 CPU跑满的问题出现过很多次,最多的时候一天跑满四五次,整个网站在这样的环境下运营如何使得,发工单处理过几次,都是让重启服务器好的.改过端口.安装了防护软件检查,现在都没有任何的问题,5M带宽平均用不到2M,最大时也不过3M.之前服务器被黑过进行了快照回滚之后好了,但后来接二连三出现相同的问题,检查了服务器和网站程序,挂马已经都被清除,网站检查出

谷歌App Engine宕机 云存储支持不力

北京时间7月15日消息,据外媒报道,谷歌应用引擎Java服务出现故障问题,宕机超过1小时. &http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 谷歌App Engine故障 从图片数据显示可看出,谷歌App Engine(应用引擎)服务在7月15日出现几次不同的故障. App Engine服务不可用问题基于云计算,支持Python或Java语言写成的在线应用.稍后,谷歌自己开发的Go编程语言也融汇到该引擎内,将三种编