2016年十大云故障半年盘点:业务中断影响越来越广

随着企业将越来越多的关键工作负载迁移到生产云环境之中,供应商服务仅仅几分钟的宕机都可能会极大地影响企业的利润,损害企业与客户的关系,并导致IT管理员处境艰难。

但是,虽然全球经济越来越多地依赖于云服务供应商,特别是那些超大规模的供应商,保障服务正常运行时间以及维护服务的能力,服务中断仍然很常见。

导致故障的原因从停电到错误软件更新,从服务器过载到数据库错误,不一而足。更多的时候,我们永远不会知道服务故障的真正性质和影响范围。

下面是2016年上半年占据了新闻头条的一些云服务故障事件。

Verizon,1月14日

1月14日,Verizon数据中心的一次停电影响了JetBlue Airways的运营,造成了很多航班的延迟,让大量的乘客争先恐后地重新预订机票。

Verizon并没有说是哪一个数据中心遭遇了停电。

总部位于纽约的JetBlue在一篇博客文章中写道,由于Verizon的一个数据中心的停电,JetBlue遭遇了网络问题,影响到了包括jetblue.com、移动应用程序、免费电话、登机及机场柜台/门系统在内的客户支持系统。

Twitter,1月19日

1月19日上午,社交信息巨头Twitter在上载了一些错误代码之后,出现了全球性的问题。

内部软件更新导致网络和移动应用程序出现故障,故障持续了非常长的时间,最初报告的消息是在太平洋时间上午2点之前,而大约八个小时之后,Twitter确认系统才进行了备份,并且开始运行。

对于很多Twitter用户来说,这八个小时简直长如永恒。

Microsoft Office 365,1月18日

一些Office 365用户从1月18日开始,不得不和自己基于云的电子邮件账户分离了好几天。

微软将故障归咎于一次错误的软件更新,但是其初次修复的尝试并没有解决问题,在最初的故障出现五天之后,第二次电子邮件故障又爆发了,这一次激怒了很多用户。

云生产力套件的电子邮件服务故障在某些情况下持续的时间超过了一周。微软承认,尽管不是所有的Office 365用户都遇到了服务中断的问题,但是这个问题还是影响了一大批用户。

微软最终报告称其工程师确定了几个处理电子邮件路由和过滤的基础架构组件由于资源使用过度出现了退化,这份声明在该故障首次出现一个多星期之后才姗姗来迟。

Microsoft Office 365,2月22日

微软在欧洲的一些客户在2月22日遇到了用手机无法访问电子邮件的问题,或者在尝试通过网络门户登录Office 365服务的时候出现了延迟的问题,在几个小时的时间里,该问题间歇性地影响了用户使用。

微软将这个问题归咎于对云资源的需求过大。与之类似,Office 365在去年12月的宕机影响了欧洲用户使用电子邮件和其他服务,但是那一次故障的影响面更广。

Salesforce,3月3日

Salesforce一些欧洲客户不得不应对CRM服务中断10小时的问题,这次故障是由于该大陆上一个实例中出现了一个存储问题。

即使重新连接上了存储层,仍然有一些功能无法正常运行,Salesforce继续报告其EU2实例的性能也出现了下降。

Symantec Cloud,4月11日

Symantec的一个门户让客户能够管理他们基于云的安全服务,该服务从东部时间4月11日上午6点开始中断了大约24小时。

在工程师们忙于恢复并配置让Symantec.cloud重新联网所必需的数据库的一整天时间里,这家安全厂商的状态页面上如雨后春笋一般冒出了很多对用户的道歉。

服务中断让Symantec的客户无法管理一些电子邮件和网络安全服务,但是Symantec坚持表示那些保护层仍然在发挥作用,保障自身决不受到损害。

Google Cloud Platform,4月11日

Google Cloud Platform在4月11日傍晚出现了大约18分钟的中断,影响了其所有地区的Compute Engine实例和VPN服务。

谷歌为受到影响的客户补偿了10%的Google Compute Engine月服务费,以及25%的VPN月服务费。

Salesforce,5月10日

5月10日,Salesforce.com的一个故障持续了四个小时,影响了数据客户进入他们的CRM,Salesforce花了几天的时间才完成补救工作。

虽然首席执行官Marc Benioff在Twitter上亲自对一位用户道歉,Salesforce还是拒绝透露这次故障波及的范围有多广,或者哪些区域或服务受到了此次和NA14——Salesforce在北美地区45个云实例之一——有关的数据库故障的影响。

Salesforce的系统状态网页表示性能下降是从东部时间上午8:41分开始的,在不到一个小时之后,也就是上午9:31分出现了“服务中断。”

苹果公司,6月2日

苹果公司的云在6月2日出现了一次大面积的服务中断,让苹果的一些最受欢迎的零售和备份服务出现了中断。

这次故障大约是从太平洋时间下午12:30分开始的,客户无法访问多个iCloud和App Store服务。

App Store、Apple TV App Store以及Mac App Store、iTunes以及苹果基于云的相片服务都出现了中断。

Amazon Web Services,6月4日

6月4日,一场风暴袭击了澳大利亚悉尼,这个区域内的Amazon Web Services失去了能源供应,为一些名牌企业托管在EC2实例和EBS卷上的关键工作负载随即中断。

在那个周末,澳大利亚地区AWS的网站和在线服务中断了大约10个小时,破坏了从银行服务到披萨饼外送的所有事情。

受到影响的企业客户在世界最大的云供应商努力恢复服务的时候指责之声四起。

Pokémon Go,7月

好吧,这并不是企业关注的事,甚至也不是出现在上半年,但是考虑到谷歌在Niantic推出的这款游戏引发的狂热,在此提一提也是很有意思的。

自从Pokémon Go在7月6日推出之后,多次的服务中断已经影响到了玩家,有些时候他们在狩猎怪物的时候会失去连接。

空前的访问量以及黑客们发起的分布式拒绝服务攻击推迟了该游戏在欧洲的上市,开发人员正在努力处理“被淹没的”服务器。

原文发布时间为:2016年8月1日 

本文作者:作者:赵东

本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。

时间: 2024-09-20 08:33:32

2016年十大云故障半年盘点:业务中断影响越来越广的相关文章

2016年十大DevOps开发工具

DevOps不仅仅是开发与运营方法的融合与变革,更是一场企业文化革命.如今越来越多的企业从DevOps中获益,例如更加稳定的运营环境,更快的产品交付和问题解决周期.持续交付.持续集成,DevOps能在整个生命周期内提升企业产品,更快地满足客户需求,是企业未来打造核心竞争力的关键. 虽然DevOps目前还处于发展的早期阶段,但是对企业文化和业务影响已经开始显现,对于刚刚开展DevOps的企业来说,选择正确的开发工具至关重要,以下IT经理网整理了Stackshare推荐的2016年十大DevOps开

在医疗云颇有建树的十大云供应商

本文讲的是在医疗云颇有建树的十大云供应商[IT168 评论]随着医疗行业IT基础设施的快速发展,企业正在采用大数据分析等措施来分析来自移动和物联网(IoT)设备收集的存储信息.由于要管理更多的数据任务,他们正努力扩展传统的内部部署解决方案,以满足结构化和非结构化临床数据的需求.应用于医疗行业的云存储解决方案使企业能够扩展其IT基础架构,以满足先进的分析和连接医疗设备的需求,从而降低整体成本并节省物理服务器所需的空间. ▲ 根据MarketsandMarkets和Reportbuyer的市场报告显

简析十大云部署最佳实践

根据IT业贸易协会CompTIA的报告显示,如今,有80%的企业都声称在使用某种形式的云解决方案,这些方案既有可以按需启用的虚拟机,也有很容易购买.很容易使用的应用." 趋势科技客户解决方案部经理Laura Maio认为,目前有三大重要趋势在推动着云的使用和部署. 第一趋势是企业将公有云作为其内部环境的一种自然延伸. 第二趋势则是企业的非IT业务部门利用公有云可以更快捷地访问服务器和存储资源. 第三,企业的IT部门本身也有压力,需要构建安全的.功能类似公有云的私有云环境,以便从公有云提供商那里重

2016年度十大新兴技术出炉,你最看好哪个?

世界经济论坛27日上午在天津夏季达沃斯年会上发布2016年度十大新兴技术.这份榜单由论坛的新兴技术跨界理事会编译,与<科学美国人>杂志合作出版,理事会在遴选榜单时非常看重的一个标准是:某项技术的发展是否以2016年为重要转折点.因此,榜单上可以看到一些已经知名多年,但现在才达到成熟水平,并产生重要影响的技术. 入选技术集中在可以改善人们生活.推动行业变革和维护地球生态等领域.在各项技术被广泛使用之前,论坛也提供了一个辩论平台,讨论技术可能会为人类.社会.经济和环境方面带来的风险和担忧. 韩国前

2016年十大安全故事

每年网络安全在企业和消费者决策中发挥都在发挥着越来越重要的作用.2016年,围绕着选举.加密技术私有与公有的争论.重大攻击事件,这些让安全问题变成一个比以往更受关注的焦点.对于合作伙伴来说,日益突出的安全问题以及人们对这个问题逐渐增加的意识,意味着明年他们扩大安全实践的机会也越来越大了.但是,整个安全行业也在发展中,新的市场正在出现,风险投资的模式也在转变中.在这些机会与变化中,让我们一起来回顾2016年十大安全故事. 10.投资初创公司的趋势变化 虽然2015年围绕着安全初创公司获得资金的消息

2011十大云应用推荐

2011年给软件行业带来了影响巨大,苹果iOS和Android平台井喷式的发展速度让传统软件业的新模式正式从概念变成应用.在今年,中国各大软件厂商纷纷发布云战略,IT厂商纷纷角力云端,一场由"云"引发的风暴正汹涌袭来. 云计算概念推出后不仅助力企业发展,更重要是是为了在"云"端占领一席之地,并且在市场圈到更多的用户,很多大企业在个人云应用市场看到了发光的金矿.因此,把云计算概念用诸个人用户身上自然也就成了众多IT企业的目标. 苹果.联想以及华为等智能手机终端厂商已经

2016国内十大人工智能演讲盘点,你的男神上榜了吗?

雷锋网 AI 科技评论刚刚出炉了 2016 十大 AI 演讲盘点,不少热心读者感到疑惑:为什么这里面列举的都是国外大牛,怎么不见咱们国内的知名学者们的演讲整理?这不,雷锋网已经整理出了国内过去一年来的精彩演讲,一同随 AI 科技评论看看,哪位大神的高见让你受益匪浅?本文排名不分先后,欢迎各位读者在评论区畅所欲言,说说你们心中的最佳 AI 演讲吧. 高文:回顾过去,展望未来 北京大学信息科学技术学院教授.中国工程院院士.ACM/IEEE Fellow.CCF - GAIR · 全球人工智能与机器人

2016年十大最酷闪存存储和SSD产品盘点

闪存存储:不再只专注性能 即便存储总开支持续缩减,但企业仍愿意往闪存存储技术上不断砸钱.近期IDC报道称,2016年第一季度,企业存储系统总销售额达82亿美元,比去年下降7%,与此同时,全球外部存储系统总销售额年同比降低3.6%达到54亿美元.而2016年第一季度相比去年,全闪存存储阵列销售额则逆势增长87.4%. 虽然全闪存存储解决方案的销售额通过降低成本和提高闪存存储技术的性能得以增加,但2016年你将会看到供应商转而推出新功能,超越纯粹的性能,其中包括软件定义解决方案,多系统内更好地共享闪

开源还是商用?十大云运维监控工具横评

随着云计算和互联网的高速发展,大量应用需要横跨不同网络终端,并广泛接入第三方服务(如支付.登录.导航等),IT系统架构越来越复杂.快速迭代的产品需求和良好的用户体验,需要IT运维管理者时刻保障核心业务稳定可用,而企业运维中的痛点和难点也急需解决. 1.面向业务的运维,不但关心单点IT资源的运行状态,更关心整个业务系统的健康状态 2.如果企业使用了大量的API和模块化应用,那么关注每个接口的性能变化情况和指标 3.对于运维主管及企业管理层来说,特别需要上墙的监控大屏 4.运维需要每周.每月查看报告