灾备世界:深入其中才知水有多深

自云计算、大数据、物联网等技术的崛起,企业在从新技术中受益的同时,也面临着前不断出现的新问题,其中安全是最大的一个问题。每年我们都会听到几例云宕机、网站受的攻击、数据泄漏的事件。

安全问题是必然事件

2015年5月,对于企业来说真的是“一片黑色”,各大企业组团发生安全事件,从陌陌网络故障无正常运行、到因骨干网络异常,网易旗下游戏、有道云笔记无法运行,再到因光缆被断,导致支付宝大面积瘫痪、最后再到携程由于员工失误删除数据,导致官方网站及应用近12小时无法使用,直接损失超过7,400多万元。2016年,一月中旬清华大学网站遭IS黑客攻击,服务器全部停机;7月6日,国内最大公有云提供商阿里云华北2区网络故障导致业务中断一小时。

这些案例让我们清楚地意识到,安全问题的产生是一件必然事件——无论是大公司还是小企业都无法避免;安全事件的发生也让人防不胜防,且花样百出——有自然的、有人为的,有内部的,也有外部的原因。针对所有这些安全事件,企业可以做的就是建立自己的灾备系统,即使事故发生,我们仍然有备用方案,仍然可以维持业务的正常运行。

然而,我想说的是,“灾备不是想做,想做就能做;要你明白,要你研究,放手才能做”。只有全面了解,深入研究,才能感知灾备的真谛,才能做出更好的灾难防护。

灾备的思考

灾备一词,有许多人都错误地理解它为灾难备份的缩略词;事实上灾备的真正意义包含两层意思:灾难前的备份与灾难后恢复。人们往往只注意到了备份,而忽略了恢复的重要性,导致灾难发生后系统、数据无法恢复如初。近日, 专注于容灾及业务高可用领域的科技企业英方股份发布了《2016 年中国灾备技术和行业白皮书》。书中明确定义的了灾备的含义,指出灾备五大主流技术:

五大灾备技术

数据复制技术:该技术是容灾方案设计中最基本、最核心的技术,主要分为基于数据库/应用的复制、基于主机的数据复制、基于存储网络的数据复制、基于存储的数据复制。

切换技术:切换是指在早前支行系统故障或异常终止后,能够自动切换到冗余或备用信息系统的能力。根据具体突发故障的不同,切换可以分为网络切换和应用切换。另外,灾备的切换是一系列操作的组合,不是单一技术动作,并且由于“容灾黑盒”的存在,其切换的决策难度难度非常大,不能根据单一的个人意愿,需要集体进行决策。

重复数据删除技术:在灾备存储中已经大量应用了基于磁盘的重复数据删除技术。该技术通过寻找不同数据块中的冗余数据,并通过删除这些重复数据来对数据进行压缩,不仅节省一数据中心的空间,还减少了传输备份数据所需要的带宽。重复数据删除技术主要分为基于软件的重复数据删除和基于硬件的重复数据删除两种方式。

数据加密与传输技术:数据级灾备往往依托于多部门、多单位,甚至跨系统的统合协作,因此数据在传输过程或存储介质上的安全性问题也格外引人注意。目前针对数据的加密方式主要有两大类,即源端加密和传输加密。

数据存储技术:从定义来看,存储和灾备并不属于同一领域,但灾备技术是基于存储技术而发展的,数据备份的过程也必须涉及到数据的存储过程。目前,常见的存储方式包含:DAS直播附加存储、SAN存储区域网络、NAS网络附加存储、OBS对象存储等。

云灾备

除了上面提到五项技术外,随着技术的不断发展,灾备技术也在不断地创新。虚拟化技术、开源技术,和超融合等新型技术,也推动着灾备行业的向前发展,同时也出现了新的灾备模式——云灾备。

云灾备是一种全新的灾备服务模式,主要包括传统物理主机、虚拟主机等IT系统,向私有云或公有云等云端化灾备的趋势,以及新业务形态下,灾备端云化,云与云之间的灾备等。它不仅包含传统的数据存储和定时复制,还包括了数据实时传输、迁移和应用切换,从而保证灾备端应急接管理业务应用等等范畴。

根据云计算的不同模式,云灾备也有几个不同的业务模式:SaaS层灾备、PaaS层灾备、IaaS层灾备和DRaaS(灾难恢复即服务)。利用云灾备,企业可获得五大优势:减少基础设施、按需付费降低IT成本、高度机动性和灵活性、快速恢复和安全备份,以及大量的支持服务。

英方首创了灾备全生态理念:以往单一的灾备技术已经发展成一个集信息存储、 信息传输、数据安全等多个方面于一体的综合性 IT 技 术 ,同时 ,不同的灾备技术也必须依赖更高维度的生 态系统管理予以有效整合。从灾备管理的便捷性 ,降低运维成本的角度出发 , 能够提供基于统一灾备平台 ,实现对各类业务数据进 行实时或定时数据灾备、兼容各类操作系统、同时能 够满足本地灾备或异地及云灾备的全生态灾备技术将 大受欢迎。

灾备建设三步曲

英方股份CTO周华说,“灾备的架构比较开放,不是某一个厂商或某几个厂商能支撑起来的领域。这是需要大家一起来建设的一个生态系统,包括所有厂商,以及知识体系共享建设的一个生态。”

因此,在了解了灾备的含义、灾备所需要的技术,以及新型云灾备后,企业就应该着手进行灾备建设了。在英方看来,灾备的建设有三个步骤,即业务连续性规划、灾备规划、灾备方案设计和实施。只有做到专业性实施,且服务体系全面,才能得到用户的认同。

首先,灾备建设的最终目的就是要保护业务的连续性运行,其具体要求需要通过进行业务连续性规划来确定。没有业务连续性规划,灾备建设就没有意义,充其量只能做到数据不丢失,而不能恢复业务运行,所以保障业务连接性运行是灾备建设的重中之中。

其次,灾备规划采用的方法与业务连续性规划的方法基本一致,主要区别在于前者针对的是支持业务运行的IT应用和系统,后者主要关注的业务流程。通过灾备规划,确定所有支持业务运行的IT系统的各项恢复指标,并制定IT系统的恢复策略,以及IT系统的恢复计划。

最后,根据灾备规划对支持业务运行的IT系统提出的恢复要求和恢复策略,来设计灾难恢复技术方案,例如同城灾备,异地灾备、两地三中心、双活,云灾备等。灾备方案的实施是确保所设计的灾备方案真正有效的重要环节,需要制定详细的工作计划,包括场地选址、产品先型、服务商选择、资源保障、项目管理、验收评审、演练测试等等内容。同时,还应该根据灾备计划,确保各个部门在灾难发生时能够统一协调地行动。

结语:

有了技术、有了方法与步骤,相信《2016 年中国灾备技术和行业白皮书》 能在企业构建灾备过程给出一定的指导意义。另外,英方股份也给用户提供了现成的解决方案,例如,英方数据分发产品 i2Distributor在多家证券公司的第四代、第五代行情分发里成功上线运营;英方 i2Availibility 解决方案,帮助企业关键系统实现业务本地高可用及数据异地容灾。

未来,中国灾备市场也将趋势于成熟,趋于完善;我们也期待未来的因为有了灾备系统的支持,企业业务不会再现在面积瘫痪的问题。

====================================分割线================================

本文转自d1net(转载)

时间: 2024-10-01 08:49:16

灾备世界:深入其中才知水有多深的相关文章

支付宝灾备能力为何引发争议

5月27日下午5点,拥有将近3亿活跃用户的支付宝出现了大面积访问故障,全国多省市支付宝用户出现手机和电脑支付宝无法登陆.余额错误等问题.对于导致此次事件的原因,蚂蚁金服方面的解释并未获得金融和互联网界的广泛认同. 在蚂蚁金服发给<财经>的官方回应中称,出现这一问题的原因在于市政施工导致杭州市某地光缆被挖断,影响了支付宝一个主要机房的正常运转.当天晚上19时左右,即在事故发生大约两个多小时以后,支付宝服务才恢复正常. 蚂蚁金服称,无法精确统计在故障时间段内使用支付宝的具体用户数量. 拥有超过4万

数据中心四大灾备技术解析

灾备技术是指在一个数据中心发生故障或灾难的情况下,其他数据中心可以正常运行并对关键业务或全部业务实现接管,达到互为备份的效果,好的灾备技术可以实现用户的"故障无感知".灾备是一项综合系统工程,涉及到备份.复制.镜像等多种不同技术,系统建设复杂程度高.因此,一般只有在大型企业和金融行业应用较多.我国在2007年时颁布了首个关于灾备的国家标准<信息系统灾难恢复规范>(GB/T 20988-2007),是我们在灾备建设时重要的参考性文件.现在的数据中心承载的业务越来越重要,引入有

“灾备全生态”全揭秘

什么是"灾备全生态"?为什么上海英方软件股份有限公司(以下简称英方股份)会现在提出这个概念?3月1日,英方股份在上海举办的主题为"全生态,新展望"的新品发布会进行了解密. 英方股份CTO周华在发布会上从产品的角度解读了什么是"灾备全生态".同样是新年的第一场产品发布会,VMware公司在2月23日的发布会上一口气发布了8款新产品,涵盖云基础架构和终端计算,以满足企业数字化转型之需.英方股份则发布了12款新产品,针对用户的不同需求(数据.应用.系统

灾备理论:可靠的异地灾备

引言 内存子系统中最重要的优化部分并不涉及到实际的优化工作.在对您的系统进行优化之前,必须弄清楚主机系统的实际运行情况.要做到这一点,AIX? 管理员必须知道应该使用何种工具,以及如何对他或她将要捕获的数据进行分析.再次说明近期发表的一些其他优化文章(请参见 参考资料)中所介绍的内容,您在对系统进行正确地优化之前,必须首先监视主机,无论它是在逻辑分区 (LPAR) 运行还是在自己的物理服务器上运行.您可以使用许多命令来捕获和分析数据,所以您需要了解这些命令,以及其中的哪个命令最适合于将要进行的工

区块链如何变革数据库灾备系统?

    当黑客潜入目标服务器,计算机的日志系统会悄无声息地记录下其所有行为,然而有经验的黑客往往能精确发现并改掉这些日志,悄然离去不留下一丝蛛丝马迹.于是人们一直思考,是否存在一个完全无法篡改的日志系统?区块链技术的出现,让这一期待有了实现的可能性. 说到区块链,也许有的人还热衷于追涨比特币,有的人却已通过比特币的底层技术区块链在各个领域掀起巨浪,金融.支付.云计算.大数据.物联网,毫无例外.我们可以不主动了解区块链,但却阻止不了区块链进入自己生活的方方面面. 最近,国内区块链技术服务商众享比特

灾备故障上了红头文件,容灾技术到底哪家强?

昨天上午,中国银监会下发的关于"数据库文件损坏风险提示"的文件图片在朋友圈和大部分IT微信群里刷屏了.这是继2014年7月1日宁夏银行核心系统数据库出现故障,导致该行(含异地分支机构)存取款.转账支付.借记卡.网上银行.ATM和POS业务全部中断之后,又一家城市商业银行爆出的灾备故障,数据库容灾问题一时被推到了风口浪尖.事件回放  根据<中国银监会办公厅关于数据库文件损坏风险提示的通知>中描述:2015年5月8日,某城市商业银行核心系统使用的甲骨文数据库系统发生故障,数据库

万国数据发布日本灾备体系概述及启示白皮书

2014年3月13日,万国数据发布了<日本灾备体系概述及启示>白皮书,从日本政府灾备.企业灾备与社会灾备组织等方面对日本灾备体系进行了概述,并指出,中国IT灾备体系建设可以借鉴日本灾备体系在提高地方抗灾能力.完善政府应急管理机制等方面的优秀经验. 万国数据CEO黄伟表示:"作为国内灾备服务的领军者和高可用IT管理服务的倡导者,万国数据一直致力于加强灾备理论建设,为用户乃至全行业提供灾备建设指导.在立足于国内灾备市场研究的同时,万国数据在近几年扩展了国际化视野,并希望汲取国外灾备行业的

未雨绸缪 长城电脑灾备完善解决方案

  在信息化迅猛发展的今天,云计算.大数据给我们的工作和生活带来了前所未有的便利,但今年以来,阿里.网易.苹果等多家公司接二连三经历了宕机事故,再次让数据安全成为了业界关注的焦点.在灾难突发时如何保障国家信息安全,确保政府和企业核心业务7*24小时的连续性?这不仅仅是一份产业,更是一个企业的责任. 中国信息产业"国家队",世界500强之一中国电子信息产业集团有限公司(简称中国电子)旗下骨干企业,中国长城计算机深圳股份有限公司(简称长城电脑),始终以保障国家信息安全为己任,长期致力于信息

国内5款主流灾备一体机对比

和大多数IT系统类似,容灾备份也是一个较"重"的业务--前端的部署以及后续的维护,而数据备份厂商们也正在寻找一种整合的数据保护解决方案,所以有着快速部署.简单执行等特点的备份一体机便成为灾备企业销售的重要产品类型,而市场的不断增长也反映出用户对备份一体机的偏爱. 2013年中国备份一体机市场规模已经超过1.2亿美元.IDC最新公布的<中国备份一体机市场预测与分析,2014-2019>市场调查报告显示:2014年,中国备份一体机市场规模达到1.6亿美元的规模.根据IDC全球专