如何防止rogue server破坏数据中心

管理员需要防止未经授权的变更对虚拟化环境带来负面影响,及时找到rogue server并决定是否将其从现有环境中移除,避免其对当前环境造成破坏。

理想情况下,应用和服务器能够一直不间断正常运行,不会出现资源和冲突等问题,数据中心的所有一切保持着十分和谐的关系。不幸的是,我们并非生活在这样的理想环境当中。虽然针对虚拟化环境编写文档和制定控制流程能够起到帮助作用,但是尽了所有努力之后,我们依然可能遇到rogue server问题,并且这种问题会产生严重影响。而这种问题通常是管理员工作计划过于紧张的结果。如果没有事先制定清晰的变更流程,那么后期可能需要更多的人参与到其中才能够完成原有目标。

尽管某些操作的最终目的是合理的,但是本质上其仍然属于对系统进行未经授权的变更。仅仅一个未经授权的变更也许不足以摧毁整个虚拟化基础架构,但是如果大量变更累加在一起,就有可能对系统造成严重破坏 。对于那些拥有关键系统控制权的管理员来说,得知变更是在超越其知识或者权限的情况下进行的是一件非常令人沮丧的事情,但是需要记住的是,这种变更从来都不是出于恶意的。作为虚拟化管理员,能够暂时后退一步,不将个人感受带到工作当中是非常重要的;也许听起来有些像心灵鸡汤,但是清醒的头脑对于整个流程来说是至关重要的。

深入研究日志

如果想要修复未经授权变更所带来的影响,那么第一步就是调查并且掌握究竟发生了些什么。问题的根源有可能是一些非常小的事情,比如添加或者调整资源;也有可能是非常大的事情,比如创建新的虚拟机或者彻底更改配置。研究日志的目标在于定位系统变更,之后找出变更的目标、时间以及涉及的人员。如果不进行恰当的调查,那么管理员肯定无法反向推理出整个变更过程。同时作为IT人员,你的首要任务之一就是保证系统正常运行,因此不管怎样也不能拔掉电源插头。

完全弄清楚究竟发生了哪些改变可能是一件非常困难的事情,但是计算机系统最擅长完成的任务之一就是记录日志。有时候改变是显而易见的,但是大多数情况下,管理员必须深入挖掘日志,来找出系统究竟发生了哪些改变以及是何时进行的。如果公司很好地遵守相关流程,不使用通用账户来登陆关键系统和基础架构,那么管理员还能够在日志当中找出是谁执行了这些变更。任何变更都会留下管理员能够追踪的痕迹。在审查日志的过程当中,需要特别注意变更发生的日期和时间,将其和当前查看的日志相互关联,能够提供很大帮助。

移除还是保留?

当管理员了解发生了哪些改变、何时发生以及变更执行人之后,就可以计划一系列操作来修复这个问题。而在这一步,不同管理员可能使用不用的处理方式,因此情况可能会变得复杂。管理员可以选择保留或是移除rogue server,但是无论哪种方案都有缺点。尽管看起来移除服务器非常容易,但是实际上并非如此。假设下面这种情况:你的一位上司告诉你移除服务器。你按照正常的操作流程进行验证,之后移除了服务器。但是两个星期之后,你接到电话说一些重要资料仍然保存在服务器上,而你的上司马上就要使用这些东西。当然,现在所有东西都被删除了,你和你的部门都将陷入困境当中。如果服务器创建时没有遵循正常流程,那么管理员很有可能并不清楚这台服务器的真正用途,因此在移除任何东西之前,都需要关闭服务器,之后将信息存储到单独的SATA磁盘当中。我建议管理员在最初收到命令和真正移除服务器之间等待几个星期,只是以防万一,将其作为一个简单的保险策略。

移除一台rogue server好像不是特别容易,但是将其保留下来需要面对更多的挑战。即便服务器使用基础模板进行创建,管理员也必须进行健康检查。服务器是否已经配置了恰当的安全策略、备份以及监控?以及恰当的资源管理、命令规则和地址规划?所有这些都需要一项一项进行验证。当然,如果系统已经上线,那么管理员可能会遇到更多挑战,但是这些步骤需要被尽快完成。其他关键组件还有申请/批准表格。对于rogue server来说,负责创建这台服务器的管理员很有可能没有完成这些文档工作。为了解决这个问题,你需要让管理员填写恰当的批准/申请表,即便出现问题的服务器已经被移除了。如果出现和rogue server相关的安全问题或者事故,文档能够提供审计线索,未来可能会派上用场。事后完成文档工作对于基础架构滥用者来说也能够起到警示作用,让其认识到不能随便绕过规定。毕竟,这些规则的存在是有原因的——能够避免未来解决问题时遇到的种种麻烦。

本文作者:Brian Kirsch

来源:51CTO

时间: 2024-10-13 20:10:05

如何防止rogue server破坏数据中心的相关文章

看噪音是如何破坏数据中心?

由于灭火器的故障,一家罗马利亚银行的支付服务和ATM自动取款机遭受破坏并持续了近10个小时. 在一种特殊而罕见的现象中,灭火器系统在测试中由于惰性气体的释放产生了噪音.这不仅破坏了该银行当地的主要数据中心,而且还毁掉了很多程序中的硬盘机,造成严重乃至不可恢复性的损坏. 上周,ING零售银行的高层Daniel Llano对消费者承认,这种"严重的技术问题"是由烟烙尽气体的溢出造成的.烟烙尽是一种灭火气体,它可以有效地灭火,但是丝毫不污染环境. 通常,这种灭火气体最适合用于数据中心--尤其

Windows Server 2008数据中心版激活心得

笔者最近在虚拟机中安装了 Datacenter Edition 数据中心版的 Windows Server 2008,激活 Windows 时遇到了一些麻烦.Datacenter 这个版本貌似与 Enterprise 或 Standard 存在一些差别. Windows 安装完毕后,笔者打开"激活 Windows"对话框,只看到了通过网络联机激活的选项,通过电话激活的选项"(S).显示其它激活方式"却凭空消失了.原来 Windows Server 2008 在安装过

数据中心选址需要明智的决策

不久以前,数据中心是平淡无奇的设施.他们的业绩和企业价值是企业高管的一个谜.这同样适用于描述这些设施的语言:例如,能耗,容量,以及性能比较等. 如今,这些抽象的经营理念已经不再默默无闻.他们已经进入企业利益相关者的战略.这种变化部分就是更好地发挥财政资金的作用,在数据中心生命周期投入大量的资金.自20世纪80年代以来,企业在延长这些数据中心设施使用期限已投资数十亿美元. 通常在技术的推动下,数据中心已经转移了CFO和CIO的关注点.在多部门规划过程中,数据中心的长期运营要从财务,运营以及企业社会

论数据中心业务连续性的重要性

随着社会发展和科技进步, 数据中心面临的风险和威胁越来越大,一旦数据中心因为突发灾难造成关键业务数据丢失或信息系统故障,将严重影响企业业务的正常运营,甚至威胁到国家安全 .而包含有大量电子设备的数据中心各系统在运行过程中不可避免地都会发生因故障而失效的时候.硬件故障.软件错误.人工操作失误甚至对系统的恶意破坏,这些都可能导致系统运行的非正常中断,影响系统中数据的正确性或破坏系统的数据库,使部分甚至全部数据丢失.所以如何保证数据中心的业务连续运营是数据中心管理者们首先要考虑的重要问题. 数据中心保

数据中心安全防御大法大放送

数据中心是在不断变化的,尤其现在应用需求多种多样,数据中心需要不断地去变化,才能适应这些应用,和传统的数据中心不同,现在数据中心里应用最普及的就是虚拟化技术,数据中心虚拟化后,安全问题就已突显出来.原来数据中心每个物理环境相对独立,安全产品保护服务器和应用,安全防御还可控,但虚拟化来了后,所有虚拟机都共享资源,虚拟机和应用程序随时可能移动或变更,这给安全防御带来极大困难,很多人对数据中心的安全能力表示怀疑,尤其相比以往,数据中心类似发生数据泄漏的事件明显要更多,如何挽回人们的信任将关系到数据中心

华为数据中心网络产品获微软认证

[天极网服务器频道12月13日消息]近日,华为携最新获得微软Windows Server认证的CloudEngine系列数据中心交换机亮相微软TechEd 2013中国技术大会,并在会上与微软共同面向与会嘉宾和媒体展示了双方在数据中心领域的最新合作成果.CloudEngine全系列数据中心交换机成功通过微软Windows Server 2012 R2认证,网络操作系统OPS也实现了与微软OMI的顺利对接,标志着华为与微软在数据中心领域已展开全面合作,双方将共同面向全球客户提供具备强大自动化和可编

物联网将让数据中心更为复杂,但更加有趣

行业媒体ExpressComputer记者RashiVarshney采访了力登公司亚太地区总监SanjayMotwani,并提出了一些问题,例如,物联网将对数据中心有什么样的影响?以及CIO们将会在未来的五年中采取什么样的策略和措施? 物联网(IOT)就是我们自己通过互联网相互连接各种设备,这个概念已经有了长足的进步,这里援引Gartner公司的话来说,就是"转换更有前途的数据中心市场."如果这种转变发生,数据中心将面临海量的数据,将需要进行合成,分析和存储.作为数据中心运营商,人们可

数据中心安全防御大法

数据中心是在不断变化的,尤其现在应用需求多种多样,数据中心需要不断地去变化,才能适应这些应用,和传统的数据中心不同,现在数据中心里应用最普及的就是虚拟化技术,数据中心虚拟化后,安全问题就已突显出来.原来数据中心每个物理环境相对独立,安全产品保护服务器和应用,安全防御还可控,但虚拟化来了后,所有虚拟机都共享资源,虚拟机和应用程序随时可能移动或变更,这给安全防御带来极大困难,很多人对数据中心的安全能力表示怀疑,尤其相比以往,数据中心类似发生数据泄漏的事件明显要更多,如何挽回人们的信任将关系到数据中心

2013您的数据中心能否幸免于大地震?

通过一个标准的联邦紧急事务管理署的报告显示,美国38个州均有中度地震危险性,60%的美国人口居住在地震风险为中度到高度的地区.当涉及到在多地震的国家建立数据中心,我们必须时刻提醒自己两件事情: (1)该数据中心选址是否会受到地震影响 (2)地震可能明天就会发生 图1:美国地震风险地图 地震会在不发出任何警告的情况下使得数据中心运行失效,破坏数据中心的建筑及其里面的设备,甚至摧毁数据中心的整个线路.地震最可能的带来的数据中心运行失败是缘于地震破坏了数据中心安装的设备和建筑元素,如地板和天花板. 设