从水源到数据源,安全保障至关重要
大数据像水、电、气一样,已经成为我们工作和生活的基本物质,关系到经济运行、社会发展、个人隐私等方方面面内容。数据的国内年复合增长率84%,数据的爆炸带动各行业的数据中心机房数量的与日俱增,从企业的数据机房,到互联网企业的大型数据中心(IDC),都无时无刻不在存储和管理着大量的数据资源,这些数据能够帮助个人、企业和社会更好地发展。如何保证数据中心的安全性和可靠性?这个问题已经引起全社会的广泛关注。
基础设施管理是数据中心安全运行的基础
数据中心配套的基础设施包括动力环境(市电、油机、配电、机房机柜环境等)、安全防卫(视频监控、门禁、考勤、巡更、防盗报警等)、楼宇自控(冷源群控、空调、照明、通风等)、消防(火灾监测、广播系统)、园区管理(周界报警、车辆出入)等众多系统,其直接影响数据中心的正常运行。一旦数据中心设备出现故障,就会影响计算机系统运行,若不能及时处理就可能造成严重后果。因此,目前许多数据中心机房的管理不得不采用24小时专人值班来定时巡查机房场地设备的方法,这样不仅加重了管理人员的负担,而且往往不能及时排除故障。再加上目前国内普遍缺乏数据中心机房场地设备的专业管理人员,对数据中心基础设施进行综合监控管理的重要性就更加凸显出来。
数据中心综合管理存在诸多挑战
子系统众多,运维管理工作量巨大:基础设施设备类型复杂,机房运维管理涉及的专业子系统众多,运维人员需要在各个子系统的界面上分别进行管控操作,不仅操作不方便而且各个子系统之间孤立运行无法进行关联,造成运维人员工作负担重,且加大了运维成本。
故障人为因素占比高,对安全防卫要求越来越高:目前机房故障中人为因素仍然占比较高,需要对数据中心园区和机房的IT人员/租户人员/访客的出入及日常工作进行管控,比如车辆出入管理/视频监控/周界及机房的防盗报警,同时对于监控的死角还需要工作人员巡更进行补充。
节能减排,降低运营费用:数据中心耗能巨大,大大推高了运营费用。同时,国家和社会关注节能减排,数据中心能耗成为焦点。如何节能减排降低运营费用,是当前数据中心管理特别重要的环节。
告警缺乏警前预警:系统告警提示多是告警发生后才通知到运维人员,运维人员只能做警后处理,缺乏警前预警。若是能在故障发生之前就提前给出预警,人员及时介入处理就能够避免很多事故的发生,所以系统的风险预警及评估机制就显得尤为重要。
资产管理困难,人工管理效率低:数据中心的基础设施设备、IT设备及服务器等资产管理困难,资产数量多且迁移频繁,人工管理费时费力,不准确。如何能快速准确对众多资产进行管理和盘点,确保资产进出和迁移不出错,并能指导运维人员对新入资产放置位置给出建议,是当前数据中心资产管理的关注重点。
业务需求增加,需要能够快速扩容升级:数据中心建设一般分期进行,随着业务需求的迅速增加,对应的基础设施建设支撑需要更具有弹性。一方面要求系统能够对后期智能化子系统和设备进行接入管理,另一方面系统应能方便的实现扩容与升级,不影响管理业务的正常运行,
展现软硬件实力,吸引租户:在对外出租的数据中心机房中,基础设施能力影响租户对数据中心的选择,如何更好地展现基础设施软硬件实力吸引客户,是数据中心建设和运维过程中需要考虑的问题。
作者:何妍
来源:51CTO