对于正在进行数据中心资本项目的企业IT组织而言,其风险无可置疑地会很高。而构建新的数据中心是一项巨大的投资,但也可能实现或阻碍组织的IT战略和能力,从而影响组织的业务绩效。
随着更多的组织依赖托管数据中心提供商提供的服务,可以确保这些项目的设计和构建满足其至关重要的业务需求。
数据中心的供应商和分包商参与任何数据中心项目通常超过50个不同学科-,其中包括:结构,电气,HVAC,管道,燃料泵,网络等等。
施工监督,规划和预算的缺失意味着费用昂贵的新数据中心设施将无法满足业主的要求,其最终结果是数据中心性能不佳或灵活性有限。
而在此过程中解决问题可能会拖延项目,通常需要大量费用支出。在一些情况下,这些问题将妨碍数据中心寿命的操作,并且可能最终导致需要过早地更换设备。
即使该数据中心设施在其预期寿命内继续运行,其运行成本也可能超过预期,遭受更多的停机事件,并且使业主不得不引入新产品和服务。
由于企业在IT基础设施项目上投入了大量资金,并且考虑到数据中心行业的成熟度,有可能会认为其资本项目发生错误是罕见的。那么你错了。
数据中心项目不断失败
诸如评估数据中心资本项目的Uptime Institute等组织,需要在整个数据中心设计,构建和营业额到达运营目标进行评估,以确保企业数据中心的业务需求和目标。
通常,技术人员在称为调试的阶段(大多数IT资本项目失败的核心)之后立即进入新的数据中心站点。
非技术项目业主可能认为调试是一个奥秘,是一个过度设计的过程,他们可以减少或缩短,以满足其他业务压力。但他们这样做是危险的,因为委托调试是确定项目成功的最重要的阶段。
调试:
验证设备和系统是否按照记录工程师的设计进行操作
提供数据中心设施在其整个生命周期内应如何履行的基准
为数据中心操作提供最好的机会,以熟悉系统的操作,测试和验证操作程序,而不会危及关键IT负载运行。
该数据中心应该准备好在调试后上线运营。
然而,200个没有通过Tier认证的数据中心,其出具的退出报告都揭示了在Tier认证过程中发现的数据中心基础设施的一些设计缺陷,设备故障或意外问题。事实上,超过70%的项目在第一轮示范期间未通过Tier认证评估,要求数据中心所有者投入更多时间和资源来解决这些问题。
例如,2016年美国的一个数据中心资本项目在Tier认证期间,其备用电力系统在模拟电力中断期间失败。而电源是一个预期的设计条件,可以说对于新的数据中心是最初始的功能。发生故障的根本原因是备用电力系统的设计缺陷,但是数据中的所有者并没有接受培训,没有具备适当的知识,并且没有被告知其故障存在,从而没有达到数据中心按期运营目的。
在2016年,欧洲一个数据中心项目的Tier认证期间,Uptime Institute发现数据中心对工作人员的生命安全构成威胁。在电源系统的维修工作中,发现竟然有人将螺丝刀放在400伏的连接上,这导致了其他故障,这归因于不正确的保险丝额定值和建筑物监控和自动化系统中的错误。这三个问题中的任何一个都将导致新的数据中心正常运营的业务中断。
Uptime Institute的层级标准高级副总裁查理斯?布朗解释道:“许多数据中心所有者依靠Tier认证作为调试活动。而其所有者在我们到达之前进行最小测试,并期望委托Uptime Institute测试这个数据中心,但却并不急于通过Tier认证。”
重要的是要注意,Uptime Institute的评估是资本项目的最后一步,紧接在新数据中心投入使用之前。所有资本项目利益相关者在评估开始之前就已经签署了数据中心运营合同。那么,为什么在调试阶段没有发现这些问题?
缩水的调试状态
调试活动为数据中心所有者提供了一个独特的机会,以严格测试关键基础设施的功能。但是,这个过程常常被缩短。
Uptime Institute顾问将责任委托给业主和项目管理团队,而不是调试代理。Uptime Institute高级顾问罗亚?欧尔说:“数据中心所有者对他们的调试代理提出了一个要求,以保持成本和维护时间。”
调试活动为数据中心所有者提供了一个独特的机会,以严格测试关键基础设施的功能。但是,这个过程常常被缩短。
不管是数据中心运营,托管商还是批发商,都不希望新数据中心延迟开通运营,而这不是大多数公司的选择。因此,如果在交接日期之前没有完成调试,IT设备仍然会开始迁入。当IT设备开始进入所部署的地方,在许多情况下,这可能使调试活动难以正常完成。
“调试总是最后的事情,”欧尔说,“所以,如果有项目延迟,因为每个项目都有可能延迟,而数据中心调试始终是挤压点。或者如果项目超过预算,调试是资金挤压点。其调试时间也从两个星期的时间安排被挤压到三四天,而委托代理人必须尽其所能地做到最好。”
欧尔指出了当前调试状态的几个其他问题:
太多的组织对假设和代表性调试很满意。例如,数据中心所有者可以委托项目的第一阶段项目进行调试,但是由于共享系统,并且所有者不想将实时IT负载置于测试共享基础设施的风险中,因此在其后续阶段缩短了调试时间。
承包商和调试代理之间的不当关系将会持续。数据中心业主应直接聘请调试代理公司。然而,这似乎并没引起业主对利益冲突的严重关切。
许多业主认为他们不需要严格的委托调试,因为他们可以依赖基础设施冗余设施。然而有时候,冗余是事实,有时也是虚构的,业主将不知道这些情况,除非它被正确测试。
如何做调试权
精心策划和执行的调试计划将有助于验证该数据中心设施迄今的资本投资。它还将使运营团队处于一个更好的位置,以管理和操作关键基础设施,提高数据中心的使用寿命,并最终确保该数据设施发挥其全部潜力。
在数据中心调试的严格性方面经验不足的施工团队经常低估所需的时间,或将调试期视为一种缓冲,并在工作延迟时占用调试时间。由于上述两个原因,业主或业主代表应注意安排足够的时间进行调试,并确保承包商在施工期限内完成。建议在制定项目进度时,作为合作伙伴,在调试早期就让调试代理和总承包商参与。
此外,数据中心资本项目包括对在任务关键环境中缺乏经验的团队可能不熟悉的要求;这些要求通常有预算影响。
例如,业主和业主代表必须仔细检查施工投标事项,以确保其包括资金和时间:
关键设备的工厂见证测试
扩展供应商支持的4级和5级调试
负载组在临界环境中模拟全部IT负载
用于测试和验证发动机发电机系统的柴油燃料
由于经验丰富的团队了解数据中心特定调试的重要性,调试代理将能够在过程的早期更有效地工作,为过渡到操作设置阶段。
此外,数据中心运营应该是从项目开始到调试和移交的设计和施工团队的一部分。包括变更管理的操作让他们有机会共享和学习关于数据中心将如何运行的关键信息,包括设定点,设备轮换,变更管理,培训和备用库存等。
数据中心资本项目面临着一些复杂的挑战,多个利益相关者和承包商将汇聚多个学科知识。为了确保基础设施投资满足组织的业务需求,项目负责人需要选择合适的合作伙伴,授权合格的所有者代表,并留出足够的时间进行严格的调试和第三方认证。
本文转自d1net(转载)