延长数据中心使用年限的低成本方法

当一家数据中心的运行达到其极限时,其所属的企业组织必然要作出一些重大的决定。花时间来为接下来可能会发生的任何状况进行规划,并考虑采取一些温和的、且成本便宜的升级和调整方案措施。

无需彻底大修的前提下改善数据中心

很少有企业组织会热衷于花费大量资金和时间来为他们的数据中心实施重大升级。一家企业组织需要认真考虑如何,甚至是否需要建立一处主要的数据中心的举措。但是,在此期间,企业内部的IT团队应该做些什么呢?重大决策的制定将需要时间,但基础设施仍然需要保持运行。毕竟,企业业务的运行依赖于此。

这将IT决策者们放在了一个需要延长旧的数据中心的使用年限,并同时需要对数据中心的其他更大的问题进行梳理的位置。

为此,数据中心专家罗伯特·麦克法兰专门撰写了本文,以便为我们广大读者朋友们介绍数据中心企业组织所能够采取的、同时又不会产生重大成本费用的相关措施。麦克法兰尤其建议企业组织的数据中心将他们的目标瞄准那些尚未被充分利用的资源:数据中心的那些服务器是否被用来充分发挥了作用了呢?而借助电力供应,IT人员应该查看电池的平衡状态。此外,在某些情况下,行内冷却机组所使用的战略可以缓解设施的冷却问题。

另外,在本文中,来自TechTarget网站的斯蒂芬·毕格罗也同样为我们分析了企业的IT团队可以用来提高数据中心的性能,而无需投入大量的时间和资金的一系列的方式。例如,为一台服务器的本地存储添加固态硬盘,可以清除瓶颈并中止错误。而与此同时,可以以很小的成本安装传感器,而无需耗费太多的精力。

这些举措并不会解决当一家数据中心在接近其效用的最后终点时,应该如何处理的更大的问题,但这些举措确实能够为企业组织规划其未来的IT基础设施赢得更多的时间。

对一处老旧的数据中心实施简单的修复和升级

当您企业的数据中心耗尽了其空间,电力或冷却资源时,您将需要做出一些困难的决定。而如果您企业的业务在未来几年内可能会被迁移;或者关于您企业的某些计算最终将会转移到云服务或托管站点的讨论的话,那么,关于这些决定的商议就变得更具挑战性了。这些决定是至关重要的,其绝不属于那种您想要靠拍脑袋就匆忙做出的决定。毕竟,一家企业组织所做出的选择,可能涉及到极其昂贵的资本支出和运营效率。

但是,尽管这些长期性的决定正在被思索和衡量,但企业内部的IT团队仍然承担着短期的负担:他们需要保证数据中心的正常运行,而且还必须可靠地支持用户。

那么,哪些措施才是现实可行的呢?哪些措施才能让企业组织的数据中心以最小的投资实现获益的最大化呢?而同样重要的是,哪些措施会是最不具破坏性的呢?总之,您企业组织的数据中心如何才能找到最经济、最有效的短期内的方法呢?

在本文中,我们将为广大读者朋友们介绍一套较为合理的策略,来帮助您首先对您数据中心进行梳理,然后逐步修复,最后再分阶段实行的相关步骤。

1、移除不应该存在的设备

如果一家数据中心的运行已经达到其容量能力的极限了,那么,其IT工作人员可能会关闭并删除那些无用的服务器。

下一步是质疑任何显示了低利用率的设备的重要性。例如,也许其利用率仅为10%。那么,便可以看看这些设备是否可以被虚拟化。或者也许这些设备也可以被尽数销毁。如果其支持一款单一的应用程序,而有一位用户仍然认为其运作“良好”的话,那么,可能需要花时间来与之进行一次严肃的谈话了。毕竟,当一处数据中心的运行容量已经达到其极限时,其已经完全没有必要再容纳不必要的设备了。另外,这些措施也能为数据中心进一步降低功耗带来一定的效益。

当您在查看数据中心的硬件设备时,务必要清理硬件设备的空气过滤器,并确保电缆没有阻塞排气通道。这些简单的步骤几乎没有任何成本,但却可以帮助您数据中心大大提高冷却效率,延长设备的使用寿命。如果您的数据中心存放有废旧纸箱或其他不必要的东西,请务必要尽快处理他们,因为这些东西会造成更多的污垢灰尘堆积,进而重新堵塞过滤器,并降低冷却效率。

如果您企业组织的数据中心是通过通路活动地板来输送空气的话,请移除那些未使用的电缆。这项工作是不容易的,但您并不需要一个资本预算授权来执行这项工作。而您可能会惊讶于这项工作的执行所带来的冷却性能的前后差异。

而聘请专业的数据中心清洁服务可能是值得的。一款清洁的设施所能够为设备运行和功耗带来的效益将会是相当惊人的。2、修复了剩下的设备

当您企业的数据中心运行接近其极限时,那么没有什么比良好的预防性维护更为重要的了。即使这可能意味着超出了服务合同条款的特别服务,也务必要充分考虑这一点。确保一切设施都在其最高性能状态下运行可能带来额外的费用。

更换空调过滤器。检查所有的皮带和轴承,确认所有相关的一切都是干净的。您的供应商应该有一套彻底的维修检查清单,就像一名汽车机械师对汽车的维修检查一样。确保供应商完全遵循该清单进行历次的维修检查。而如果您企业的数据中心的运行确实已经接近其极限边缘,而同时又负担不起关闭空调服务以进行维修,那么您企业不妨选择租用便携式的冷却设施,以助您渡过难关。

不间断电源(UPS)的电池可能是数据中心最容易出现故障运行失败的项目,而究其原因则是因为他们最被需要。阀控式铅酸蓄电池(VRLA)只能维持几年的时间,因此,如果这些电池的使用时间已经超过三到五年了,那么,替换掉这些电池无疑是一个好主意。

在对您企业数据中心的UPS实施预防性维护之前,请务必先更换UPS或添加容量,检查相位平衡(phase balance)。您有可能获得比您想象的更多的可用功率。

大型的UPS系统(一般在20千瓦及以上)是三相的。这意味着有三条“热”的线缆,但几乎所有的机柜和设备都只连接到这些相线中的一条或两条。在美国,208伏的电路从三相电线中的任两条获得电源。在美国的一款120伏电路以及在欧洲的230伏线路,从任一一条相线外加一条零线获得供电。其结果是,可以很容易地加载一个或两个相位来接近容量,留下很少的负载连接到剩余的相位。

前面板的显示屏可以告诉您每一相的负载,但一般的显示将仅根据最坏情况的相位显示负载百分比。因此,如果相位是失去了平衡,您的显示器将显示98%的利用率,即使20%到30%的容量能力仍然可用,且未使用。尽可能再平衡相位(目标是在5%以内)可以从现有的UPS解开额外显著的电源消耗,从而几乎不花成本就解决了在潜力的过载问题。

在任何未使用过的机架和机柜空间安装冲裁板,以停止昂贵的冷却空气的浪费。卡入式面板可以带来冷却效率的巨大差异。同样地,可扩展面板可以关闭机柜之间的缝隙,而现在的产品甚至可以密封机柜底部和地板之间的空间。

3、制定补充战略

只有在上述的所有这一切工作都已经完成后,才应该考虑增加主要设备的问题。

如果您企业的数据中心需要更多的UPS容量,不妨可以考虑使用更小的、机架内UPS单元。这些将是有益的,但 只有当需要的额外UPS容量是最小量的时候。即使这意味着只是一个短期的解决方案,也请使用商业级的UPS单元。每隔几个月检查一下这些小单元的电池,并注意他们的警报。

如果您企业的数据中心需要更多的冷却散热能力,那么,行级冷却器(in-row cooler,IRC)可能是比大型机房空调(CRAC)或空气处理器(CRAH)更好的选择,特别是如果现有的冷却空气是通过在地板下送风的话。增加CRAC可能会使得更多的空气进入地板下,从而超出了地板充气空间所能够容纳的空气量,并可能由于地板的阻碍作用而增大了压力。此外,空气流会相互干扰,实际上降低了某些区域的冷却效果,而并没有改善它。

行级冷却器被安置在机柜之间,并在机柜前的最高热负载处直接提供冷空气。进一步的改善可以通过将那些具有较高的热输出的设备重新定位安置到高密度的机柜配置,从而降低数据中心的其他部分的负荷。另一种选择是通过采用后门热交换器(RDHxs),其能够在热空气离开机柜前中和热量。这两种方案都需要冷却水或地板外的制冷剂管道,这当然会给数据中心带来一些显著的、以及潜在破坏性的安装工程。但这些方法的优点是,它们可以通过规划其大小和安装位置,以解决特定的需要。能够将主要工作限制到一个小部分的区域,并最大限度地减少了需要购买的新设备的数量。

如果冷却仍然是一个问题,那么则可以考虑补充加入密封遏制(Containment)。冷通道密封遏制(Cold-aisle containment)对现有设施的改造通常是更好的选择,但对于空气的均衡也是难以控制的。热通道遏制则避免了空气均衡的问题,但它需要一个回风路径以返回到空调机。这是IRC的一个固有的设计,但如果您企业数据中心不是已经在天花板有一个回风压力通风系统返回到CRAC的话,其将是较为困难的。

较之实心的空气阻挡门和面板,塑料窗帘在现有的空间更容易部署实现。他们允许漏风,这可以解决冷通道密封所带来的空气均衡的挑战。但是,采用塑料可能不符合防火和烟雾排放的要求。

固体密封遏制,使用列末门和上述机柜板,可能更难以在现有的空间来部署实现,但其要比塑料窗帘能够提供更完整的密封遏制。在冷通道密封遏制的空气平衡将是具有挑战性的,通常意味着设计需要允许一些缝隙泄漏的存在,以避免问题。

此外,关于密封遏制,有重要的消防保护方面的考虑。如果洒水喷头或排气压头不在每个通道中,密封遏制可能会将一个通道与灭火剂隔离,而这是非法的。 美国防火标准要求保护壁垒下降后自动实施烟雾检测(不让熔线因实际火灾而遇热融化),而下降的保护壁垒会落入通道,而不会阻碍紧急疏散。为了解决这些问题,最好的办法是重新配置火灾保护方案,但这样可能是成本昂贵且具有破坏性的,可能不适合一个现实可行的短期设施规划方案。

当面对要将一处现有的数据中心的使用寿命延长几年的需求时,第一步的措施可能会是那些您企业原本应该一直都在采取,但到此刻为止才被迫开始采取的措施。

企业为修理一处即将报废的设施而批准庞大的预算将是很难的,而且应该很少是必要的。当确实是必要的时候,解决方案在本质上需要是模块化的,只提供必要的,并且是以最低的成本和尽可能不发生中断。

除非绝对必要,否则千万不要添加主要的设备。这种工作的成本将是相当昂贵的,而且对于现有的系统是危险的,并可能会产生新的问题,而不是解决现有的问题。

将电缆、传感器、硬盘的升级列入您企业的待办事项清单

并不是每一个IT基础设施项目都是耗时的,资本密集型的,会给企业带来颠覆性影响的。让我们来看看一些可以帮助您企业支撑一处数据中心的简单的且成本低的工作任务吧。

1、升级现有的硬件

对于数据中心内存和本地硬盘的战略型升级有助于提高服务器的性能容量。内存是虚拟化的一个限制资源,而服务器很少配备了全套板载。盘点您企业数据中心未使用的插槽,并为现有的虚拟机添加内存,以帮助或适应未来的服务器整合。

固态硬盘(SSD)是对战略性服务器的一种本地磁盘存储升级。固态硬盘改善了I / O和更低的延迟性,是敏感的工作负载存储带宽的理想选择。如果一台服务器上的工作负载依靠磁盘缓存,固态硬盘可以加速其性能。无需撕裂和更换所有磁盘驱动器,仅仅只需将一款固态硬盘添加到一台服务器的本地存储,以清除瓶颈和停止错误。

升级服务器固件是快速且免费的,但也具有破坏性。执行这类升级只能解决诸如硬件或操作系统支持等具体的问题。清查盘点您企业数据中心的资产,并列出一份当前的服务器型号和固件版本的清单列表;然后检查服务 器供应厂商的更新网站以下载最新的更新。通过细节或发布的更新说明确定这些更新是否能够真正解决问题。外设接口和适配器设备也有可能需要更新固件。

内存和磁盘升级意味着出现停机时间(除非采用热插拔)和重新配置机架。“内存升级是成本便宜且有效的,但…这不完全是就地升级(in-place upgrade)。”网络自动化技术开发商6connect公司的首席运营官兼联合创始人Pete Sclafani表示说。因此企业不妨在计划的服务器停机时间内执行内存和SSD升级。

磁盘容量是昂贵的,您企业可以通过删除不必要的内容或通过将数据迁移到较低的存储层来防止大容量的增加。例如,不必要的数据所带来的大量临时目录,可以在服务器和存储子系统的/tmp和c:/temp目录下清除。

尝试为薄存储部署使用一个零字节回收。“零写入到所有已分配但未使用的空间。”位于加州阿纳海姆山的一家云平台提供商ReachIPS公司的IT运营总监Tim Noble表示说。服务器分配的一个零字节回收,永不需要存储,从而释放了阵列的空间。

2、重新布线

随着网络带宽达到10千兆以太网(GigE),25千兆以太网,甚至更快,这意味着1千兆以太网的老化类别的5和5e铜布线基础设施已经无法应付新的数据中心的要求了。

即使为更高的带宽网络选择了合适的硬件,也可能缺乏线缆。“人们往往忘记,当物理网络设备升级后,您企业网络的布线可能无法充分利用,”Sclafani表示说。不要一下子撤掉所有老化的线缆;以太网线缆完全向后兼容。当时间和预算允许时,在更快的线缆方面做出相对较小的,增量投资。

服务器将仍然保持在10千兆位以太网,所以企业数据中心应着眼于重点骨干网络,特别是基于以太网的iSCSI和以太网光纤通道存储阵列。例如,6类线缆可以支持10千兆位至55米,而6A类线缆和7类线缆则可以处理10千兆至100米,无需新的网络适配器、交换机或其它组件。

3、添加传感器

如果您无法衡量它,您就无法对其实施管理。数据中心基础设施管理(DCIM)工具则能够监控复杂设施的电气和环境行为。

DCIM需要在数据中心范围内有策略地放置传感器。这些工具可以针对情境事件自动触发响应,如当某台服务器变得太热时迁移工作负载;或在冷却循环中出现水分泄漏时发出探测警报。传感器的缺失或不足或将导致输入缺口。

哪些传感器是不可或缺的?

· 温度传感器定位在机架和行内的热点位置。

· 湿度传感器真对过于干燥的空气或冷凝水平损坏发出警告。

· 当冷却水在热交换器或机架上循环流通时,水分(液体)传感器是必不可少的。

· 能源使用状况的实时监控。

· 空气流传感器确保风扇和过滤器的畅通运转。

· 运动探测器检测入侵者,并触发安全警报和相机拍照。

· 烟雾/火警传感器保护数据中心宝贵的资产和生命。

· RFID标签有助于自动化硬件库存控制。

新的传感器很容易安装。此外,它们可以逐渐增加,从而分散了成本。

关于作者

斯蒂芬 J.毕格罗是TechTarget网站数据中心和虚拟化部门的高级技术编辑,拥有在PC /技术行业超过20年的技术写作经验。

罗伯特·麦克法兰是国际咨询公司Shen Milsom and Wilke的数据中心设计部门主要负责人,他在通信咨询领域的从业时间超过35年。他在数据中心行业的每一个领域环节都有相关经历,是电缆开发设计领域的先驱。麦克法兰同时也在马利斯特学院研究所为数据中心专业人员计划教授数据中心基础设施课程。

====================================分割线================================

本文转自d1net(转载)

时间: 2024-12-24 01:57:45

延长数据中心使用年限的低成本方法的相关文章

延长数据中心的生命周期

随着能源成本的急剧上升,数据中心运营商和他们的客户都意识到数据中心的能源效率是未来业务增长的关键.管理数据中心的硬件生命周期是一个持续的过程,需要不断更新.通过识别和隔离热点和低效率的设备,在实施和设备升级之前,可以避免昂贵的故障率和停机时间.在设计过程中引入冷却模拟技术,可以降低数据中心的冷却成本. 传统服务器的使用寿命大约是三到五年,但这一数字现在可以维持八年之久.而有些数据中心的服务器必须运行更长的时间.由于硬件的损耗,设备需要更多的维护,但是这会增加数据中心的成本.因此,数据中心面临的问

延长数据中心设备使用年限?这些策略来助攻

当你的数据中心面临空间.供能或散热不足的问题--或三者都存在问题时--你有麻烦的事需要考虑了.当你的业务在未来若干年还有很大可能要继续扩展,或当你的公司已经开始讨论最终将一些计算需求转移到云或托管网站时,数据中心的升级问题将变得更具挑战.这些升级的决策都是至关重要,没有一个是可以仓促对待的.总的来说,公司在这方面做出的选择都将是昂贵的--无论是以经费支出还是运维效能衡量都是如此. 但是,一方面公司要规划其长远的数据中心策略,另一方面IT部分仍然要面对短期的任务:保持数据中心运行,切实可靠的满足用

延长数据中心生命周期的管理注意事项

随着能源成本的急剧上升,数据中心运营商和他们的客户都意识到数据中心的能源效率是未来业务增长的关键.管理数据中心的硬件生命周期是一个持续的过程,需要不断更新.通过识别和隔离热点和低效率的设备,在实施和设备升级之前,可以避免昂贵的故障率和停机时间.在设计过程中引入冷却模拟技术,可以降低数据中心的冷却成本. 延长数据中心生命周期是非常必要的,以确保人们最大限度地利用现有的技术.我们需要采取的最佳做法,如适当的房间密封,热通道与冷通道机架的部署,以及预防性维护,可以优化现有的数据中心冷却系统的性能.安装

延长数据中心设备寿命你还可以这么做

当你的数据中心设备已近乎满负荷运行了,一个完整的策略将包括哪些数据可以被清理.哪些模块可以维护继续使用,以及哪些需要升级替换.我们在第一部分<延长数据中心设备使用年限?这些策略来助攻>中介绍了两种优化策略:通过清理.丢弃老的设备提升效率以及通过最小的维修优化现有设备. 增加设备 另一些延长设备寿命的数据中心策略包括主要设备的添置--但这是最后的选择. 如果你需要更多的UPS电源,考虑使用更小的.机架式的USP模块.这些模块很有用,但只有这些增加的UPS电源被用到了才是如此.即使这只是短期的解决

CIO谈如何延长数据中心的使用寿命

今年是富兰克林欧林工程学院1200平方英尺的数据中心建立10周年.这意味着这个设施的运行时间比CIO兼负责运营的副总裁乔安妮·科苏特(Joanne Kossuth)的原计划时间延长三年时间.现在,虽然这个学校需要一个更大容量和更好的连接的设施,但是,由于不确定的经济问题,科苏特一直被迫推迟这个事情. 科苏特称,在过去的几年里,需求肯定增加了,促使数据中心达到了极限,但是,经济衰退搁置了翻新的讨论. 像花旗集团和万豪国际等公司的CIO一样,科苏特必须要有创造力,从服务器.存储和设施本身获得更多的东

浅析数据中心建设预估评价方法

这几年数据中心建设遍地开花,全国各地纷纷建立各种数据中心.有的是企业业务发展需要,有的是向外提供服务获取收益.不管是哪种,建设数据中心之前,首先要明确的是建多大规模的数据中心,需要多大费用,投产后的运营利润如何?作为投资方,最关心的就是需要投资多少,投资回报率是多少?这些显然要通过列举翔实的数据才能知道,如何评估才能得到最真实的结果,这个评估越偏离实际,投资方面临的风险就越高.所以如何对数据中心进行有效预估,需要有一套行之有效的方法才行. 首先要了解需求,明确需要新建数据中心完成哪些具体业务,这

面向云计算数据中心的能耗建模方法

面向云计算数据中心的能耗建模方法 罗亮 吴文峻 张飞 云计算对计算能力的需求,促进了大规模数据中心的飞速发展.与此同时,云计算数据中心产生了巨大的能耗.由于云计算的弹性服务和可扩展性等特性,云计算数据中心的硬件规模近年来极度膨胀,这使得过去分散的能耗问题变成了集中的能耗问题.因此,深入研究云计算数据中心的节能问题具有重要意义.为此,针对云计算数据中心的能耗问题,提出了一种精确度高的能耗模型来预测云计算数据中心单台服务器的能耗状况.精确的能量模型是很多能耗感知资源调度方法的研究基础,在大多数现有的

云计算时代:让数据中心更智慧的方法

作为现代世界耗能大户的数据中心,如何才能经济.高效.环保地运行?也许你可以在IBM的罗利数据中心找到答案. 罗利.杜兰和查佩尔山三个城市组成的北卡罗来纳州的研究三角园区景色优美,大片的森林,大大小小的湖泊点缀其中.杜克大学.北卡州立大学和北卡罗莱纳大学为这个三角园区的企业提供了足够的研发人才,成立于1959年的园区有170多家世界级的企业入驻,IBM就是其中的一家企业,在这里有3800名员工,占地765公顷.投资3.6亿美元的"领导型"数据中心就位于罗利的园区内. 1997年的时候,I

绿色数据中心的六大解决方法

构建绿色节能数据中心是当前数据中心建设中首先应该考虑的问题.因为绿色节能不仅是社会发展的需求,也是企业要发展的必由之路.我们通常而言的绿色节能是指提高数据中心的PUE,也就是降低数据中心的整体功耗或者说IT设备的损耗的值.那么我们可以用那些方法来解决这一难题呢? 1.关闭空闲设备 我们的服务器在空闲时的能源消耗在最大能耗的30%~40%.因此IT系统应该关闭那些不需要执行任务的服务器. 2.使用或者启用CPU能源管理功能 许多硬件产品带有内建的电源管理功能,但是基本没用过.这种功能支持CUP通过