国务院前总理温家宝曾说过:“中国有13亿人口,不管多么小的问题只要乘以13亿,那就成为很大很大的问题。”这句话套用到数据中心的运维也很适用,如果数据中心达到一定规模很多看似不起眼的小事也会变成大事。比如,一个人一天要接收和安装500台服务器,就不是一件容易的事情,而现在一年更增1万台服务器对于很多数据中心已经不是事儿了,平均到每一天新增服务器很容易突破500台。
而根据研究机构预测,数据中心规模还有不断扩大之势。未来五年超过60%的数据中心投资增长将来自超大规模数据中心。其中,5000台以上的数据中心将占到总体的68%以上,而到2020年将出现50万台容量的单一数据中心。在数据中心规模不断扩大的情况下,如何管理和运维是数据中心管理者必须考虑的问题。
整机柜服务器就是在这一背景下出现的一种新的产品形态。作为一种可以帮助大型数据中心解决服务器的安装、部署简化运维的有效手段,近年来随着数据中心的规模化、大型化而被越来越广泛地认可。这其中浪潮整机柜服务器因为高密度、大颗粒一体化交付、集中供电散热和管理等特点,而成为整机柜服务器市场的主要势力。
简化交付和运维
在整机柜服务器出现之前,服务器和机柜是两个不同的产品系列。机柜只是服务器、网络设备部署的一个框架,而随着数据中心规模越来越大,人们发现将服务器与机柜整体设计,比如,通过集中供电和统一制冷,可以简化服务器的部署,提高机柜空间的利用率,节约成本。
以浪潮整机柜服务器产品为例。其采用高密度、整体式设计,以42U、46U机柜作为产品形态,一体化设计与整体交付,相较传统服务器大大节省了交付所需时间,达8-10倍速度的提升。紧凑柜内设计,最大支持48个计算节点(受限于目前数据中心用电),相较传统服务器密度提升1倍。其特点主要体现在以下方面:
1.集中供电设计,节能降耗:SR整机柜在架构设计时考虑到供电效率和成本的优化,把机架服务器中的供电模块全部抽离出来,仅需10个2400W白金电源模块,即可满足48节点的供电需求,电源使用数量相较传统机架服务器的96个减少到10个,减少近90%的电源数量。而与传统服务器电源相比,效率提升9%,能源利用率更高。
2.集中散热设计:后部集中散热风扇墙,减少单点故障同时。48台传统服务器需要288个120mm风扇,而SR整机柜在48节点的情况下只需要18个,数量不足原来的十分之一,系统散热功耗可降低70%以上。9组集中散热风扇墙,实现智能调速,半柜独立风道,避免局部热点。风扇采用2+1冗余设计,支持每U高度调节,并实现风扇盒免工具热插拔。
这种整体设计的最大好处是可以极大地方便运维,能以整机柜作为整体管理解决方案,通过RMC集中管理单元实现整个系统资源的实施监控,所有IT设备如节点、电源、风扇等通过RMC统一管理实现集中监控及扩展,实现了IT设备资产信息的自动上报与管理,并优化了系统散热能耗。智能化调节运行参数依据运行状态信息,动态调节运行参数,实现节能。到货一致性与状态检验--到货检验时间由原来的1~2小时,减少到5分钟内完成。此外,节点资产的统一管理简化了客户的资产维护工作,全部资产管理由RMC集中完成。
据浪潮互联网行业部产品总监孙波告诉ZD至顶网记者,浪潮是最早进入整机柜服务器市场的厂商之一,确立了整机柜的行业标准。至今,SR整机柜已累计出货10万节点,在整机柜领域的占有率超过了70%,创造并保持了单日双线并行交付1万节点的业界记录。
多项技术突破
浪潮整机柜产品最早始于2009年,到今年新推出的SR4.5,共历时7年和5代的产品形态。其中,第一二代产品并没有真正上市,2012年的SR3.0是第一款真正上市的产品。不久浪潮又推出了SR4.0。这之前的产品都集中于IT外围功能模块的整合,比如供电和制冷。实际上,早期的整机柜服务器和现在的大部分整机柜服务器产品都主要集中于IT外围资源的整合,包括通过风扇、电源的集成实现集中供电、集中散热,除此之外,有些会延伸到资产定位、系统监控等。
不过,浪潮最近推出的SR4.5将浪潮在整机柜服务器市场的技术优势又领先了一步。因为浪潮整机柜产品有了重大突破,不仅在集中供电上引入了BBS,同时在融合架构上迈出了一大步,将整合范围延伸到计算和存储上。此外,浪潮整机柜产品SR4.5还将细分,出现两个不同的产品系列:一个是面向传统企业的私有云场景,以Scale-Up为主,称为CR系列。另一个为SR系列,面向互联网企业,强调高性价比、快速部署。
“SR4.5整机柜新增BBS(Battery Backup System)后备电池节点和至强D节点,首次实现了存储和计算资源的池化,实现了从IT外围资源的集中到内部资源的重构和池化,进一步降低TCO。”孙波介绍说。
1.分布式BBS取代集中UPS。据悉,传统2N市电+UPS的方案,使得整流和逆变呈现双倍转换损失,每台UPS负载长期处于较低水平,整体效率低于80%。而采用BBS替代UPS,市电将直接到达服务器,在给服务器供电的同时,BBS作为即插即用的节点,中间几乎没有转化效率的损失。结合Active-Stanby服务器电源的双电设计,可保证绝大多数状态下的供电效率>99%。
2. 基于硬件交换技术池化,实现资源灵活分配。SR4.5整机柜实现了内部资源的重构和池化,打破核心IT资源扩展极限,利用SAS、PCI-E的交换技术,实现存储、协处理计算等资源的弹性分配,从而更好地适配日益繁杂的应用场景和业务需求。
存储资源池化:利用SAS交换技术将整机柜的存储资源独立出来,形成共享的资源池,再根据业务工作负载的需要,实现任意计算节点或CPU自由访问存储资源,计算存储资源的分配更加灵活。具体办法就是通过SAS SWITCH,单计算节点连接多个JBOD存储节点,每个JBOD节点可容纳20块3.5/2.5英寸SAS/SATA/SSD,在46U高度单机柜内最大支持容量达6.4PB以上(按每盘8T计算)。
PCI-E扩展池化:可以实现基于PCI-E协议的协处理计算、高性能存储、温冷数据存储的资源池化,每个计算节点可按需连接扩展BOX,包括GPU/MIC/FPGA的协处理计算资源池(扩展BOX每U高度支持4块GPU/MIC/FPGA卡),或者至少20块NVMe SSD的热数据存储资源池。以42U单机柜为例,最多可支持32块GPU。
孙波表示,硬件资源池化对于提高系统的灵活性、降低运维成本具有非常明显的效果。比如,在深度学习、语音搜索、视频转换、人工智能、分级存储、高密计算等需要GPU的场景,通过PCI-E Switch可以实现GPU的集中部署,从而降低延迟,提升系统整体性能。而SAS Switch可以实现存储介质的按需配置,这对于大规模数据中心简化运维是非常有意义的。
3.引入Xeon-D新节点,实现更精细的数据热度管理。SR4.5还采用Xeon-D SoC处理器的SN3116M4S节点专为温冷及冷数据存储设计,Xeon-D SoC处理器低功耗和高集成度为构建高密度的云数据中心提供支持。该节点高度1U,支持18块3.5英寸硬盘,单节点可扩展支持单个JBOD,存储密度的提高可进一步降低了存储成本,且支持硬盘休眠从而实现超低闲置功耗。全新SN3116M4S节点让数据热度实现更精细化的管理。
另外,值得一提的是,随着新一代整机柜服务器产品SR4.5的推出,SR整机柜生产线也将进入新的阶段:位于济南的浪潮信息化高端装备智能工厂将正式启用。高端制造的互联网+模式创新,强调产品定制化+质量标准化,端到端的全程大规模定制。同以往传统的串行生产不同,柔性生产可解决客户大规模多样化需求,支持10组作业单元并行生产。
“智能化的新产线,生产效率是传统产线的4倍,让SR整机柜拥有更快的交付速度、更标准化的质量,同时满足大规模可定制需求,更好的服务互联网客户。”孙波透露。
原文发布时间为: 2016年9月28日