1、方案总体设计
日前,基于">刀片服务器的曙光高性能机群再创佳绩,成功中标北京航空航天大学高性能计算机群教学科研设备采购项目。该高性能机群的核心采用曙光专为百万亿次超级计算机设计的TC2600刀片服务器,配置AMD四核“巴塞罗那”处理器,建成后的系统将为北航提供理论峰值高达3.9万亿次每秒的强大浮点运算能力,用于承载该校超大规模的物理化学计算。在该项目中,曙光公司将刀片服务器与新近上市的“巴塞罗那”结合应用,充分显示了曙光公司的技术先进性。
整个系统由曙光公司专为百万亿次超级计算机设计的TC2600刀片服务器为核心、结合曙光TC4000系列集群系统技术而构成。计算节点采用了共计 128颗1.9GHz四核心AMDOpteron处理器“巴塞罗那(Barcalona)”,提供512个并行计算单元供用户使用,可以承载超大规模物理化学计算,整体理论峰值浮点运算能力高达3.9万亿次每秒。
计算节点采用的AMD最新推出的四核心“巴塞罗那”处理器,是业内首款真正意义上的四核X86CPU,浮点运算性能较竞争对手Intel提高40%以上,非常适合用来构建大规模集群系统,目前中国百万亿次超级计算机曙光 5000、Cray为OakRidge国家实验室建造的千万亿次超计算机以及IBM为美国能源部国家核安全管理局建造的名为Roadrunner的千万亿次超级计算机(将包含16000颗CELL和16000颗AMD处理器)等都将采用AMD四核巴塞罗那处理器来构建。
存储系统采用了曙光DS2412FA磁盘阵列,具有双冗余热插拔Raid控制器提高系统可靠性,并配置3TB存储空间满足大规模计算的存储需求。该款磁盘阵列在单柜内可以支持扩展到最多18TB的存储空间,具有非常出色的性价比。
网络系统采用全球HPC领域的领导厂商Force10公司出品的千兆交换机作为计算网,S50交换机具有高达192G的背板交换带宽和101Mpps的包转发率,可以实现全线速无阻塞的数据交换,提高并行计算效率。同是刀片机箱内的千兆网络交换模块配合一台千兆交换机可以作为管理网,双网分离,互为备份,提高系统可靠性。
由于采用刀片服务器构建HPC系统,使得系统功耗有了大幅度降低。每个四核巴塞罗那处理器的功耗仅为 68W,因此每个刀片全速工作的功耗约为240W,而采用四核CloverTown的刀片功耗高达320W,节能33%!整个系统总功耗不超过17KW,较Intel节能5KW,每年为国家节约能源43800千瓦时。
总体结构图
2、TC2600刀片服务器
TC2600刀片服务器是曙光公司研发的第三代双核/四核刀片服务器产品,它在众多方面超越了传统机架式服务器,是高稳定、高可用、高扩展、高密度、高性能的新一代服务器产品。它推动服务器向更高计算密度、更多集成功能和更强管理能力的方向发展,提供更加卓越的计算处理性能、简单方便的部署使用和全方位的监控管理,可以显著提高数据中心和高性能计算中心的生产率和工作效率,最大限度地降低IT运营和管理维护成本。它采用整体优化的策略,有效降低了系统功耗,再加上其人性化的设计、超强的系统扩展能力、卓越的性价比和计算密度,可以覆盖更广泛的用户需求。与传统的服务器相比,TC2600刀片服务器可提供更有竞争力的整体解决方案,是满足更高计算性能需求和运行关键应用程序的理想平台。
此前,北京航空航天大学已在自动化、理学院、航空学院等多个院所使用了曙光天潮系列机群产品,并均用于科学计算领域,为北京航空航天大学科研水平的提升奠定了坚实的信息化基础。本次,性能卓越的“巴塞罗那”处理器与刀片结合再次应用于北京航空航天大学,更加显示了曙光机群产品极高的可用性,为北航的科学研究再作贡献。