随着科技的发展和科研信息化程度的提高,高性能计算机成为科扶发展的重要力量,特别是一些高新技术的发展,越来越成为经济社会发展的决定性力量。2006年11月,在引进了曙光高性能计算机后,中国科学院深洲先进技术研究院以往用几个星期才能处理完的数据模拟与仿真数据,现在几个小时就可以处理完成,使这个巨大跃迁成为砚实。
前沿应用引发高端需求
中国科学院深圳先进技术研究院(后简称先进院)是国内外一流的集成技术研究基地,在先进制造业基础战略性研究领域和应用开发性研究领域方面,深圳先进技术研究院有着强劲的实力。
该研究院院长表示,目前7个研究中心每天都有众多复杂的数据需要精准地运算和分析,先进院对高性能计算机平台在先进性、系统兼容性、通讯性能、存储管理以及性价比等几方面有很高的需求。选择曙光主要是看中其在高性能计算机领域的技术优势和其他厂商无法比拟的售后服务。
双核出阵 “大力神”筑巢先进院
“深圳先进技术研究院科学试验计算能力,是典型的高性能计算应用,需要大规模HPC计算运算处理,某些方面的计算处理复杂度和甚至不亚于卫星上天。”曙光公司资深工程师表示。
对应干深圳先进技术研究院的实际需要,曙光公司提出了采用基干机群架构的双核AMD和Intel的混合系统,计算节点采用了胖节点群和痰节点群结合的解决方案(胖瘦节点分别指的是采用不同处理器的服务器系统),形成了功能强大的高性能机群运算系统,共计运用了96颗离性能处理器,浮点运算能力达到14490亿次浮点运算能力/每秒,且具备全方位、多领域的应用能力,满足了用户对智能仿生集成技术、汽车电子集成技术、先进制造集成技术等前沿应用的需求,而且使整机群具有高处理能力、高可靠性和高性价比特点。特别值得一提的是这种结合与RISC小型机+X86机群的方式非常相似的,但是由于在处理器上完全兼容,因此使得这样的结构向作业调度系统提出了较低的需求,用户在使用这种结构的机群系统的时候可以具有更强的灵活性。
在深圳先进技术研究院的计算系统平台中,胖节点群和瘦节点群之间可以很好地实现系统的并行处理。系统选用的是曙光天阔系列服务器中的最高端产品A950来满足用户在该方面的突出需求,曙光A950服务器是曙光专为企业级核心应用、高性能机群系统等高端应用领域精心打造的一款高端服务器,采用8颗AMD Opteron 800系列处理器,并可以支持双核处理器,采用了专业的16GB ECC内存,且最高能支持到128GB,具有高性能、高性价比、全面兼容主流应用等突出特点,是实现大规律高性能机群计算一种理想的节点。
与之相比,瘦节点方面则更多地运行扩展性很好的程序,于是采用了面向行业市场中等网络规棋的部门级服务器天阔I620r -F,曙光天阔I620r-F支持Intel Xeon 5000/5100系列双核处理器,主频可达3.73GHz以上,系统前端总线频率最高为1333MHz,系统内存采用串行传输的DDR2 533 FBD内存,最大支持32GB FBD内存,能带来“海量处理.的应用体验,很好的满足了用户在这些方面的应用。
为了满足先进院高网络通讯要求,曙光在系统中采用了计算通信网、存储交换网、SAN存储网、百兆管理网、SKVM网以及硬件监控网共6个网络共同作用,且运用了目前最为通行的高性能计算网络Infiniband中最高端的20Gbps,所有计算节点基于高速通信网络(Infiniband)连接到一起,通过相对应的MPI和PVM版本,实现所有计算节点之间的高速通信,实现大规模科学数据集的协作运算和虚拟化处理。整套网络通讯系统,提供了高速的网络通讯环境,为高要求数据模拟分析及分布式计算提供了强大的运算平台。
对于复杂而宝贵的科研数据,在存储方面,系统采用了国内先进的机群存储系统BWFS文件系统和业界其有绝对领先地位的曙光机群管理系统。利用BWFS文件系统和YOM备份软件,可以实现文件系统级别的线性扩展和系统的备份。且本系统中采用了虚拟存储设备,运用了一个类似于IP SAN设备,此设备不仅具有普通IP SAN设备较好的性价比及兼容性,而且可以实现再扩展,能将新加入的IP SAN设备和原有的设备整合到一个大的卷里面,实现真正的无缝扩展,形成海量存储。满足了先进院高要求的数据存储需求。
而且,在机群管理上采用了曙光独具特色的SKVM Over IP解决系统,利用它,可以通过系统中央控制台实现对系统所有节点的KVM切换管理,极大地简化了网络分配、故障诊断和清除,实现了“复杂科技,简单管理’。
完美售后物超所值
此套系统中,曙光在售后方面的突出表现,更是让深圳先进技术研究院感到物超所值。为了帮助深圳先进技术研究院更好地实现其高性能计算平合的价值。曙光首先制定了全面细致的培训计划,为用户提供了长达5个工作日的完整的高性能计算机系统培训,培养合格的机群管理人员和出色的使用人员。而且,为了解决售后使用维护问题,曙光提供了业界绝对领先的5年免费原厂商售后服务。强大的售后服务帮助深圳先进技术研究院以最快的速度掌握了使用管理,大大提高了系统利用率,提升科研攻坚水平。
不仅如此,本系统中曙光公司提供了全面的机群系统使用软件套件,包括性能分析工具Vtune, Intel和PGI的编译器,基于Infiniband的MPI实现、OpenPBS等等。整个系统成为了一个可以直接使用的“交钥匙工程”。
高速教据处理 提升科研工作效率
深圳先进技术研究院相关人士表示,曙光强大的技术实力与品牌优势是先进院决定和曙光合作的重要因素。曙光充分考虑到国内用户的本地化要求,先进、兼容稳定性强,管理便捷、网络功能强大、售后服务出色且其有极高的性价比,这些是曙光机高性能计算机众多亮点,是我们选择曙光的决定性因索。先进院技术人员介绍,该系统完成后可以进行每秒14490亿次浮点运算能力,和旧运算设备作对比,以往用几个星期才能处理完的试验数据,现在几个小时就可以处理完成。
曙光高性能计算机助力深圳先进技术研究院,对于未来先进制造业基础战略性研究领域和应用开发性研究领域将起到决定性的推动作用。