High performance computing(简称HPC)即高性能计算。指通常使用很多处理器或者某一集群中组织的几台计算机的计算系统和环境。高校中需要这种HPC,但面临着多重巨大挑战。具体的挑战有哪些呢?根据分散式和集中式两种HPC资源,总结如下:
1. 科研资源跨院系,资源分散、孤立,利用率低,资源相互之间无法共享,不断投资扩容,消耗大量资金。
2.跨专业,各自维护资源,技术难度大,学校无法统一管理。
3.HPC部署难度大,网络配置、操作系统安装维护难度大,增加学习成本 。
4.数据存储的成本攀升,性能不足。
5.平台应用固定,灵活度差,软件受限,难以满足各院不同领域研究 。
6.网络中心运维唯独难度大,工作价值难于体现 。
海南大学与HPC海南大学,简称海大,是国家“211工程”重点建设大学,其特色学科包括海洋、生物、材料和制药等学科,这些学科的科研往往需要高性能计算集群支撑,因此海大希望当前支撑学校业务系统的IT基础设施也可以为科研高性能计算提供支撑。海大现有IT资源主要分布在网教中心和图书馆,承担学校各类业务管理系统和公共服务平台。除此之外,现有部分学科还配备少量高性能服务器资源支撑科研。IT资源分布分散,无法实现共享,整体IT资源的利用率偏低,投资回报率偏高。
HPC in Cloud2014年上半年,海大与国内从事网络(含云计算)、服务器、虚拟化的多个厂家进行了沟通交流,通过组织校内外专家对厂家方案进行了严格的评审答辩,最后选定最好的三家方案作为基础进行整合优化,形成公开招标方案。
最终,品高在公开招标环节胜出,为海大提供了最优的HPC与云计算融合的计算平台解决方案(HPC in Cloud),即业务管理系统和公共服务平台,面向目标用户提供虚拟化服务及高性能计算服务。
包括:利用云平台建立校级云资源服务平台,并统一对教务和科研需求提供资源,老师可以按需申请HPC资源;通过应用自动化部署服务将常见HPC软件打包成模板,各学科老师按需申请资源;利用闲时可以将教务系统部分资源,停机保号(关机但数据保留),将资源提供出来跑HPC业务;利用弹性服务功能,当应用负载增加时自动创建资源应对,降低业务宕机风险;利用SAN做高性能计算,用普通PC组成分布式存储,存放结果数据,有效降低成本。
本文转自d1net(转载)