6月19日至23日,一年一度、巨头云集的国际超级计算大会(ISC2016)在德国法兰克福如期举 行。当地时间6月21日上午,国内领先的高性能计算产品与服务提供商曙光公司联合全球芯片巨头Intel,在ISC2016上正式发布了首款面向云计算的 高密度融合架构服务器产品——星河(Galaxias)SDC1000。
星河SDC1000即具有传统服务器的特点,如采用通用处理器做计算核心、兼容传统服务器的软硬件标准 协议、适配所有商用OS、Hypervisor等生态软件,又独具弹性、异构、按需简约的设计理念、软件定义体系结构、模块化设计、高密度、高可扩展、高 性能功耗比和高性能价格比等特点。曙光公司高级副总裁聂华先生介绍说“星河SDC1000通过采用与云应用相适应的新型体系结构和高效部件,最终实现了低 成本、节能、高效等目标。”
云计算是继个人计算机、互联网以后的新一轮技术浪潮。云计算是一种新型的计算模型,与传统的科学计算相 比,更强调事务处理能力。由于传统的服务器强调性能和多用途,常常忽视体积、功耗、成本等能效因素,导致了传统服务器在云计算应用中能效较低,进而在系统 集成、应用部署以及后期维护等方面出现较多问题。以资源聚合和虚拟化、应用服务专业化、按需取用为特征的云计算是计算模式和应用服务模式的革新,是新一代 信息技术集约化发展的重要趋势,正在改变着信息行业的格局。
目前的大型云计算中心基本采用传统服务器集群作为数据处理平台,普遍存在功耗大、密度低、难管理等问 题,因此研究适合云计算应用的具备高密度、低功耗、易管理等优点的数据处理平台具有迫切性。由于在云计算环境中,需要解决的常常是多用户同时请求和数据间 逻辑运算问题,因此星河SDC1000更关注高性能、高吞吐量的耦合计算能力,即特定时间段内处理网络并发请求的能力。星河SDC1000面向云计算典型 应用需求,实现了性能功耗比和整体服务能力均有较大提升的低成本、低功耗、高效能的软件定义服务器设计理念,并在关键技术上实现了创新突破。
- l高密度、高性能
基于典型云计算服务需求,配置轻量级处理器或高性能处理器来适配大型云计算中心的各种负载,有效地提高 了服务器的效能。星河SDC1000基于异构和虚拟化环境,可实现对不同云服务聚集的高效响应,进一步提升高效云服务能力。星河SDC1000 可在4U机箱内集成32颗Intel Xeon-D处理器或16颗Intel E3处理器,可创建1000多个虚拟机。服务器内部处理器通过聚合带宽1.6Tbps的高性能互连网络紧耦合在一起。高性能、紧耦合互连网络,专用的高效 通信协议,很好地满足了服务器内部海量数据高速、低延迟地传输。在这套网络上,基于TCP/IP的应用程序可不加修改地运行。同时,为了兼顾某些对网络性 能要求较为苛刻的应用,星河SDC1000还具备直接使用PCI Express系统级总线构建紧耦合超高速网络系统的能力,不仅可提供目前为止最快的单机箱同构计算性能,还可对外提供超过1000个虚拟机。与此同时, 每台星河SDC1000 还配置有4套FPGA模组,支持OpenCL编程环境,实现异构加速计算。
- l软件定义服务器
星河SDC1000具有内部高速数据通信能力,能够最大化简约掉通用服务器中常见的外围部件和局部区域 的网络通信部件。此外,通过专用的片间互联ASIC芯片、专用的高效数据流通信协议,服务器内部按照3D-Torus的高效互连架构进行连接,能够建立起 区域共享系统资源,通过软件定义分配硬件资源,形成服务器系统资源池。节点可根据工作负载,按需配置系统资源。不同的处理器可以通过共享计算、内存、存 储、网络和I/O资源最大限度地满足应用负载计算需求。软件定义实现了星河SDC1000内部计算节点间硬件资源的高度共享,可以将服务器的硬件资源集合 到一起并形成统一的资源池,然后根据负载的类型分配所需要的资源,从而达到简约冗余硬件和按需分配硬件资源的目的,有效地提高了资源的利用率。聂先生指 出:“有别于传统通用服务器,星河SDC1000的架构是基于云应用聚集、基于模块化共享的系统资源池等理念,将大量的计算、内存、存储、网络和I/O资 源高效整合在一个标准4U机箱中,利用I/O虚拟化技术和管理软件实现了整机资源的按需灵活配置,减少了冗余资源,提升了整机系统的性能功耗比,达到针对 多样性云应用聚集,实现弹性、高效、按需简约的目标。”
- FPGA即服务
星河SDC1000除具备GPU集成能力外,其本身标配有4颗大容量、高性能可编程FPGA芯片,支持 OpenCL编程环境,用于计算加速、网络互联和存储共享,实现硬件即服务。与其它计算载体如CPU和GPU相比,FPGA具有高性能,低功耗以及可硬件 编程的特点。FPGA通常把算法的数据流以及执行指令固化在硬件逻辑中,从而避免了CPU的指令Fetch和Decode工作,减少了这些流水线工序后也 节省了不少计算时间。虽然FPGA的频率一般比CPU低,但是可以用FPGA实现并行度很大的硬件计算器,在FPGA上使用数据并行的方法可以每次处理 256个或者更多的指令,可以处理比CPU多得多的数据量。FPGA具有低功耗、高性能以及可编程等特性,十分适合算法加速(neural algorithms, financial, bio-Science, oil & gas, recognition, imaging, search等)、网络加速(virtualization, encryption, compression, deduplication, DPI, CPU offload, low-latency network等)和数据访存加速(data analytics, filtering, compression, O/S & driver bypass, NVMe)。
- 基于3D Torus的高可扩展性
星河SDC1000 自身具备100G以太网二层交换路由能力,可通过在内部节点间建立高速链路实现运行中的最大化简约,从而可大大降低服务器的运维成本和功耗。多台星河 SDC1000可通过100G以太网进行3DTorus互连在一起,实现单机柜、多机柜的弹性扩展。“这种扩展不需要外接交换机,没有性能瓶颈。”聂先生 介绍说,“星河SDC1000的3D Torus网络结构突破了传统服务器在互联网环境下的服务能力限制,并在有效的网络管理的前提下,大幅度提升了服务器服务能力,实现高并发服务能力的设计 目标。”目前,曙光公司已基于星河SDC1000服务器,采用4x4x4 3D Torus100G以太网互联网路,搭建了64台服务器规模的支撑中国云示范应用的低成本、低功耗、高效能的曙光云服务器集群系统,实现了亿级并发处理能 了,系统最大功耗160KW,系统性能功耗比和整体服务能力较现有水平提升10倍。
- 引领行业技术发展
星河SDC1000是面向云计算典型应用需求,在国家863课题支持下,联合国内外知名高校、研究院 所、芯片和半导体器件制造巨头,共同研制的新一代服务器系统。星河SDC1000不但以其高的性能功耗比、性能价格比和整体服务能力满足云计算、大数据分 析和深度学习的需要,而且它的技术创新与设计理念对整个服务器行业的发展有着重要引领作用,对云计算等相关行业、国家标准的制定都有着重要的推动和参考意 义。围绕星河SDC1000国内正在形成产学研用生态链条,与中国教育电视台果实网、中国电信和中国银联联合开展示范应用,国际上正在与众多芯片厂商开展 前沿技术开发合作。
作为新一代服务器, 星河SDC1000弹性、异构、按需简约的设计理念,软件定义体系结构,模块化开放兼容性设计,灵活可扩展性、软件生态系统兼容性、高性能功耗比和高性能 价格比等特点,使其成为当下服务器发展中的里程碑,誉为继机架式服务器、刀片服务器后的融合架构标志性服务器产品。
“目前,我国高并发通用服务器已经在体系结构、处理器、云编程模型、云支撑环境、高效能等方面取得了显著成就,但传统服务器体系结构和云计算应用负载特性间仍然存在不匹配现象,无法很好地解决云计算诸多挑战性问题。”聂先生说,“市场呼唤适合云计算的高性能服务器。”
原文发布时间为:2016-06-22