模仿是最真诚的赞美方式。如今,复制大型云服务提供商基础架构建设的理念正值流行。这些大型云服务提供商依赖于下一代硬件平台以提供更好的性能表现,同时价格非常具有竞争力。随着时间的推移,这些云服务提供商不再自我封闭,开始和主流硬件厂商合作,共同推动整个产业向前发展。
这种趋势预示了今年的Open Compute Summit(开放计算峰会)将会十分热闹,肯定不会令我们失望。从主板设计到英特尔的价格竞争再到超高速的LAN,所有人都能够在这里找到自己感兴趣的东西。
Google开放软件
在商用现货(Commercial Off-the-shelf,COTS)服务器CPU领域,谷歌推出了基于IBM Power处理器的服务器,正在挑战英特尔的垄断地位。谷歌以Power处理器为基础对其软件进行了大幅度调整,开放了一些新的配置以实现平台多样化。但是如果真的想要成为英特尔的竞争对手,谷歌还应该将芯片价格控制在较低水平。
IBM不久之后将会推出其下一代Power9 CPU,这是一款拥有24核心,使用14nM FinFET技术的处理器。预计在2017年,这款芯片将增加用于加密和压缩的板载加速器,到时候对于任何英特尔的产品来说其都具有足够的竞争力。美国的两个主要超级计算机项目都在使用Power9,其中之一—Summit的目标是在每秒计算速度方面超过目前全球最快的计算机——中国的天河2号。
Power系列芯片拥有高速IO,使用了NVLink 2.0技术,这对于超级计算来说是一项重要特性。Summit的计算速度能够达到300 petaflop,而其中的大部分都来自于GPU。但是中国在超级计算领域肯定不会停滞不前。现在IBM已经将其Power架构推广到公共领域,有传闻称使用7nM工艺的Power9将会在中国进行生产。
谷歌和Rackspace正在为Open Compute Project(开放计算项目)开发服务器设计:使用Power9 CPU,基于48V rack架构。这意味着英特尔不再拥有对CPU计算能力随意定价的权力,大家开始思考英特尔在COTS服务器领域当中是否依然具有不可逾越的优势。这种趋势能够为激励创新提供必要的压力,而技术发展速度降低的主要原因在于我们不断接近硅的物理特性极限以及英特尔对于市场支配地位的自满。
不再使用交流电
谷歌还发布了仅供内部参考的六个服务器发展蓝图——全部基于48V架构——这种方式能够推动主流市场向前发展。这是谷歌首次进军开放式设计领域,其目标是解决服务器领域所面临的棘手问题。现在主流服务器电源供应是120或者240伏交流电源,意味着服务器需要使用规模庞大但是效率很低的电源供应。
从物理空间和实际效率两方面考虑,云服务提供商已经不再使用交流电源这种方式。对于大规模电源需求来说,可以使用400伏+三相电源,因为这样能够提升10%的效率,并且易于实现冗余。这种电源供应方式可以让服务器更加紧凑,同时减少热量产生,适用于各种情况。如果使用固态电源组件,还可以进一步节约机房空间。假如企业使用Vicor全新的48 Direct-to-PoL模型,那么就不再需要规模庞大,但是效率很低的48伏电源供应。英特尔也在为Open Compute Summit认真进行准备。其从Altera公司收购的FPGA(现场可编程门阵列)技术正在发挥成效,XEON-D芯片当中内置了FPGA。FPGA开放了第三方编程接口,其目的在于为多种环境提供硬件加速器,包括加密和压缩。
对于使用大量NVMe(非易失性存储标准)硬盘的系统来说,英特尔推出了一系列参考设计,最终目标显然是存储和超级融合系统。相比于Power9架构,这种方式非常适合于压力更大的需求。因为NVMe能够支持超过四块硬盘,已经超过现有系统设计的能力。
对于普通用户来说,英特尔Broadwell XEON-D芯片拥有65W、16核心版本,非常适合于拥有一或两个CPU的半宽1U服务器,这种服务器是大部分云和集群的组成部分,这样就能够避开来自ARM处理器的威胁。
在网络前端,由于英特尔使用了PCIe fabrics和Omni-Path技术,因此Mellanox已经感受到了压力。使用多端口交换机的PCIe正在获得越来越多的关注,企业可以借此将多块硬盘连接到一个系统当中。未来其还有可能演变为互连的集群系统,进入InfiniBand所在的领域。
不过,在未来的几年当中,PCIe仍然只能作为一种短距离连接解决方案。这是一种延迟非常低的100Gbps连接技术,看起来非常类似于InfiniBand。不同之处在于英特尔准备提供高端的Knight Landing处理器,并且在CPU上使用Omni-Path架构,明显是瞄准了市场中的高端需求。
在峰会上,Mellanox宣布将InfiniBand和以太网最快速度提升一倍至200Gbps,以此应对英特尔的竞争。虽然比Knight Landing晚了几个月,但是其速度是Omni-Path的两倍,并且在英特尔赶上来之前还有两年时间,因此是一种非常具有吸引力的产品,保证需要最好性能的用户(比如金融交易领域)继续使用自己的产品。
微软开放SONiC
微软也加入到这个竞争行列当中,其推出了一款开源的、基于Linux的网络操作系统,名为SONiC(Software for Open Networking in the Cloud),目的是使用成本更低的白盒交换机。SONiC基于Azure Cloud Switch架构;这是另外一种主要云服提供商将工具集开源的案例。Cavium公司展示了与SONiC兼容的硅交换机,即XPliant系列,总转发带宽为3.2TBbps,单个连接为100Gbps。这种设计将会进一步促进软件定义网络的发展,生产出更为廉价的高性能交换组件,这对于云环境的成本是至关重要的。
存储技术也在不断发展。希捷公司宣称其拥有有史以来速度最快的硬盘。在10Gbps级别,Nytro WarpDrive是一种兼容Open Compute Project的PCIe闪存卡。Diablo和Inspur公司合作发布了NVDIMM-F内存系统,使用超快内存总线作为接口,与英特尔在性能方面形成竞争。这可能是英特尔在下次峰会推出Xpoint内存NVDIMM的前兆。COTS标准已经有拥有十分严格的定义,英特尔向Open Compute兼容服务器当中添加新的内存设计不会出现任何问题。
这些厂商提供的参考设计,对于服务器买家甚至是中端用户来说,将会逐渐成为通用标准。制造商提供的低价和高质量产品,加上COTS的可替代性,都将会显著降低计算方面的开销,并且对IT厂商的未来发展产生重大影响。
本文转自d1net(转载)