Cray推出用于人工智能的集群超级计算机CS-风暴 500GT及500NX

 Cray新推出的CS风暴加速集群超级计算机包括Cray CS-风暴 500GT和Cray CS-风暴 500NX两个型号,CS风暴加速集群超级计算机利用大量图形处理器单元(GPU)加速器Nvidia Tesla阵列做超级深度机器学习用,大大 提升了人工智能(AI)功能。

影片连结:https://www.youtube.com/watch?list=PLirJ3rHY8PMwNKBgOfdYn_tx4uan_RZYu&v=48elFB19Oco

Cray为旗下超级计算机深度学习投入大量资源。

Nvidia GPU用于深度学习几乎可以达到线性加速的效果,高达35,840个Cuda GPU可用于AI应用程序的分割和征服法。 Nvidia加速器可以在500GT上与最新的英特尔Xeon“Skylake”处理器很好地整合在一起,而在500NX上则可以很好地与英特尔Xeon E5-2600 v4“Broadwell”处理器紧密整合。 Nvidia Tesla P40或P100 PCIe GPU加速器可用于500GT,而500NX则支持Nvidia Tesla P100 SXM2 GPU加速器。

新的Cray CS风暴 500GT和CS-风暴 500NX针对人造智能进行了优化,内置用于深度机器学习的大型Nvidia Tesla图形处理器加速器阵列。

Cray CS风暴系列运算速度高达每节点每秒187 TERA操作(TOPS),即是说每个用于深度机器学习应用的标准机架的运算速度高达2.618  TOPS。两台超级计算机都使用标准Cray编程环境、Sonexion横向扩展存储和集群管理算法。

Cray在旗下超级计算机用于深度机器学习应用方面投入了重大资源。Cray在不同型号上均提供提供Nvidia加速器和英特尔Xeon Phi加速器(尽管各型号都使用Intel Xeon作为主要处理器,除了较老的、基于CPU机器学习的Cray Urika-GX分析平台用的是Spark MLlib和Cray 图形引擎)。

原文发布时间为:2017年5月13日

本文作者:黄雅琦

时间: 2024-10-27 23:20:39

Cray推出用于人工智能的集群超级计算机CS-风暴 500GT及500NX的相关文章

云扩展,第1部分: 构建计算节点或小型集群应用并利用 HPC 进行扩展

根据需要利用仓库规模(warehouse-scale)计算 具有自定义扩展的处理器核心和共享的内存互联网络的外来 HPC 架构正迅速被按需集群所取代,这些集群利用了现成的一般用途向量协同处理器.融合的以太网(每个链路 40 Gbit/s 或更高速度)和多核无头(headless )服务器.这些新的按需云 HPC 资源类似于所谓的仓库规模计算(warehouse-scale computing),其中每个节点都是同类和无头的,关注的是总体拥有成本和总体电源使用效率.但是,HPC 拥有解决超出类似社

构建小型集群根据需要利用仓库规模(warehouse-scale)计算

该方法允许架构师在本地完成构建,以便提供预期的工作负载,并溢出到按需云 HPC 来应对峰值负载.第 1 部分重点介绍系统构建者和 HPC 应用程序开发人员如何最高效地扩展您的系统和应用程序. 具有自定义扩展的处理器核心和共享的内存互联网络的外来 HPC 架构正迅速被按需集群所取代,这些集群利用了现成的一般用途向量协同处理器.融合的以太网(每个链路 40 Gbit/s 或更高速度)和多核无头(headless )服务器.这些新的按需云 HPC 资源类似于所谓的仓库规模计算(warehouse-sc

在虚拟环境下配置集群及故障恢复体系

虚拟数据中心的高可用性(HA)是一个多层次的任务,它涉及到在线备份(live backup).故障恢复功能或集群等等.在本文中,将探讨如何在虚拟环境下配置集群 (cluster),建立故障恢复体系(failover structure). 虚拟化的高可用性有两个层面.我们既可以在子机层操作,依赖OS和应用灾难恢复能力:也可以在主机层操作,从而面对一系列新的问题. 在子机层执行HA配置的过程几乎与在物理机环境下一样,需要解决一些技术问题.例如,为每个虚拟网络接口设置静态MAC地址.此外,还需要突破

Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之ORACLE集群概念和原理(二)

ORACLE集群概念和原理(二) Oracle集群概念和原理 Oracle的三种高可用集群方案 1 RAC(Real Application Clusters)                         多个Oracle服务器组成一个共享的Cache,而这些Oracle服务器共享一个基于网络的存储.这个系统可以容忍单机/或是多机失败.不过系统内部的多个节点需要高速网络互连,基本上也就是要全部东西放在在一个机房内,或者说一个数据中心内.如果机房出故障,比如网络不通,那就坏了.所以仅仅用RAC

【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之RAC 工作原理和相关组件(三)

RAC 工作原理和相关组件(三) RAC 工作原理和相关组件       OracleRAC 是多个单实例在配置意义上的扩展,实现由两个或者多个节点(实例)使用一个共同的共享数据库(例如,一个数据库同时安装多个实例并打开).在这种情况下,每一个单独的实例有它自己的 cpu 和物理内存,也有自己的 SGA 和后台进程.和传统的 oracle 实例相比,在系统全局区(SYSTEM CLOBAL AREA,SGA)与后台进程有着显著的不同.最大的不同之处在于多了一个GRD,GRD内存块主要是记录此ra

又是干货,这个春节感觉吃饱了。各方面---RHCS集群理论

什么是集群?     集群是一组(>2)相互独立的,通过高速网络互联的计算机组成的集合.群集一般可以分为科学集群,负载均衡集群,高可用性集群三大类.     科学集群是并行计算的基础.它对外就好象一个超级计算机,这种计算机内部由十至上万个独立处理器组成,并且在公共消息传递层上进行通信以运行并发应用程序,像中国的银河,曙光超级计算机.     高可用性集群,当集群中的一个系统发生故障时,集群软件迅速作出反应,将该系统的任务分配至集群中其它正在工作的系统上执行,通过消除单一故障点和节点故障转移功能来

oracle集群

  使用Oracle 真正应用集群 (RAC),Oracle数据库可跨一组集群服务器运行任何打包的或自定义的应用程序,不需对这些应用程序做任何改动.这就提供了最高的可用性和最灵活的可伸缩性.如果集群中的一个服务器故障,Oracle 可继续在其余的服务器上运行.当我们需要更多的处理能力时,只需添加服务器即可,无需用户下线.为保证低成本,我们可使用标准化的普通硬件组建出最高端的系统.     Oracle 真正应用集群为 Oracle 的企业网格计算体系结构提供了基础.Oracle RAC 技术可为

高可用集群HA及负载均衡集群LB的实现方法

集群是个热门话题,在企业中越来越多地应用Linux操作系统提供邮件.Web.文件存储.数据库等服务,随着Linux应用的日益增长,高可用及http://www.aliyun.com/zixun/aggregation/13996.html">负载均衡Linux集群也在企业中逐步地发展起来.Linux平台的低成本.高性能.高扩展性使得Linux集群能够以低廉的价格很好地满足各种应用的需求. 本文介绍Linux集群的基础知识,集群的分类.在熟悉集群的基础知识后会以RHCS(RedHat Clu

《Hadoop集群与安全》一1.1 选择Hadoop集群硬件

1.1 选择Hadoop集群硬件 Hadoop是可扩展的集群,它采用非共享系统处理大规模并行数据.Hadoop的总体概念是单个节点对于整个集群的稳定性和性能来说并不重要.根据这种设计理念,我们可以在单个节点上选择能够高效处理少量(相对于整体的数据量大小)数据的硬件并且在硬件层面也无需过分追求稳定性和冗余性.读者可能已经知道,Hadoop集群由多种类型的服务器所组成.它们中有主节点,比如NameNode.备份NameNode以及JobTracker,还有称为DataNode的工作节点.除了核心的H