浪潮发布GPU 深度学习一体机,大幅提升性能及生产力

美国当地时间11月16日,在盐湖城举行的全球超算大会SC16上,浪潮发布了深度学习一体机D1000,该产品部署了采用NVIDIA Tesla GPU技术的浪潮高性能计算集群,运行多节点并行深度学习框架Caffe-MPI,可大幅提升在人脸识别、图片分类、物体识别等应用场景的深度学习计算性能,并有效提高用户在实际业务使用深度学习的生产力。

 

强强联手产硕果

D1000产品整合了浪潮深度学习领域的最新技术成果,包括浪潮推动开发的并行版开源深度学习框架Caffe-MPI,英伟达专为深度学习定制的Tesla GPU及CuDNN库。浪潮展示了6节点的D1000产品方案,该方案的节点是浪潮专为深度学习开发的专用GPU服务器,每个节点配置2颗处理器及4块NVIDIA Tesla M40 GPU。

 

浪潮集团海外总部副总经理Jay Zhang现场讲解

浪潮集团海外总部副总经理Jay Zhang表示,D1000在性能、扩展性等方面都大幅领先于以往的深度学习方案,可以满足大部分客户的应用需求。浪潮一直在加强深度学习前沿技术开发并致力于构建良好的生态系统,并联合NVIDIA等业界领先技术伙伴,将最新的技术整合为产品方案,转化为用户的实际应用价值。

 

Nvidia解决方案和工程架构副总裁 Marc Hamilton演讲

高性能深度学习框架Caffe-MPI 

   Caffe-MPI是浪潮团队推动开发并开源发布的集群版Caffe,这使得Caffe这一业界最重要的深度学习框架实现了高效多节点并行。Caffe-MPI不仅在单机多GPU方案中表现出高效的训练性能,而且支持分布式集群扩展。浪潮展示了6节点D1000产品方案在配置24块Tesla M40 GPU,并部署Caffe-MPI,训练GoogLeNet(Inception V1)网络,每秒可以处理2000张图片,在短短18小时内将GoogLeNet网络的精确度提高至78%。随着训练时间的增加,Caffe-MPI的正确率将进一步提升。此外,Caffe-MPI具有较高的可扩展性,其节点的扩展效率达到72%,并且Caffe-MPI完全保留了原始Caffe架构的特性,纯粹的C++/CUDA架构,支持命令行、Python和MATLAB接口等多种编程方式,上手快,十分易用。

 

D1000发布现场

让用户专注于业务应用

深度学习正在重新定义什么叫可能性,从初创时期的公司到大型互联网运营商,都在努力把深度学习融入实际业务中来拓展商业边界。Jay Zhang表示,浪潮为客户提供的是开箱即用的深度学习解决方案以及全程贴心服务,把用户从平台部署配置优化等繁琐工作中解放出来。

 

SC16现场吸睛的浪潮产品与方案

据了解,D1000统一整合了经过优化设计的浪潮高性能计算集群硬件、Caffe-MPI并行计算框架和依赖库、经过充分测试验证的OS和CUDA环境及集群管理调度平台 ClusterEngine,产品实现在产线进行软硬件一体化安装、配置,用户打开D1000即可使用Caffe-MPI进行深度学习业务应用。

原文发布时间为: 2016年11月17日

时间: 2024-10-31 10:34:29

浪潮发布GPU 深度学习一体机,大幅提升性能及生产力的相关文章

布局行业大数据 浪潮发布金融大数据一体机

[天极网服务器频道3月19日消息]3月18日,浪潮在京举行新闻发布会,正式推出国内首款面向金融行业的大数据定制机--浪潮云海金融大数据一体机.该产品是浪潮集团与国内领先的金融信息化解决方案供应商南天信息联合推出面向金融行业的大数据挖掘.分析平台. 在过去的2013年,中国金融界热议最多的或许是互联网金融,互联网金融背后涉及的就是金融大数据的应用.浪潮是大数据处理平台的领先厂商,南天是金融行业的领先独立应用开发商,双方在大数据领域的见解一致,强强联合,深入合作. 当前,互联网金融模式正深刻影响着我

Nervana 开源深度学习软件,性能超 Facebook、Nvidia产品

Nervana System是少数专注机器学习这种人工智能技术的创业公司该公司,近日宣布将其深度学习软件在Apache开源许可协议下开源(github),任何人都可以免费下载使用.根据Facebook一位研究者的基准测试,Nervana的软件比业界知名的深度学习工具性能都要高,包括Facebook自己的Torch7和Nvidia的cuDNN. 深度学习时人工智能技术的热门领域,目前谷歌.微软和百度等互联网巨头在深度学习也都投入重金研发.而不少深度学习创业公司也都遭巨头们纷纷抢购,例如Madbit

GTC16浪潮展示多形态深度学习服务器

美国当地时间4月5日,2016 GPU技术大会(GTC2016)在硅谷正式开幕,浪潮发布面向深度学习的三大计划并现场展示了NF5280M4.NX5460M4 两大异构计算平台,为不同规模.不同应用场景的用户提供高效的异构计算硬件基础设施选择. NF5280M4,"冠军级"异构计算平台 NF5280M4是一款企业级的服务器产品,具有超强的扩展能力,可以支持2块GPU, 这款经典机型也一直伴随中国大学生超算代表队征战ASC.ISC和SC世界三大超算赛事并屡获殊荣,新加坡南洋理工大学曾在AS

浪潮发布业界最高GPU密度的SR-AI整机柜

 在不久前结束的2017浪潮云数据中心全国合作伙伴大会(IPF)上,浪潮秉承坚持围绕"计算+"战略,进一步明确业务重心,聚焦智慧计算,发展开放融合的计算生态,建立智慧计算市场的领导力. 智慧计算的未来在商业应用, 随着人工智能应用的快速发展,AI所需的计算力也急剧攀升.此前,浪潮就已在AI计算平台.架构领域布局,拥有业界完整的支持2.4.8 GPU卡的异构超算服务器阵列.而本次IPF上,浪潮发布了业界最高密度的.单机点支持16块GPU卡的SR-AI整机柜,进一步优化了AI计算硬件架构,

NVIDIA令深度学习训练性能翻一番

NVIDIA发布了其 GPU 加速深度学习软件的更新版本,这些软件将令深度学习训练的性能翻一番. 新软件将让数据科学家和研究人员能够通过更快的模型训练和更复杂的模型设计来创造更准确的神经网络,从而加速其深度学习项目和产品的开发工作. NVIDIA DIGITS  深度学习 GPU 训练系统第 2 版 (DIGITS 2) 和 NVIDIA CUDA 深度神经网络库第 3 版 (cuDNN 3) 可提供大幅提升的性能和全新的功能. 对数据科学家来说,DIGITS 2 现在能够在多颗高性能 GPU

全球GPU盛会,曙光秀深度学习“肌肉”

GPU领域中最大的学术和商业交流盛会,2016年GPU技术大会(GTC2016)于当地时间4月4-7日在美国硅谷圣何塞举行,此次大会总共吸引全球超过四千人参加,预计将会有超过240场的主题讲座登场,上百位的全球媒体.分析师到场,多达两百家厂商参展. 据悉,今年活动主题将聚焦人工智慧(AI).VR/AR.无人汽车的应用.总计4天的技术大会由NVIDIA联合创始人和CEO黄仁勋亲自揭开序幕,并在大会上公布了NVIDIA全新深度学习服务器-DGX-1.全新的深度学习服务器DGX-1相比较于传统的服务器

玩深度学习选哪块英伟达 GPU?有性价比排名还不够!

与"传统" AI 算法相比,深度学习(DL)的计算性能要求,可以说完全在另一个量级上. 而 GPU 的选择,会在根本上决定你的深度学习体验.那么,对于一名 DL 开发者,应该怎么选择合适的 GPU 呢?这篇文章将深入讨论这个问题,聊聊有无必要入手英特尔协处理器 Xeon Phi,并将各主流显卡的性能.性价比制成一目了然的对比图,供大家参考. 先来谈谈选择 GPU 对研究深度学习的意义.更快的 GPU,能帮助新人更快地积累实践经验.更快地掌握技术要领,并把这些应用于新的任务.没有快速的反

【20 亿美元赌注】英伟达推出深度学习芯片,人工智能进入主流时代

硬件能力 基于GPU并行处理的优势,Tesla P100能够实现数百CPU服务器节点性能.DGX-1采用NVIDIA新Pascal架构的Tesla P100显卡系列,数据处理速度是NVIDIA 此前Maxwell架构--才刚于2014年推出 --显卡系列的12倍.据NVIDIA官网消息,DGX-1共装入8组各内建16BG存储器的Tesla P100显卡,配置英特尔 E5-2698 v3 处理器,7 TB的SSD硬盘用作深度学习高速缓存,系统存储器部分最大可支持512GB DDR4的内存容量,半精

IBM突破性分布式计算:搞定深度学习负载

本文讲的是 IBM突破性分布式计算:搞定深度学习负载,为什么深度学习会是计算机的"杀手级应用"? IBM是怎么找到分布式计算来加快大数据人工智能工作负载处理速度的? 总的来说,这听起来足够简单:你有一台大型快速服务器在处理人工智能相关的大数据工作负载.然后需求变了,更多数据需要添加进来才能在一定时限内完成任务.逻辑上讲,你需要做的,就是添加更多的处理能力而已. 然而,就像流行表情包里说的一样:"臣妾做不到啊!" 没错,直到今天,添加更多的服务器是解决不了这个问题的.