IBM:最新突破将大幅提升深度学习速度

近年来,处理器技术进入如此大,一个像U盘那么大的设备现在都可以用于为神经网络提供能量。但是,企业通常很难充分发挥其计算能力,因为实施大规模人工智能过程中还存在的根本挑战。

这个问题和可扩展性有关,本周二IBM发布了一种名为分布式深度学习(Distributed Deep Learning,DDL)的软件库来解决这个问题。深度学习是机器学习的一个子集,旨在教计算机以人类相同的方式进行学习。例如,人们不会通过描述这个生物有4条腿、1个鼻子和1条尾巴的事实来识别出这是一只狗。一旦人们知道狗是什么样子,就会与猫做永久性的区分。深度学习试图在软件中复制这种方法。

大多数深度学习的框架都支持跨多个服务器扩展大型模式的能力,很多现在也支持GPU,但是收集和同步分析结果的方式还远远不够,IBM研究部门总监Hillery Hunter表示。

同步的工作流

深度学习模式运行在计算机集群上,通过GPU进行增强,GPU芯片有数百万个分布式和互相关联的处理元素,其作用大致类似于人类大脑中的神经元。这些人造神经元一起处理信息,就像人类的部分一样,每个神经元都处理一小部分数据。当节点完成计算的时候,结果将同步在其他神经网络上,以帮助协调工作。

在IBM看来,这就是瓶颈所在。人造神经元部署运行在越快的GPU上,完成计算的速度就越快,意味着结果的同步更加频繁。由于AI集群的构建方式,如果环境中芯片的数量增加,同样适用。但是深度学习框架只能频繁地同步数据。

因此,处理速度收到了数据在GPU之间传输的限制。DDL利用所谓的多层通信算法来改变这一平衡。这个软件库修改信息发送通过的网络路径,以实现延迟和带宽之间“最优化”的平衡,让通信不再是主要的瓶颈。

创纪录的性能

在一次内部测试中,IBM在一个有数百个GPU的集群上部署了DDL,并从一个受欢迎的研究数据集中发送处理750万个图像,将其分到22000个分类中的一个或者多个。该模型在经过7个小时的训练之后,可准确识别33.8%的对象,打包了之前微软在经过10天训练之后创下的29.8%的纪录。

如果4%的改进听起来不足为奇,而且整体成功率还比较低,这是因为这个模型远比现实中遇到的更为复杂,IBM高性能计算及人工智能副总裁Sumit Gupta表示。所以改进是循序渐进的,他指出,微软此前的纪录只比上一次改进了0.8%。这个基准测试旨在强调深度学习软件,以证明研究人员真正构建了更好的模型。

DDL在训练人工智能开发的过程中尤其有用,这是整个项目生命中其中占用时间最长的之一。有时候模型需要花费几周甚至几个月的时间来处理样品数据,才能变得足够准确用于生产中。IBM称,在某些情况下IBM的软件库可以将这个过程缩短至几个小时。“如果需要16天时间训练一个模型如何识别新的信用卡,那么这16天你就是在亏本的。”

深度学习在医疗场景中也很有用,例如组织分析,长时间的训练关于生存或者死亡的问题。此外还有其他好处,如果一个深度学习模型可以在数小时而不是数周时间内完成训练,那么就能释放企业的人工智能基础设施,用于更快地完成其他项目和其他工作。

IBM还另外展示了如何利用DDL实现95%的扩展效率,相比之下Facebook在此前的测试中记录是89%。这两个测试都使用了相同的样本数据。

IBM表示,DDL帮助企业培训他们的模型,实现此前由于时间限制而无法实现的速度和范围。它将DDL软件库与所有主流深度学习框架相连接,包括TensorFlow、Caffee、Chainer、Torch和Theano,都是在一个开源许可下的。

IBM还将这个软件库融入到自己的PowerAI深度学习共计套件平台中,有免费和付费企业两个版本,此外还有在Minbix Minsky Power Cloud上。Gupta表示:“我们将通过PowerAI把它带给每个人。”

原文发布时间为:2017年8月9日 

本文作者:黄雅琦

本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。

时间: 2024-07-31 03:17:58

IBM:最新突破将大幅提升深度学习速度的相关文章

IBM识别癌变细胞技术取得重大突破,用深度学习与神经网络重塑病理学

IBM 最近在医学领域成果喜人,动作不断.继成功用照片诊断皮肤癌后,IBM 研究院日前发布最新成果称,他们采用了深度学习和神经网络,在识别癌变细胞的有丝分裂上取得了巨大进展. 医生在诊断癌变细胞时,主要通过用活组织切片检查法分析病人组织样本的方式.然而即使这些组织有时如针头般微小,病理学家需要从中检测出肿瘤细胞消失的种种迹象,也要观测出癌变细胞出现的重要特征,以帮助医生对症下药. 病理学家在分析样本时,会将一些典型的组织样本用试剂溶液进行着色标记.结果显示,试剂颜色的深浅及其在细胞组织内的分布情

IBM苏中:怎样利用深度学习、增强学习等方法提高信息处理效率

以下是讲座视频实录,后附文字版内容: 文字版干货整理如下: IBM研究院研究总监苏中 苏中:美国的达特茅斯于61年前提出人工智能一词,而人工智能的历史可以向前追溯很长的时间,甚至中国人发明算盘的时候就在思考将计算的机器演化成智能.这一演化进程与人类认识客观规律的过程相类似.通过符号推理,人类体现出早期的智能行为,并认识到世界的规则.以三段论为例,我们在认识世界时,先设定一个大前提或者一个更大的公理,而每件事情都有一个特例,根据这个公理和特例就可以推出一个结论.在很多人工智能的演化中,这方面已取得

吴恩达团队最新成果:用深度学习预测死亡概率,改善临终关怀

用过去1年的医疗记录就能预测一个人未来1年中的死亡概率?这听起来像是<黑镜>中才有的可怕黑科技,但是这对于疗养院和临终关怀工作者,意义重大. 在美国,超过60%的死亡发生在重症监护病房,多数人在弥留之际仍接受侵入性的治疗.进入重症监护病房的病人通常会提前记录自己的临终心愿,"再和爱人吃一顿晚餐","参加子女的婚礼".而提前知道临终日才能让他们在仍然有行动能力的时候达成心愿,更有尊严的过完最后的日子. 近期,吴恩达团队用深度学习建立了一个项目,利用病人的电

IBM宣布深度学习取得重大突破 大幅降低处理时间

IBM一直在努力促使计算机变得更智能化.更人性化.本周该公司宣布,已经开发出一种技术,可以大幅缩短处理海量数据并得出有用结论的时间. IBM使用的"深度学习"技术是人工智能(AI)的一个分支,可模仿人脑的工作原理.它也是微软.Facebook.亚马逊和谷歌的重大关注焦点. IBM的目标是将深度学习系统消化数据所需要的时间从数天缩短到数小时.IBM研究所的IBM研究员和系统加速及记忆主管希拉里·亨特(Hillery Hunter)说,这些改进可以帮助放射学家更快.更准确地找到病变部位,并

Nvidia推出强大的新图形芯片Tesl V100加速进军AI和深度学习的步伐

Nvidia公司携旗下的图形处理器在半导体领域可以说是声名赫赫,Nvidia图形处理器曾为创造最热门的游戏个人电脑立下汗马功劳,而时至今日原来的游戏市场几乎成了后娘的儿子. Nvidia日前在加利福尼亚州圣荷西的GPU技术会议上推出一款强大的新芯片,正如首席执行Jensen Huang黄仁勋(上图)所说的,新芯片的推出标志着下一个计算时代的出现:人工智能的来临,特别是深度学习神经网络的来临,业界最近许多新突破都拜深度学习神经网络所赐,如自驾车和即时语言翻译等. Tesl V100(下图)的计算能

老师木讲架构:深度学习平台技术演进

2017年12月22日,袁进辉(老师木)代表OneFlow团队在全球互联网架构大会上海站做了<深度学习平台技术演进>的报告,小编对报告内容作简要梳理注解,以飨读者. 此次报告的主要观点为:(1)计算力是神经网络/深度学习复兴的最大推动力之一:(2)面对深度学习的计算力挑战,软件至少和硬件一样地关键,单靠硬件无法提供易用性和扩展性:(3)鉴于深度学习上层业务和底层硬件的独特性,传统大数据平台里的某些技术未必再对深度学习平台适用:(4)深度学习软件平台技术在快速演进中,一部分早期被采用的技术正在被

CNCC 人物 | 深度学习处理器领军人物 —— 陈云霁

陈云霁,男,1983 年生,江西南昌人,中国科学院计算技术研究所研究员,博士生导师,CCF 会员,曾获 2014 年度"CCF青年科学家奖".同时,他担任了中国科学院脑科学卓越中心特聘研究员,以及中国科学院大学岗位教授.目前他带领其实验室,研制寒武纪系列深度学习处理器.他在包括 ISCA.HPCA.MICRO.ASPLOS.ICSE.ISSCC.Hot Chips.IJCAI.FPGA.SPAA.IEEE Micro 以及 8 种 IEEE/ACM Trans. 在内的学术会议及期刊上

玩深度学习选哪块英伟达 GPU?有性价比排名还不够!

与"传统" AI 算法相比,深度学习(DL)的计算性能要求,可以说完全在另一个量级上. 而 GPU 的选择,会在根本上决定你的深度学习体验.那么,对于一名 DL 开发者,应该怎么选择合适的 GPU 呢?这篇文章将深入讨论这个问题,聊聊有无必要入手英特尔协处理器 Xeon Phi,并将各主流显卡的性能.性价比制成一目了然的对比图,供大家参考. 先来谈谈选择 GPU 对研究深度学习的意义.更快的 GPU,能帮助新人更快地积累实践经验.更快地掌握技术要领,并把这些应用于新的任务.没有快速的反

浪潮胡雷钧: KNL+FPGA是加速深度学习的黄金搭档

8月17日,在美国旧金山举行的英特尔信息技术峰会(Intel Developer Forum,简称IDF)上,浪潮首席科学家胡雷钧进行了先进技术报告演讲,他结合当前深度学习应用特点和先进计算技术架构进行分析,认为KNL+FPGA是加速深度学习的黄金搭档.   深度学习在人脸识别.语音识别.精准医疗以及无人驾驶等领域被广泛的应用,近年来在高性能计算技术的支持下,其发展十分迅速.然而,深度学习的发展也面临着众多困境,如深度学习软件扩展性不够高.计算性能不够高.深度学习线上识别能耗大等问题. 在多年的