NERSC扩展深度学习计算能力达15千万亿次FLOPS

Intel、斯坦福大学和美国国家能源研究科学计算中心(NERSC,National Energy Research Scientific Computing Center)近期宣布实现了首个15千万亿次浮点运算(PetaFLOPS)计算能力的超级计算集群。该工作成果以论文发表,名为“以15千万亿次FLOPS运行深度学习:科学数据的监督和半监督分类”(Deep Learning at 15PF: Supervised and Semi-Supervised Classification for Scientific Data)。据论文介绍,该工作使用由9622个1.4GHz Intel至强融核(Phi)处理器所组成的集群,以物理和气象数据集为训练数据做深度学习运算,达到了11.41至13.47千万亿次FLOPS的平均持久性能,峰值性能在采用单精度时达15.07千万亿次FLOPS。实验使用的是NERSC的Cori Phase-II 超级计算集群,该集群有9668个节点,每个节点有68核,每个核支持4个硬件线程(相当于每个节点272核),整个集群支持2,629,696个线程。

论文给出的最突出贡献是达到了75%的扩展因子,在具有9600个节点的集群上取得了7205倍的加速。完全扩展(即100%扩展,或线性扩展)时可达9600倍的加速。

这一结果的取得要部分归功于斯坦福大学计算机科学系Christopher Ré教授研究小组的工作。该研究小组的工作提出了对人工神经网络(ANN,Artificial Neural Network)参数同步更新和异步更新的支持。

同步屏障(Synchronisation Barrier)通常是机器学习等算法在并行化时所面对的一个严重障碍。当多个节点同步地计算一个任务时,任一节点的短暂挂机将延缓并阻塞所有计算中的节点。这在分布式系统中被为“拖后者(Straggler)效应”。困扰同步系统的另一个问题是,如果批处理的计算规模下降,那么同步系统的性能也会随之下降。在大规模并发集群中,正如上面所介绍的集群,这将构成严重的问题。百度提供的DeepBench基准测试框架表明,当批处理的规模下降时,峰值FLOPS性能可下降25~30%。整体性能下降的时间复杂度符合O(log(M)),其中M是集群中节点个数。

另一方面,异步深度学习系统需要更多次的迭代(因此也需要更多的计算)才能收敛到一个解。这是由于不好的统计效率所导致的,该问题被称为“过时”(Staleness)问题。此外,异步系统还具有无法收敛到一个解的风险。针对该问题,Christopher Ré研究小组的Ioannis Mitliagkas指出,在目标函数是正确的情况下,如果参数调优存在错误,很可能无法收敛。

两种模型各具缺点和高效之处,这启发研究人员引入了一种混合方法解决问题。在该方法中,数个节点组成一个小规模的计算组,同一计算组中的各个节点是同步工作的,目标是对模型做一次更新。各个计算组与一个中心化的参数服务器做异步交互,很好地利用了同步方式和异步方式。

该混合方法抑制了“拖后者效应”。相比于同步方式,它提供了至少1.66倍到最高10倍的速度增加。此外,采用该方法的系统表现出强可扩展性(strong scaling)的特性,可扩展到1024个节点,其中同步方式在512个节点的规模停止扩展。强可扩展性是指在保持问题规模一定的情况下增加处理器的数量,Mitliagkas指出,强可扩展性是机器学习问题中的常见用例。

该算法已进一步用于解决实际的科学问题。一个应用就是学习如何从背景事件中分离出罕见的新粒子信号,该应用可用于理解宇宙的本质。其它的应用还包括气象数据中的特性识别,这使得研究人员可以标定气候改变中发生极端气候的频率和强度。
本文转自d1net(转载)

时间: 2024-09-28 13:04:01

NERSC扩展深度学习计算能力达15千万亿次FLOPS的相关文章

我国电子商务高速发展 明年交易额达15万亿元

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 在京开幕的第二届中国国际电子商务应用博览会上了解到,我国电子商务事业已经进入高速发展期,目前以每年高于70%的速度持续增长,预计到2010年电子商务交易额将达15万亿元. 参加本届博览会的业内专家认为,中国电子商务从单纯的电子数据交换发展至今已经成为涵盖贸易全流程的新型网络贸易形式,随着中国电子商务基础设施的不断完善,制约中国电子商务发展的网

LED户外广告今年可望达15.5亿元

5月8日,易观国际发布的<中国LED户外电子屏广告市场研究报告2012>透露,到2015年,中国户外LED显示屏广告市场规模将超过27亿元.LED户外广告的高速扩张将进一步挤压平面户外广告生存空间. LED户外广告由于其冲击力强.具备互动性等特点,近年来在户外广告中市场份额呈两位数增长.凤凰都市传媒市场营销中心副总经理高凌向<第一财经日报>记者称,2011年中国LED户外电子显示屏广告市场规模达到12.15亿元,较上年增长了35.5%.而2011年我国户外广告投放总额达515亿元,

2011年中国移动搜索市场扩增收入将达15.1亿元

受3G商用及移动搜索商业模式逐渐多元化的影响,二0一一年中国移动搜索市场将步入理性成长期,届时中国移动搜索市场收入规模将达到十五点一亿元.中国是世界最大的移动搜索市场. 中国手机网站先行者.唔箜搜索创始人兼CEO杨宁今日在接受记者采访时透露,今年第三季度中国无线搜索量达二点九六亿次,环比增长百分之八点八.移动和互联网融合的发展趋势,注定了移动搜索将成为未来搜索技术的发展方向,而对赢利模式的构建,将有助于突围而出.赢在起点.他认为,搜索引擎需要个性,技术是需要细分市场的,而目前的搜索提供的服务还不

专访 | 杨强教授谈CCAI、深度学习泡沫与人工智能入门

7 月 22 - 23 日,由中国人工智能学会.阿里巴巴集团 & 蚂蚁金服主办,CSDN.中国科学院自动化研究所承办,作为独家直播合作伙伴的第三届中国人工智能大会(CCAI 2017)将在杭州国际会议中心盛大开幕. 作为大会主席,香港科技大学计算机与工程系主任.AAAI Fellow 杨强教授最近接受了大会记者专访.这次访谈干货满满,其中有不少话题是杨强教授首度公开谈及,比如下一个 AI 突破口.深度学习泡沫.AI 之路心得.本科生入门 AI.好学生要能教导师学习,等等. (点击阅读杨强教授历史

阿里云异构计算平台——加速AI深度学习创新

云栖TechDay第36期,阿里云高级产品专家霁荣带来"阿里云异构计算平台--加速AI深度学习创新"的演讲.本文主要从深度学习催生强大计算力需求开始谈起,包括GPU的适用场景,进而引出了弹性GPU服务--EGS(Elastic GPU Service),重点讲解了EGS的优势.EGS监控以及EGS产品家族,最后对EGS支撑AI智能创新进行了总结.以下是精彩内容整理:   基于大数据的深度学习催生强大计算力需求 怎样加速AI深度学习支撑,帮助大家搭建模型,支撑大家业务运营等等. 如图,深

OpenAI 教你如何构建深度学习研究的基础设施

编者按:OpenAI研究工程师Vicki Cheung, Jonas Schneider , Ilya Sutskever, and Greg Brockman在本文中分享了从事Deep Learning研究工作所需要的基础设施(软件.硬件.配置和编制),举例说明如何运用开源Kubernetes-ec2-autoscaler自动扩展深度学习研究中的网络模型,将有助于广大深度学习研究爱好者构建自己的深度学习基础设施. 深度学习是一门实证科学,一个研究团队的基础设施建设将对未来的研究工作产生重大影响

IBM突破性分布式计算:搞定深度学习负载

本文讲的是 IBM突破性分布式计算:搞定深度学习负载,为什么深度学习会是计算机的"杀手级应用"? IBM是怎么找到分布式计算来加快大数据人工智能工作负载处理速度的? 总的来说,这听起来足够简单:你有一台大型快速服务器在处理人工智能相关的大数据工作负载.然后需求变了,更多数据需要添加进来才能在一定时限内完成任务.逻辑上讲,你需要做的,就是添加更多的处理能力而已. 然而,就像流行表情包里说的一样:"臣妾做不到啊!" 没错,直到今天,添加更多的服务器是解决不了这个问题的.

深度 | 做到这些值4亿美元:看 Nervana 如何利用深度学习实现数据革命

2016 年 8 月,英特尔为了加强其人工智能领域的能力,以 4 亿美元的天价收购了机器学习初创公司 Nervana .该初创公司成立仅仅两年,却被公认为是机器学习技术开发的领导者.近日,Nervana 的联合创始人兼首席执行官 Naveen Rao 博士在 StrataHadoop 上和大家深入探讨了深度学习的话题,通过其PPT,我们也能了解Nervana价值所在. Naveen 探索了许多方面,包括深度学习相对于其他机器学习技术的好处.该领域的最新进展.深入学习工作流程.开发和部署深度学习解

美国正在研制20千万亿次的超级计算机

2010年11月17日 国际报道:美国目前正在研制两台计算能力达到20千万亿次的http://www.aliyun.com/zixun/aggregation/13840.html">超级计算机,计算能力比目前世界上所有的超级计算机都要强大数倍,包括在本周揭晓的世界超级计算机500强排行榜中荣膺世界上最快计算机桂冠的中国产超级计算机-天河一号也在内. 美国 Lawrence Livermore 国家实验室的Don Johnston表示,目前美国正在开发下一代超级计算机,但是这些计算机想要登