避免关注底层硬件,Nvidia将机器学习与GPU绑定

【编者按】Nvidia通过发布cuDNN库,将GPU和机器学习更加紧密的联系起来,同时实现了cuDNN与深度学习框架的直接整合,使得研究员能够在这些框架上无缝利用GPU,忽略深度学习系统中的底层优化,更多的关注于更高级的机器学习问题。

以下为译文

近日,通过释放一组名为cuDNN的库,Nvidia将GPU与机器学习联系的更加紧密。据悉,cuDNN可以与当下的流行深度学习框架直接整合。Nvidia承诺,cuDNN可以帮助用户更加聚焦深度神经网络,避免在硬件性能优化上的苦工。

当下,深度学习已经被越来越多的大型网络公司、研究员,甚至是创业公司用于提升AI能力,代表性的有计算机视觉、文本检索及语音识别。而包括计算机视觉等流行的领域都使用了图形处理单元(GPU),因为每个GPU都包含了上千的核心,它们可以加快计算密集型算法。

通过Nvidia了解到,cuDNN基于该公司的CUDA并行编程语言,可以在不涉及到模型的情况下与多种深度学习框架整合。Nvidia的一位发言人透露了更多消息:

通过在Caffe、Theano、Torch7等主流机器学习框架上的研究,cuDNN允许研究员可以在这些框架上无缝利用GPU的能力,并预留了未来的发展空间。举个例子:在Caffe中整合cuDNN对终端用户是不可见,只需要非常简单的设置就可以完成这个操作,即插即用是cuDNN的核心设计因素。

从更技术的角度看,cuDNN是一个低等级的库,无需任何CUDA代码就可以在host-code中调用,非常类似我们已经开发的CUDA cuBLAS和cuFFT库。通过cuDNN,用户不必再关心以往深度学习系统中的底层优化,他们可以将注意力集中在更高级的机器学习问题,推动机器学习的发展。同时基于cuDNN,代码将以更快的速度运行。

不管是为了未来增长,还是“GPU不只用于计算机图形渲染”这个长期目标,Nvidia在拥抱深度学习和机器学习上非常积极。当下GPU的使用已经非常广泛,机构使用它代替CPU以获得更高的速度及更低的成本。

但是,仍然存在一些特定的因素抑制了CPU的长期发展。其中一个就是替代架构,比如IBM的SyNAPSE和类似Nervana Systems一些初创公司的努力,比如,它们专门为神经网络和机器学习负载设计。另一个则是现有的处理器架构,包括CPUs和FPGAs已经让人们看到了未来机器学习负载上的能力。

虽然当下已经有很多云供应商通过服务的形式提供了深度学习能力,但是机器深度学习离进入主流仍然有很大的距离。

原文链接: Nvidia stakes its claim in deep learning by making its GPUs easier to program(编译/仲浩 审校/魏伟)

免费订阅“CSDN云计算(左)和CSDN大数据(右)”微信公众号,实时掌握第一手云中消息,了解最新的大数据进展!

CSDN发布虚拟化、Docker、OpenStack、CloudStack、数据中心等相关云计算资讯,     分享Hadoop、Spark、NoSQL/NewSQL、HBase、Impala、内存计算、流计算、机器学习和智能算法等相关大数据观点,提供云计算和大数据技术、平台、实践和产业信息等服务。

时间: 2024-09-19 05:19:24

避免关注底层硬件,Nvidia将机器学习与GPU绑定的相关文章

求手机开发方面操作系统与底层硬件通讯的问题

问题描述 求手机开发方面操作系统与底层硬件通讯的问题最近一直在考虑实现把手机的硬件信息,比如GPS的经纬度信息通过GPRS网络上传到服务器,想做一个通用的程序,但有几个问题始终找不到答案:1.如果有基于芯片级别的汇编程序能实现GPS芯片数据采集然后通过GPRS模块上传服务器的功能,这个程序需要手机只要开机,就自动运行.那这个程序怎么安装到手机上?,可以通过WAP下载到手机本地上么?2.手机上有2个程序需要同时使用GPRS网络,一个是WAP,一个是上传GPS信息,那如果使用基于硬件的程序,会不会导

少数几位关注智能硬件的记者展示了路由器的真机

360昨天给少数几位关注智能硬件的记者展示了路由器的真机,这次360没有像儿童手环那次高调,周鸿祎亲自站台呼喊,大谈智能硬件"免费时代"到来.有的,只是产品经理谨慎的介绍,因为还有很多方面没有最终敲定,比如价格. 可以明确的有这几点,我以七个疑问来解答: 1.360为什么要做路由器? 虽然360搬出了国家推动信息产业变革的官方说辞,但最关键的还是未来路由器将是家庭信息和数据交换的中枢,是互联网访问的关键节点,360也要抢这个入口. 所以360对未来路由器的定位是4点:家庭网络入口,网络

MakerVoice是为关注新硬件的朋友们准备的一个栏目

MakerVoice是为关注新硬件的朋友们准备的一个栏目,初期的形态是每天一篇文章,梳理总结一天下来新硬件行业的精华内容,可能是有意思的产品,也可能是引人思考的观点,目标是让朋友们能用最短时间在这里遍览真正值得关注的内容.So,enjoy! 目前在做智能家居基本上有两个思路: 1. 以家庭 WIFI 为基础,来控制家居: 2. 通过中央控制器来控制其他家居,实现智能. 中央控制器通常通过蓝牙,帮助用户实现短距离内的控制,而一旦中央控制器失效,即会对家居控制造成影响.另一方面,插座这样的产品价格便

360昨天给少数几位关注智能硬件的记者展示了 路由器 的真机

360昨天给少数几位关注智能硬件的记者展示了路由器的真机,这次360没有像儿童手环那次高调,周鸿祎亲自站台呼喊,大谈智能硬件"免费时代"到来.有的,只是产品经理谨慎的介绍,因为还有很多方面没有最终敲定,比如价格. 可以明确的有这几点,我以七个疑问来解答: 1.360为什么要做路由器? 虽然360搬出了国家推动信息产业变革的官方说辞,但最关键的还是未来路由器将是家庭信息和数据交换的中枢,是互联网访问的关键节点,360也要抢这个入口. 所以360对未来路由器的定位是4点:家庭网络入口,网络

Spark将机器学习与GPU加速机制纳入自身

Databricks公司通过简化对GPU加速型机器学习方案的访问支持自家云Spark服务. 作为Apache Spark内存内大数据项目的支持与开发合作厂商,Databricks公司已经对其自家Apache Spark云实现方案进行两轮支持升级,旨在让更多IT用户享受其便利. 此次推出的新功能--即GPU加速与多套深度学习库集成--在理论上能够实现Apache Spark在任意位置的安装工作.不过Databricks方面表示,其版本目前仍处于调整阶段,这是为了避免资源争用情况给功能的实际使用带来

弄啥嘞?Spark将纳入机器学习与GPU

文章讲的是弄啥嘞,Spark将纳入机器学习与GPU,现在所有人的注意力都集中在人工智能上,似乎VR的火热带动了人工智能的发展.最近对全球大学人工智能教育的排名中,中国暂无高校上榜.相比于国际上各大高校实验室的火热,国内高校的动作似乎有些偏慢了.就好比加州大学伯克利分校AMP实验室所开源的Hadoop MapReduce通用并行框架Spark,在开源社区的贡献下,势头只增不减.近日,据外媒报道,Spark将纳入机器学习和GPU机制. 机器学习大家都不陌生了,GPU加速其实一直是机器学习的得力辅助,

Maker Voice 是为关注新硬件的朋友们准备的一个栏目

初期的形态是每天一篇文章,梳理总结一天下来新硬件行业的精华内容,可能是有意思的产品,也可能是引人思考的观点,目标是让朋友们能用最短时间在这里遍览真正值得关注的内容.So,enjoy! 360与迪信通达成战略合作,将在线下销售多款智能硬件 360与迪信通达成战略合作,迪信通将在全国门店及网络平台中销售360随身WiFi.安全路由器.儿童手环等硬件.此外,迪信通的虚拟运营商也将在360PC及手机平台接入,为用户提供更多的互联网流量套餐等服务. 360将为迪信通定制门店助手,手机应用商店等产品,迪信通

微软携手 Nvidia 发布 HGX-1 超大规模 GPU 加速器

微软和 Nvidia 刚刚发布了一个全新的超大规模 GPU 加速器蓝图,表示其"可推动人工智能云计算的发展".该加速器名叫 HGX-1 hyperscale GPU,其采用了开源设计,属于微软"奥林匹斯项目"(Project Olympus)的一部分.两家公司拿基于 PC 电脑主板的"ATX"(Advanced Technology eXtended)与作对比,称 HGX-1 可担负起基于云端的人工智能计算,该行业标准使得市场需求的实现变得更加容

NVIDIA:CUDA通过GPU加速提升高性能计算

CUDA(Compute Unified Device Architecture),显卡厂商NVidia推出的运算平台.随着显卡的发展,GPU越来越强大,而且GPU为显示图像做了优化.在计算上已经超越了通用的CPU.如此强大的芯片如果只是作为显卡就太浪费了,因此NVidia推出CUDA,让显卡可以用于图像计算以外的目的. 目前只有G80平台的NVidia显卡才能使用CUDA,工具集的核心是一个C语言编译器.G80中拥有128个单独的ALU,因此非常适合并行计算,而且数值计算的速度远远优于CPU.