CUDNN v3特性

原文链接:https://developer.nvidia.com/rdp/cudnn-download

(1)为所有层增加了FP16支持(仅用于存储,所有中间计算仍然使用FP32;

(2)为所有层增加3D支持;

(3)增加新的2D卷积实现:前向和后向计算利用FFT加速。具体参考文档

CUDNN_CONVOLUTION_FWD_ALGO_FFT,

CUDNN_CONVOLUTION_BWD_FILTER_ALGO_FFT,

CUDNN_CONVOLUTION_BWD_DATA_ALGO_FFT。

2DFFT卷积是确定的。

(4)后向Data和Filter 2D卷积目前支持新的确定算法,相应地为CUDNN_CONVOLUTION_BWD_DATA_ALGO1和CUDNN_CONVOLUTION_BWD_FILTER_ALGO1。这些算法在一些场景下优于非确定算法。

类似于前向,用户可以查询最快的算法或根据需要选一个特定算法。

(5)增加了通道间局部响应归一化层(LRN CrossChannel);

(6)增加了可分离的归一化层。该层可以用于实现通道内 2D或3D LRN和LCN;

(7)增加了对数软最大化层(Log Softmax);

(8)增加三个新函数

cudnnFindConvolutionForwardAlgorithm,

cudnnFindConvolutionBackwardFilterAlgorithm,

cudnnFindConvolutionBackwardDataAlgorithm。

它们尝试每个可用的卷积算法,按速度和内存需求量排序。

(9)目前下采样层(pooling)支持负补边操作(negative padding);

Maxwell性能提升

(10)前向卷积算法CUDNN_CONVOLUTION_FWD_ALGO1和data后向卷积算法CUDNN_CONVOLUTION_BWD_DATA_ALGO1在Maxwell架构下的性能大大提升;

后向API兼容性

(11)为了保持后向兼容cuDNN v2.0,更新了几个带后缀_v3的API函数:

cudnnSetConvolutionDescriptor_v3

cudnnGetConvolutionDescriptor_v3

cudnnConvolutionBackwardFilter_v3

cudnnConvolutionBackwardData_v3

原先的函数已经过期。

cuBLAS依赖

(12)新的FFT卷积算法使用了一些cuBLAS函数。在cuDNN应用程序中使用cuDNN动态库无需显式链接cuBLAS库,而使用cuDNN静态库则需要显式链接cuBLAS库。

已知的问题

(13)在Maxwell架构下,当选择CUDNN_CONVOLUTION_BWD_DATA_ALGO1算法,而且补边数目大于滤波器尺寸时函数cudnnConvolutionBackwardData_v3可能给出错误结果。

时间: 2025-01-11 12:24:36

CUDNN v3特性的相关文章

CUDNN v3例程演示

首先到NVIDIA官网下载CUDNN v3安装包和例程,如下图中红框所示: 安装CUDNN v3之前需要先安装CUDA 7.0或更高版本,不再赘述. 将下载后的两个tgz包拷贝到已安装CUDA 7.0的目标机器某个路径(我这里为/home/yongke.zyk/local_install),解压,得到三个子目录include/,lib64/和samples/.其中include/下为cudnn.h头文件,需要在编译时包含:lib64/下为cudnn静态库libcudnn_static.a和动态库

自己也能做出Prisma一样的图片了

雷锋网按:本文作者phunter,文章来源大数据杂谈.文中只要介绍了如何使用MXnet做出具有艺术风格的照片. Neural art:用机器模仿梵高 Neural art是个让机器模仿已有画作的绘画风格来把一张照片重新绘画的算法,比如给一张猫的照片和一张梵高的自画像,我们就可以得到用梵高风格画出来的猫,比如这个样子(图二为梵高在1889年的自画像,引用自wikipedia): Neural art算法来自于这篇论文 "A Neural Algorithm of Artistic Style&qu

(转) Deep Learning Resources

    转自:http://www.jeremydjacksonphd.com/category/deep-learning/   Deep Learning Resources Posted on May 13, 2015   Videos Deep Learning and Neural Networks with Kevin Duh: course page NY Course by Yann LeCun: 2014 version, 2015 version NIPS 2015 Deep

探索Eclipse V3.1的新特性

这份教程演示了 Eclipse 的最新发行版 V3.1 中的许多新特性.如果正考虑 从以前的发行版升级到 V3.1,或者正考虑从其他集成开发环境转到 Eclipse, 那么您会发现本教程非常有用.如果想修改代码,以利用 Java 语言的 最新一代 Java 2 Standard Edition V1.5(为 Java 编程语言添加了许多强大 的结构和便利),本教程也会给您带来很大的帮助. 预备知识 了解本教程的学习目标和最佳学习方式. 关于本教 程 本教程演示了 Eclipse 的最新发行版 V

大量特性删减 新Haswell至强E3 v3规格详解

根据Intel的产品定位,Xeon产品线的处理器是面向服务器和工作站领域的,不过其中也有一些特例.比如在Intel将Xeon重新划分成E3.E5和E7产品线之后,其中的Xeon E3地位就比较特殊.这个系列的产品采用了与民用版酷睿家族处理器同样的针脚定义,并且大部分民用的P系列和H系列主板都能够很好的支持,价格也非常合适,成为不少PC用户的首选处理器. 在Intel发布http://www.aliyun.com/zixun/aggregation/33871.html">Haswell服务

了解ThinkPHP v3.1.3版本新特性

官方昨天http://www.aliyun.com/zixun/aggregation/18782.html">正式发布了ThinkPHP3.1.3版本,从版本号来看,该版本只是一个小版本更新.但是有一些特性,还是值得关注的,下面来简单说下. 一.异常方面的改进. 新版重写了异常类ThinkException(其实是完全简化成了直接继承系统Exception类),并且把异常逻辑改进封装到Think类中.主要涉及到Think类的appException方法和halt函数.并且改进后的异常处理

ThinkPHP v3.1开发框架新特性:Ajax支持完善

3.1对AJAX的支持更加完善了,表现在: 判断AJAX方式改进 现在可以直接使用常量IS_AJAX来判断是否AJAX方式请求,用来取代之前的http://www.aliyun.com/zixun/aggregation/16339.html">Action类的isAjax方法,优势是可以在任何代码里面进行判断.而Action类的error和success方法内置就支持对AJAX自动判断支持. ajaxReturn方法完善 原来的ajaxReturn方法只能返回固定结构的数据,包括data

ThinkPHP v3.1开发框架新特性:查询条件预处理

3.0版本对数组方式的查询条件会进行安全过滤(由于3.0强制使用了字段类型检测,所以数组方式的查询条件会强制转换为字段的设定类型),但不支持字符串条件的安全过滤.3.1版本则增加了对条件字符串增加了预处理支持,让ORM的安全性更加得以保证.一.使用where方法 Model类的where方法支持字符串条件预处理,使用方式: $Model->where("id=%d&http://www.aliyun.com/zixun/aggregation/37954.html">

ThinkPHP v3.1开发框架新特性:页面压缩输出支持

现在大多数浏览器都已经支持页面的压缩输出,通过压缩输出,页面大小可以减少30%,由于3.0版本没有内置页面压缩输出功能,所以一般来说,需要自己在入口文件中添加: ob_start('ob_gzhanhttp://www.aliyun.com/zixun/aggregation/16504.html">dler'); 但是由于服务器环境的不同,8630.html">有时候这个配置会和php.ini文件中的zlib压缩配置冲突.3.1新版则内置了页面压缩输出功能,不需要再手动添