Nvidia新一代CUDA推动GPU通用计算领域

&">nbsp;   日前,中国高性能计算年会在长沙召开,展会公布了2009年最新的中国TOP 100,国防科技大学研制的天河一号超级计算机以1 PFlops(千万亿次)的计算速度夺得了中国超算排行榜的第一名。各家厂商就目前日渐火热的高性能计算市场做出表示,认为随着金融危机的发生,企业逐步认识到高性能计算在工程和研发领域具有高效率、低成本等特点,从而使得高性能计算市场开始增加。

  NVIDIA联合创始人、总裁兼CEO黄仁勋先生表示,由于目前CPU发展趋缓,CUDA满足了现在越来越高的并行计算需求。上个月CUDA的SDK一个月下载量就达到了10万次。全球CUDA GPU的出货量也已经达到了1亿4千万片。CUDA技术可使用户充分受益。授予它们CUDA卓越中心的称号将有助于推进他们在GPU计算领域的研究,并使GPU计算成为推动中国自主创新能力的重要力量。

  与单纯使用CPU来运算相比,使用NVIDIA TESLA GPU平台不仅成本大幅度降低,还能极大提高计算机效率。

  据中科院过程工程研究所研究员、超级计算机系统项目负责人葛蔚说,通过GPU对相磁软件和硬件能力的提升,计算机的功耗不仅大幅降低,还可以使某种化工反应器模拟计算时间从原来的一天缩短到现在的2分钟。这是一个革命性的发展。

  CUDA是由NVIDIA推出的通用并行计算架构。该架构充分将GPU强大的并行计算能力调动起来,使GPU能够在解决复杂计算问题上发挥其先天优势。截止到目前为止,全球已经有超过250所大开设了CUDA编程和GPU计算的课程。

Nvidia作为GPU通用计算领域的推动者,特地将其新一代GPU“费米(Fermi)”CUDA通用计算成果带到大会现场。代号为“费米”的下一代CUDA通用计算架构集成了512个流处理器,拥有超过30亿个晶体管。在实现与CPU相同的计算性能的情况下,“费米”的投资成本仅为其十分之一,而其功耗仅为CPU的二十分之一。

据了解,基于“费米”架构的CUDA通用计算拥有全球首款真正意义上的高速缓存层次结构(Nvidia Parallel DataCache),它可以加速物理效果解算器,光线追踪以及稀疏矩阵乘法等算法的速度。而这正是高性能计算应用所经常用到的——工程模拟、动画渲染和科学计算等。

此外,“费米”架构还拥有Nvidia GigaThread引擎,使得同一应用程序中的不同内核可以同时在GPU中运行。相对的,“费米”还具有ECC纠错技术,在可靠性方面保证了并行计算的顺利。Nvidia的工程师告诉记者:“我们‘费米’的最大改进在双精度方面,遇上一代架构的CUDA通用计算相比,现在的双精度计算提高了8倍。而双精度在线性代数,数学模拟以及生物化学领域的高性能计算中发挥着重要作用。”

记者看到Nvidia打造了一套名为RealityServer的平台,主要由Tesla RS GPU服务器以及Mental Images公司的RealityServer软件组成。据了解,这款首创的集成解决方案能够以类似于互动游戏体验的极速效率处理以往需要数天才能完成的照片,让其实时生成。“这一整套系统基于云计算环境,例如汽车设计团队可以安全的共享复杂的3D汽车设计模型以及在不同的光照和环境下对其进行可视化的渲染和改良。类似的,建筑师也可以用这套系统实时的向客户展示建筑模型,包括白天和黑夜等不同情况下该建筑物的样子。”Nvidia的工程师这样解释,“而这整个架构都是由CUDA搭建的,对于用户来说不需要知道这些计算是怎么进行的,这其实就是云计算。”

时间: 2024-11-10 10:56:17

Nvidia新一代CUDA推动GPU通用计算领域的相关文章

NVIDIA:CUDA通过GPU加速提升高性能计算

CUDA(Compute Unified Device Architecture),显卡厂商NVidia推出的运算平台.随着显卡的发展,GPU越来越强大,而且GPU为显示图像做了优化.在计算上已经超越了通用的CPU.如此强大的芯片如果只是作为显卡就太浪费了,因此NVidia推出CUDA,让显卡可以用于图像计算以外的目的. 目前只有G80平台的NVidia显卡才能使用CUDA,工具集的核心是一个C语言编译器.G80中拥有128个单独的ALU,因此非常适合并行计算,而且数值计算的速度远远优于CPU.

Nvidia携CUDA出击 欲用GPU推动云计算

本文讲的是Nvidia携CUDA出击 欲用GPU推动云计算,[IT168 专稿]日前,中国高性能计算年会在长沙召开,展会公布了2009年最新的中国TOP 100,国防科技大学研制的天河一号超级计算机以1 PFlops(千万亿次)的计算速度夺得了中国超算排行榜的第一名.各家厂商就目前日渐火热的高性能计算市场做出表示,认为随着金融危机的发生,企业逐步认识到高性能计算在工程和研发领域具有高效率.低成本等特点,从而使得高性能计算市场开始增加.     Nvidia作为GPU通用计算领域的推动者,特地将其

简化并行开发NVIDIA宣布CUDA 4.0

NVIDIA公司今天宣布了新版GPU通用计算开发包CUDA 4.0,主要改进方向是简化并行编程,让更多开发人员能够将应用程序移植到GPU平台. CUDA 4.0的三大主要特性包括: GPUDirect 2.0技术GPUDirect 1.0主要用于高性能计算集群应用,方便不同节点之间的GPU相互联系,而GPUDirect 2.0则面向节点内应用,即多GPU并联系统.同一节点内的多块GPU可以不经过CPU.住内存,直接交换各自显存中的数据. 统一虚拟寻址(UVA)简化通用计算编程中的寻址空间设计,开

远程连接及运行OpenGL/Cuda等GPU程序实例教程

有时候往往需要通过远程桌面连接进行coding工作,像一般的比如web之类的可能不需要GPU等支持的coding工作直接用windows远程桌面连接编码然后debug即可,而一些需要依靠显卡支持的工作如渲染.cuda等GPU操作时,往往远程桌面连接debug会失败.因为当用远程桌面连接电脑B时,比如本来电脑B是具有牛X显卡,驱动啥之类都没有问题,但此时用另外一台电脑A远程连接过去,在B上跑需要GPU支持的程序,如需要用到 Opengl3.X的功能或者cuda,而此时B检测到是远程连接过来的,就不

GPU通用计算API的变迁和趋势

在高性能计算.机器学习等现代应用领域中,GPU(Graphics Processing Unit)是占统治地位的计算引擎.GPU从早期的固化逻辑实现.到可编程.到今天的通用计算架构(GPGPU),其应用接口(API)随着功能和通用性的提升而变得越来越灵活和高效. 1. 图形渲染:DirectX 和 OpenGL 早期的GPU有浑名显卡也不冤枉.从软件角度来说,其逻辑架构基本上就是图形的三角形坐标变换.顶点照明.像素着色等一系列功能.因为逻辑固化.功能单纯,应用程序通过驱动接口可以直接执行这些功能

避免关注底层硬件,Nvidia将机器学习与GPU绑定

[编者按]Nvidia通过发布cuDNN库,将GPU和机器学习更加紧密的联系起来,同时实现了cuDNN与深度学习框架的直接整合,使得研究员能够在这些框架上无缝利用GPU,忽略深度学习系统中的底层优化,更多的关注于更高级的机器学习问题. 以下为译文 近日,通过释放一组名为cuDNN的库,Nvidia将GPU与机器学习联系的更加紧密.据悉,cuDNN可以与当下的流行深度学习框架直接整合.Nvidia承诺,cuDNN可以帮助用户更加聚焦深度神经网络,避免在硬件性能优化上的苦工. 当下,深度学习已经被越

实现NVIDIA发布进程规划GPU计算基于Fermi新架构

早在去年11月中旬,NVIDIA就先行宣布了基于Fermi新架构.面向高性能计算领域的Tesla 20系列计算处理器和计算系统.现在,终于有合作伙伴推出相关系统了,也实现了NVIDIA的发布进程规划. &http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   NVIDIA 公司在月初终于发布了基于代号为 Fermi的下一代CUDA架构的Tesla S2050系列处理器,其供应商们也纷纷推出了Tesla 20系列的最新G

微软携手 Nvidia 发布 HGX-1 超大规模 GPU 加速器

微软和 Nvidia 刚刚发布了一个全新的超大规模 GPU 加速器蓝图,表示其"可推动人工智能云计算的发展".该加速器名叫 HGX-1 hyperscale GPU,其采用了开源设计,属于微软"奥林匹斯项目"(Project Olympus)的一部分.两家公司拿基于 PC 电脑主板的"ATX"(Advanced Technology eXtended)与作对比,称 HGX-1 可担负起基于云端的人工智能计算,该行业标准使得市场需求的实现变得更加容

2015年推动数据中心领域变革的十大趋势

近日召开的加特纳集团IT运营战略和解决方案峰会上,分析师DavidJ.Cappuccio概述了有望在明年及之后影响数据中心的十大IT趋势. 数据中心技术正以惊人的速度不断涌现和不断变化.只要想想像虚拟化这样的新兴概念如何在短短几年内变成一项必不可少的基础设施技术,或者想想固态硬盘在高性能存储缓存和虚拟存储区域网(SAN)部署环境中扮演越来越广泛的角色. IT专业人员需要密切关注新动向,并考虑那些产品或项目给数据中心以及公司业务可能带来的影响.在近日召开的加特纳集团IT运营战略和解决方案峰会上,分