英伟达的新GPU来了,FPGA和ASIC要扔掉吗?

雷锋网AI科技评论消息,美国时间5月10日,NVIDIA CEO黄仁勋在开发者大会GTC2017上发布新一代GPU架构Volta,首款核心为GV100,采用台积电12nm制程,最大亮点是成倍提升了推理性能,意欲在目前称霸机器学习训练场景的基础上,在推理场景也成为最佳商用选择。

GV100 GPU

英伟达的新GPU来了,FPGA和ASIC要扔掉吗?

英伟达的新GPU来了,FPGA和ASIC要扔掉吗?

据雷锋网(公众号:雷锋网)了解,Volta架构GV100 GPU采用台积电(TSMC)12nm FFN制程,具有5120个CUDA核心。相比上一代16nm制程的Pascal架构GPU GP100,晶体管数目增加了38%,达到了惊人的211亿个;核心面积也继续增加33%,达到令人生畏的815mm2,约等于一块Apple Watch的面积,据黄仁勋称这样的面积已经达到了制造工艺极限。随着核心的增大,GV100的单、双精度浮点性能也大幅提升了41%。然而这还不是重点,为了满足GPU在机器学习中的性能需求,Volta架构中引入了新的张量运算指令Tensor Core,让机器学习中训练速度提升约3倍、推理性能提升约10倍(相比上一代自家GPU GP100)。

GV100搭载在TESLA V100开发板上亮相,配合来自三星的16GB HBM2显存,显存带宽也达到了900GB/s之高。

英伟达的新GPU来了,FPGA和ASIC要扔掉吗?

根据现场演讲PPT,推理场景下,V100比上一代搭载GP100 CPU的P100板卡,图像处理能力提升了约10倍,延迟也下降了约30%。在这样的性能提升之下,GPU已经可以让FPGA和ASIC几乎没有用武之地,在商用场景中几乎满足全部计算需求。(详细分析见文末)

DGX-1V、DGX Station

英伟达的新GPU来了,FPGA和ASIC要扔掉吗?

随着GV100 GPU发布,NVIDIA的深度学习超级计算机也进行了升级。老款DGX-1把原有Pascal GPU升级为Volta GPU,名字也更新为DGX-1V。它内置八块 Tesla V100开发板,合计显存128G、运算能力为 960 Tensor TFLOPS,即将迈入下一个时代。黄仁勋表示,过去 Titan X 需花费八天训练的神经网络,用 DGX-1V 只需八个小时。它相当于是“把 400 个服务器装进一个盒子里”。

DGX Station 则是缩小版的 DGX-1V,黄仁勋称其为“Personal DGX”,堪称是终极个人深度学习电脑,各方面指标均为DGX-1V的一半,但仍然已经非常强大。英伟达内部使用DGX Station已经很久,每个工程师要么有 DGX-1V,要么有 DGX Station,再要么两个都有。既然它确实能够满足工程师的需求,英伟达决定把这款产品推广给公众市场。

NVIDIA意图通过GV100完全称霸机器学习硬件市场

据雷锋网AI科技评论了解,机器学习中需要用到高计算性能的场景有两种,一种是训练,通过反复计算来调整神经网络架构内的参数;另一种是推理,用已经确定的参数批量化解决预定任务。而在这两种场景中,共有三种硬件在进行竞争,GPU、FPGA和ASIC。

GPU(以前是Graphics Processing Unit图形计算单元,如今已经是General Processing Unit通用计算单元)具有高的计算能力、高级开发环境、不影响机器学习算法切换的优点,虽然同等计算能力下能耗最高,但仍然在算法开发和机器学习训练场景中占据绝对的市场地位。

FPGA(Field-Programmable Gate Array,现场可编程矩阵门)是一种半成型的硬件,需要通过编程定义其中的单元配置和链接架构才能进行计算,相当于也具有很高的通用性,功耗也较低,但开发成本很高、不便于随时修改,训练场景下的性能不如GPU。

ASIC(Application Specific Integrated Circuits,专用集成电路)是根据确定的算法设计制造的专用电路,看起来就是一块普通的芯片。由于是专用电路,可以高效低能耗地完成设计任务,但是由于是专用设计的,所以只能执行本来设计的任务,在做出来以后想要改变算法是不可能的。谷歌的TPU(Tensor Processing Unit张量处理单元)就是一种介于ASIC和FPGA之间的芯片,只有部分的可定制性,目的是对确定算法的高效执行。

所以目前的状况是,虽然GPU在算法开发和机器学习训练场景中占有绝对地位;但是由于FPGA和ASIC在任务和算法确定的情况下,在长期稳定大规模执行(推理)方面有很大优势,所以GPU跟FPGA和ASIC之间还算互有进退,尤其GPU相同性能下功耗很高,对大规模计算中心来说电费都是很高的负担。但随着GV100对推理计算能力的约10倍提升,商用场景下已经没有必要为了推理场景更换硬件了,同一套GPU可以在训练场景的计算能力和推理场景的计算能力同时达到同功耗下最佳,还具有最好的拓展和修改能力,简直别无所求。

面对提升如此明显的GPU,一众投身机器学习硬件的FGPA和ASIC厂商前景令人担忧。也许现在唯一能让他们松口气的就是GV100 GPU的量产出货时间要到2017年三四季度。等2018年,希望大规模部署后的GV100能用成倍提升后的性能给我们带来新的惊喜。

AI科技评论招聘季全新启动!

很多读者在思考,“我和AI科技评论的距离在哪里?”答案就是:一封求职信。

AI科技评论自创立以来,围绕学界和业界鳌头,一直为读者提供专业的AI学界、业界、开发者内容报道。我们与学术界一流专家保持密切联系,获得第一手学术进展;我们深入巨头公司AI实验室,洞悉最新产业变化;我们覆盖A类国际学术会议,发现和推动学术界和产业界的不断融合。

而你只要加入我们,就可以一起来记录这个风起云涌的人工智能时代!

本文转自d1net(转载)

时间: 2024-09-11 09:04:38

英伟达的新GPU来了,FPGA和ASIC要扔掉吗?的相关文章

浪潮携手英伟达共推GPU加速计算解决方案

在不久前美国举办的超算大会上(SC13),Nvdia发布了最新的Tesla K40加速器.浪潮http://www.aliyun.com/zixun/aggregation/21263.html">第一时间携手Nvdia在国内发布了全新的GPU加速计算解决方案.谈到GPU服务器的发展,浪潮集团高性能服务器产品部总经理刘军认为从增长率的角度来说,Nvdia GPU加速器在2012年的增长速率达到了2倍,而浪潮的相关产品涨幅更多.经过这几年浪潮与Nvdia的努力,Tesla GPU加速的技术已

互撕?英伟达GPU与谷歌TPU究竟孰强孰弱

上周,谷歌发布了一篇文章,详细对他们的第一代张量处理单元(TPU)与英特尔的一款GPU.英伟达的一款GPU进行了速度与效能上的对比.这款TPU相对于GPU和CPU来说有非常明显的优势,这引起了众多媒体的关注.近日,英伟达的CEO.联合创始人黄仁勋在英伟达官方博客上发表了一篇文章,以此回应谷歌的测试结果. 谷歌的TPU是专为谷歌机器学习平台Tensorflow 设计的ASIC(专用集成电路),谷歌用来测试的TPU版本在2015年被应用在他们的数据中心.为了体现对比的公平,谷歌将该TPU与当代的英伟

IBM联手英伟达推出针对机器学习的新服务器

IBM新服务器 北京时间9月9日消息,据外媒报道,IBM日前宣布推出新服务器IBM Power Systems S822LC for High Performance Computing.虽然名称有些长,但它是一款很有意思的产品.IBM联手英伟达打造了这个专为人工智能.机器学习和高级分析使用案例而设的新系统. 该新服务器使用两个IBM POWER8 CPU和4个英伟达Tesla P100 GPU加速器.不过,它运行软件之所以非常快速,不只是因为CPU和GPU强大的处理能力.IBM还使用英伟达的N

微软为什么要用英伟达的GPU来支持CNTK?

今天下午,在北京举行的GTC CHINA 2016(GPU技术大会)中,英伟达深度学习研究院对CNTK中图像识别功能进行了简单介绍. 首先,我们来了解下CNTK. CNTK(Computational Network Toolkit)是由微软研究院开发的开源计算网络工具包,它通过一个有向图对一系列的计算步骤进行描述,也是一个统一的深度学习神经网络工具包. CNTK的总体架构如上图所示,这里我们可以简单地分几部分进行理解,分别是上中下和左中右两种理解逻辑.先说上中下部分,最下面的包含IDataRe

英伟达推出高性能Jetson TX2,加快深度学习在终端设备上的布局

人工智能和机器学习越来越受到用户的关注,AI的应用与逐步走入大众的视野当中.提到人工智能和机器学习,用户的第一反应就是需要强大的计算平台进行支撑,在很多厂商推出的解决方案中,计算部分也大都放在后端进行.不过,英伟达认为,只有前端强大的计算能力的人工智能解决方案,才能真正推动机器学习的发展,给人们带来真正的便利.为此,英伟达推出了Jetson 计算平台. 继Jetson TX1之后,英伟达再次发力,推出了性能更加强大的Jetson TX2.近期,在英伟达北京新总部举行的Jetson TX2 Edi

同是利润增长:英伟达与英特尔股价表现迥异背后

日前,以CPU为主的英特尔和GPU为主的英伟达先后发布了自己今年第一季度财报,其中双方利润分别同比增长了45%和48%,按理说双方利润的增长都相当可观,尤其是对于英特尔,在当季PC市场依然下滑之时,仍以PC芯片为主的英特尔能够实现如此的利润增长实属可贵,但事实远没有看起来那般简单,反映在资本市场中,英特尔在取得了看似不错的财报后,其股价不涨反跌,跌幅高达6%左右,相比之下,英伟达的股价则大幅上扬了14%左右.那么问题来了,为何同是利润增长,且增长幅度几乎相同,但双方在股价上的表现却大相径庭呢?这

微软、英特尔、英伟达支持Element AI公司1.02亿美元A轮融资

加拿大人工智能初创公司Element AI宣布,已经在A轮融资中获得1.02亿美元,由旧金山风投公司Data Collective领投. 其他投资方还包括加拿大开发银行.加拿大富达投资银行.韩华投资.英特尔投资公司.微软风险投资公司.加拿大国家银行.英伟达.Real Ventures以及全球财富基金. 这家成立只有8个月的初创公司此前从微软.腾讯以及韩华集团获得资金,但是并没有透露金额. Element AI表示,最近一轮融资将用于来自加拿大高科技领域的250名新员工.大规模人工智能项目.以及在

英伟达告诉你,深度学习需要怎么样的新型高性能计算

今天深度学习无处不在,当你打开移动终端的时候,各种APP会推荐到你喜欢的食物.你喜欢的电影,你关注的新闻热点.在生活中更是改变着我们,今天的智能语音让语言障碍破除,在预测疾病基因大数据领域预测疾病来确定药物治疗方案.在安全领域通过安装在机场和商场的智能视频监控,提高了公共安全性.可以说,深度学习的应用,彻底改变了今天人们的生活. 在上世纪九十年代PC-互联网时代以微处理器.标准操作系统.以及信息世界新门户的结合推动社会的进步,代表有CPU.WINDOWS.各类门户网站.PC-互联网时代让大约10

英伟达携手顶尖游戏厂商在CJ上展示游戏至尊装备

2010年7月29日,中国上海--融聚中国游戏行业技术与实力的第八届中国国际数码互动娱乐展览会(ChinaJoy)于今日在上海新国际博览中心举行.作为视觉计算技术的行业领袖,NVIDIA®(英伟达)公司今年如期参展,并为广大中国玩家展示NVIDIA®(英伟达)最新推出的游戏"至尊装备"--NVIDIA®(英伟达)GeForce®(精视)GTX460 GPU和NVIDIA®(英伟达)3D立体幻镜环绕(Surround)技术.二者绝佳搭配展现出的3D游戏魅力让在场的媒体和玩家叹为观止. N