互撕?英伟达GPU与谷歌TPU究竟孰强孰弱

上周,谷歌发布了一篇文章,详细对他们的第一代张量处理单元(TPU)与英特尔的一款GPU、英伟达的一款GPU进行了速度与效能上的对比。这款TPU相对于GPU和CPU来说有非常明显的优势,这引起了众多媒体的关注。近日,英伟达的CEO、联合创始人黄仁勋在英伟达官方博客上发表了一篇文章,以此回应谷歌的测试结果。

谷歌的TPU是专为谷歌机器学习平台Tensorflow 设计的ASIC(专用集成电路),谷歌用来测试的TPU版本在2015年被应用在他们的数据中心。为了体现对比的公平,谷歌将该TPU与当代的英伟达Kepler K80 GPU和英特尔Haswell CPU进行了比较。

这个做法看起来确实公平,不过根据黄仁勋在博客中的说法,谷歌用来做对比的是旧版芯片。英伟达目前最新的Pascal芯片是Kepler两代以后的版本了,而且英特尔的Kaby Lake架构也已经超过Haswell三代。此外,Kepler不像Pascal,并没有在机器学习应用上作最佳化的使用,而谷歌定制的这种ASIC就只是用来进行深度学习应用的。

笔者认为,芯片与芯片之间的对比,已经被先进的技术所废弃。英伟达和英特尔已经公布了他们新一代芯片的架构细节,谷歌却一直对被测的2015 TPU是否已经被其他更强大的芯片超越而保持沉默。当然,谷歌会把2015 TPU这个秘密泄漏出来,部分原因是他们也许有了一个新的秘密。

英伟达发表了上面那个表格,借此说明他们的Pascal架构在与谷歌2015 TPU的比较中已经超越了Kepler。在这个表格中,TOPS引用了浮点运算(每秒数以亿万计的操作),FP表示“浮点数”,INT表示“整数”。

在表格中可以看到,Pascal比Kepler强大了很多,不过我们并不知晓Pascal是如何与谷歌TPU进行对比的。

黄仁勋在博客中煞费苦心地指出,谷歌和英伟达的做法是殊途同归的——都是为了促进芯片技术的发展,以使其能够支持大型人工只能的大规模计算。

速度和能效是芯片能否用于大量AI型设备的重要参数。不过,使芯片间的对比有意义的唯一方法是在芯片设计时使其适应相同的角色。如果芯片A和芯片B都没有获得或丢失某些额外功能,那么这两者之间的对比才真正有意义。即便是功能不同的问题解决了,除了速度和能效之外的因素也必须考虑在内。

数据中心规模的AI中,TPU、GPU和CPU都是不可替换的,因为它们拥有各自不同的作用。TPU和GPU从CPU中接收指令,没有CPU它们就无法实现各自的功能;而CPU和GPU是支持多种软件平台执行各种任务的常规芯片;ASIC则建立在为特殊应用工作的基础之上。值得注意的是,上面的表格中TPU一列,Training TOPS栏中为“NA”(not applicable,即不适用)。这表示2015 TPU专门用于运行在Tensorflow上深度学习模型的推理,并不能进行AI训练。

特别要指出的是,数据中心规模的AI需要所有这三种芯片的有效使用。哪个芯片用于什么地方取决于运行在数据中心的机器以及AI软件如何配置。厂商们将重点放在“芯片大战”,可能对于抢明天的头条有些作用,但对数据中心来说,其意义是非常有限的。

   

 

  

本文转自d1net(转载)

时间: 2024-10-27 08:53:55

互撕?英伟达GPU与谷歌TPU究竟孰强孰弱的相关文章

玩深度学习选哪块英伟达 GPU?有性价比排名还不够!

与"传统" AI 算法相比,深度学习(DL)的计算性能要求,可以说完全在另一个量级上. 而 GPU 的选择,会在根本上决定你的深度学习体验.那么,对于一名 DL 开发者,应该怎么选择合适的 GPU 呢?这篇文章将深入讨论这个问题,聊聊有无必要入手英特尔协处理器 Xeon Phi,并将各主流显卡的性能.性价比制成一目了然的对比图,供大家参考. 先来谈谈选择 GPU 对研究深度学习的意义.更快的 GPU,能帮助新人更快地积累实践经验.更快地掌握技术要领,并把这些应用于新的任务.没有快速的反

发力AI,英特尔欲借Nervana芯片挑战英伟达GPU

英特尔正在发力人工智能技术,试图在这一领域挑战领先者英伟达.近期收购的Nervana Systems将是英特尔开拓人工智能市场的先锋. 英特尔已公布了关于人工智能的计划,但至少有一块关键拼图尚未完成. 英特尔此前收购了Nervana Systems,并宣布将继续销售该公司的所有产品.这些产品面向高端应用,尤其是神经网络的训练.这一领域目前的领先者是英伟达.与此同时,英特尔收购Movidius的交易尚未完成,因此在计算机视觉和边缘网络方面还有很大的缺失需要填补.此外,英特尔还公布了多个人工智能软件

谷歌第二代TPU再“飞升” 动摇英伟达GPU市场主导地位

相较于只能使用在深度学习推论(inferencing)的第一代Tensor Processing Unit (TPU)芯片,Google第二代人工智能(AI)芯片Cloud TPU不仅处理速度更快,还多了训练算法的能力,因此可望对NVIDIA绘图处理器(GPU)芯片在AI市场的主导地位造成更大的威胁. 富比士(Forbes)报导指出,深度学习是一种利用大量资料对算法进行训练的AI技术,并已普遍应用在影像与语音辨识功能上.在TPU问世以前,算法的训练多是交由NVIDIA的GPU负责处理.GPU原本

重磅译制 | 更新:牛津大学xDeepMind自然语言处理 第6讲(上)NLP硬件和软件-英伟达GPU

牛津大学Deep NLP是一门关于自然语言处理(NLP)的高阶课程.课程由牛津大学和谷歌DeepMind(AlphaGo的开发机构)联合开设,是牛津大学计算机系2017年春季学期最新课程.由Phil Blunsom主讲,同时邀请到多位来自DeepMind和NVIDIA的业界讲师来做客座讲座. 大数据文摘已联系课程主讲人取得翻译授权,并联合北京邮电大学模式识别实验室组织了视频汉化,免费发布. 课程现已上线网易云课堂,请大家多给我们好评,为辛勤工作的字幕组打CALL! 学习地址 http://stu

英伟达回应谷歌威胁论:Volta GPU性能远强于二代TPU

据CNBC北京时间5月25日报道,谷歌上周推出了第二代TPU,专注于人工智能领域.外界普遍认为,谷歌此举最终会削弱图形芯片厂商英伟达的增长势头,毕竟,英伟达的增长主要得益于那些使用其芯片进行人工智能处理的企业客户.不过,英伟达CEO黄仁勋周三驳斥了这种说法,称即将推出的Volta GPU的运算能力远远超过谷歌第二代TPU. 过去几年,英伟达与此类计算形式建立了紧密联系,由于投资者看好英伟达的前景,加上销售量不断增长,该公司股价持续走高.英伟达股价在去年上涨了逾200%,而从2017年初到现在也累

英伟达CEO黄仁勋亲自撰文摆数据怼上谷歌TPU

雷锋网按:前不久谷歌发布了关于TPU细节的论文,称"TPU 处理速度比当前 GPU 和 CPU 要快 15 到 30 倍".当时就有人对此种"比较"表示质疑,因其拿来的比较对象并非市场里性能最好的. 而昨晚(美国时间 4 月 10 日)英伟达 CEO 黄仁勋就亲自撰文回应了这一"比较",文章第一段就以谷歌 TPU 开头,炮击意图十分明显,随后更是扔出了 Tesla P40 GPU 与 TPU 的性能对比图,可谓针尖对麦芒. 黄仁勋亲自撰文怼上 T

英伟达CEO黄仁勋:我们正处在超级摩尔定律时代,我不太理解英特尔的战略

我们正在进入一个"超级摩尔定律"时代 新智元:中国购买英伟达GPU最多的公司是哪一家?在英伟达全球的布局里,中国占多少份额?      黄仁勋:在中国的互联网公司当中,我们和百度的合作时间是最长的,我们在AI方面的合作,可能已经有五到六年的时间了,李彦宏和他百度的团队,一直在这个方面有坚定的探索.百度是我们一个非常大的客户,非常好的客户,非常好的合作伙伴.其他的GPU大客户也是互联网公司,因为他们有大量的数据需要处理,所以使用GPU是非常自然的事情. 现在还有另外一个非常大的机会,实时

同是利润增长:英伟达与英特尔股价表现迥异背后

日前,以CPU为主的英特尔和GPU为主的英伟达先后发布了自己今年第一季度财报,其中双方利润分别同比增长了45%和48%,按理说双方利润的增长都相当可观,尤其是对于英特尔,在当季PC市场依然下滑之时,仍以PC芯片为主的英特尔能够实现如此的利润增长实属可贵,但事实远没有看起来那般简单,反映在资本市场中,英特尔在取得了看似不错的财报后,其股价不涨反跌,跌幅高达6%左右,相比之下,英伟达的股价则大幅上扬了14%左右.那么问题来了,为何同是利润增长,且增长幅度几乎相同,但双方在股价上的表现却大相径庭呢?这

马斯克首度承认自研AI芯片,或与英伟达“分手“

Musk公开承认特斯拉正在自研AI芯片 昨天,特斯拉CEO Elon Musk公开承认,特斯拉正在开发专用的AI芯片.而同时,英伟达也在NIPS上发布了迄今为止最强大的"TITAN V" PC GPU.此番Musk之举,或可视为与英伟达的"分手宣言". Musk昨天在NIPS上说,"Jim正在开发专用的人工智能芯片,我们认为这将会成为世界上最好的芯片." Jim Keller何许人也?他是著名的传奇芯片工程师,曾在AMD担任首席架构师,设计出K7