谷歌发论文披露TPU详细信息,比GPU、CPU快15-30倍

自从Google去年透露自己开发了一款名为TPU的专用芯片,用于提高人工智能计算任务的执行效率,关于这种新芯片的猜测就从未停止。

今天,Google终于披露了关于TPU的更多信息。除了发表一篇有75位联合作者的论文《In-Datacenter Performance Analysis of a Tensor Processing UnitTM》外,文章的第四作者David Patterson还在美国国家工程院的活动上发表了演讲。

关于TPU的论文将正式发表于今年6月在多伦多召开的计算机体系结构国际研讨会(International Symposium on Computer Architecture, ISCA),Google目前已经在Google Drive上将其公开。

△ TPU的印刷电路板

该公司从2015年开始就一直在内部使用TPU,并在去年5月的Google I/O开发者大会上,对外公布了这种芯片的存在。

TPU是一种ASIC(专用集成电路),Google将其用在神经网络的第二个步骤。使用神经网络首先要用大量数据进行训练,通常在使用GPU加速的服务器上进行。之后,该公司便会开始使用TPU加速新数据的推断。谷歌表示,这比直接使用GPU或基本的x86芯片速度快很多。

他们在论文中写道:“尽管某些应用的利用率较低,但TPU平均比GPU或CPU速度快15至30倍左右。”其中的GPU或CPU具体指的是英伟达的Tesla K80 GPU和英特尔的至强E5-2699 v3芯片,后者可以成为TPU的底层平台。

过去5年,英伟达等公司的GPU已经成为经济型深度学习系统的默认基础架构,而谷歌也对此做出了贡献。但谷歌和微软等公司还在探索其他类型的人工智能芯片,包括FPGA(现场可编程门阵列器件)。谷歌的项目因为其来源和使用范围而受到关注,该公司工程师Norm Jouppi在博客中写道,这套系统已经应用于谷歌图片搜索、Google Photos和谷歌云视觉应用API等服务。

该论文称,一个TPU的片上内存容量达到Tesla K80的3.5倍,而且体积更小。每耗电1瓦的性能则高出30至80倍。谷歌目前可以将两个TPU安装到一台服务器中,但这并不表示他们不会开发其他更强大或更经济的硬件系统。

谷歌对人工智能网络的重视高于很多科技公司,他们2013年就认定这项技术广受欢迎,可以将其数据中心的计算需求扩大一倍。如果完全使用标准芯片,成本将十分高昂,难以承受。所以谷歌开始开发自己的技术,希望实现10倍于GPU的成本效益。

“我们没有与CPU密切整合,为了减少延迟部署的几率,TPU设计成了一个PCIe I/O总线上的协处理器,使之可以像GPU一样插到现有的服务器上。”论文还写道,“另外,为了简化硬件设计和调试过程,主服务器发送指令让TPU来执行,而不会自主执行。因此,与TPU更加接近的是FPU(浮点单元)协处理器,而非GPU。目标是在TPU运行完整的推理模型,降低与主CPU的互动,并使之足以灵活地满足2015年及之后的神经网络需求,而不仅仅适用于2013年的神经网络。

论文称,通常而言,在TPU上运行代码跟使用谷歌领导的TsensorFlow开源深度学习框架一样简单。

提示:Google在论文中提到的测试结果,都是基于该公司自己的测试标准。

原文发布时间为:2017-04-06

时间: 2024-10-27 15:18:55

谷歌发论文披露TPU详细信息,比GPU、CPU快15-30倍的相关文章

谷歌推出定制化机器学习芯片 速度是传统GPU的15到30倍

谷歌(微博)自主开发定制化芯片,以加速其机器学习算法,这已不是什么秘密了.早在2016年5月,该公司就在其I/O开发者大会上首次公布了这款名为Tensor Processing Units(简称TPU)的芯片.但是,该公司从未详细地介绍过它们,只是声称这些芯片是专门为其TensorFlow机器学习框架度身定做的. 但是在周三,谷歌首次详细地介绍了这种芯片的相关信息. 谷歌的大卫-帕特森(David Patterson)不仅与人联合发表了有关TPU芯片的文章,而且在美国国家工程院于加利福尼亚州山景

罗氏制药说明被指缺诚信不披露详细信息涉欺诈

本报记者 潘洁 罗氏公司可能是因为对这个患者援助项目还没有进行完全的评估,所以不愿意将收集到的不良反应报告向监管部门上报.不过,这也正是该公司做得不规范之处 近日,英国的一项调查将瑞士知名药企罗氏制药推上了风口浪尖.7月15日晚,国家药监局对外通报,正在密切关注发生在美国的罗氏公司瞒报 事件进展情况,已约谈了罗氏(中国)公司安全官,责成罗氏(中国)公司报告该事件的评价结果.并向世界卫生组织和英国.美国药监机构了解有关情况,希望及时通报该事件的调查结果.同时加强对罗氏公司在中国销售的相关品种的不良

使用ASP.NET Ajax库的母版-详细信息视图

提到数据驱动的网页时,您往往会想到具有一些交叉相关数据的母版-详细信 息视图.母版-详细信息视图非常适合呈现一对多的关系,此类关系在实际中相 当普遍,但 Web 平台不适合这种功能,因为它不具有实现该功能的有效工具集 . ASP.NET Web 窗体始终提供强大的数据绑定支持和一组功能强大的数据源和 数据绑定服务器控件.在 Web 窗体中,服务器控件几乎可以使用网格.列表和 下拉框的任意可能组合并支持多个级别的嵌套,从而能够出色地呈现数据的层次 结构. Web 窗体服务器控件生成的视图的缺陷并不

谷歌Borg论文阅读笔记(一)——分布式架构

传说中,Borg之前号称是Google内部和PageRanking相提并论的同等重量级的东西.现在公布了篇论文,读了一部分,还是有些地方没理解. 求讨论. Borg简介: Borg的作用是:提供一个标准任务规格语言,集成名字服务,实时任务监控,以及工具来分析和模拟系统行为. Google内部的集群管理系统调用都是用Borg来admits(准入),schedules(调度),starts,restarts,Borg还监控所有Google所有范围运行的应用. Borg的好处: 隐藏资源管理和故障处理

实战DeviceIoControl 之四:获取硬盘的详细信息

Q 用IOCTL_DISK_GET_DRIVE_GEOMETRY或IOCTL_STORAGE_GET_MEDIA_TYPES_EX只能得到很少的磁盘参数,我想获得包括硬盘序列号在内的更加详细的信息,有什么办法呀? A 确实,用你所说的I/O控制码,只能得到最基本的磁盘参数.获取磁盘出厂信息的I/O控制码,微软在VC/MFC环境中没有开放,在DDK中可以发现一些线索.早先,Lynn McGuire写了一个很出名的获取IDE硬盘详细信息的程序DiskID32,下面的例子是在其基础上经过增删和改进而成

表单-extjs5.1 grid操作获取详细信息

问题描述 extjs5.1 grid操作获取详细信息 extjs5.1中,当选中Grid表格中的某一行时,弹出一个form表单,form表单中显示出对应的详细信息.求指点!!! 解决方案 双击事件,发个异步请求,在把传回的参数放进去 解决方案二: 是使用ajax吗?可以直接读取一行的数据,然后写入到form中吗? 解决方案三: extjs连js都看不到,怎么用jQuery. var pushContentForm = Ext.create('MyExt.IOS.IOSMessageForm',

异常详细信息: System.InvalidCastException: 指定的转换无效。

问题描述 "/"应用程序中的服务器错误.--------------------------------------------------------------------------------指定的转换无效.说明:执行当前Web请求期间,出现未经处理的异常.请检查堆栈跟踪信息,以了解有关该错误以及代码中导致错误的出处的详细信息.异常详细信息:System.InvalidCastException:指定的转换无效.源错误:执行当前Web请求期间生成了未经处理的异常.可以使用下面的

谷歌Borg论文阅读笔记(二)——任务混部的解决

总算又往下读了一部分.Google的Borg论文中,前面部分讲的都是Borg的架构.后面有讲了一些资源隔离,安全隔离等的技术方案和策略. 主机层面的资源隔离,都是由是Borglet来操纵的. Google的混部情况: Google几乎所有的机器都是混部的,在一台机器上,可能运行着不同jobs的tasks.根据论文中所说,Google的50%的机器运行了9个甚至更多的tasks.90%的机器运行着25个tasks,达到4500个线程. 因此,Google有完善的隔离技术来保证task之间不相互影响

asp.net中怎么实现扫描二维码可以查看另外一个表单中的详细信息

问题描述 asp.net中怎么实现扫描二维码可以查看另外一个表单中的详细信息 就是在二维码生成的时候如果把另外一个表单中的内容给穿进去,就好像跳转页面似得,只不过变成扫描才能查看信息 解决方案 你的扫描是用户手机扫描还是什么?用户手机扫描你要自己弄个app给用户用,附带二维码扫描功能,二维码存储一个guid,app扫描得到二维码后回发服务器存储,客户端这个二维码页面用计时器和ajax不断轮训服务器获取对应的guid,存在了就控制页面跳转到信息页面或者ajax返回相关信息显示出来