每秒 180 万亿次,谷歌新一代 TPU 三大变化值得关注

在人工智能领域,训练一个先进的机器学习模型需要投入大量的计算资源。随着机器学习算法越来越多的应用在各个领域并表现出优越的性能,对于机器学习算法专业硬件的需求,也变得越来越强烈。

2016 年,谷歌首次公布了专为加速深层神经网络运算能力而研发的芯片——TPU,在计算性能和能耗指标上,TPU 的表现都远远优于传统 CPU、GPU 组合。(我们在上个月也曾发布过一篇文章,解析 TPU 耀眼成绩背后的原因)

在 5 月 19 日凌晨举行的谷歌 I/O 2017 大会上,谷歌正式发布了第二代 TPU。新的芯片相比初代产品,在性能、应用、服务方面再一次实现突破。

一、性能方面

新一代 TPU 能够同时应用于高性能计算和浮点计算。 并且最高可以达到每秒 180 万亿次的浮点运算性能。相比而言,上周英伟达刚刚推出的 GPU Tesla2 V100,每秒只能达到 120 万亿次浮点运算。

相比第一代在功能上实现从无到有的突破,第二代的起点相对更高,开发团队也能更加集中资源来提升改进 TPU 的性能。相信通过硬件、软件的优化,后续第三代、第四代在性能取得持续突破的可能性非常大。

二、应用方面

第一代 TPU 没有特别提到组合应用、集群应用的功能,而且自身没有存储空间。第二代在发布会上直接就展示了一个 包含 64 颗二代 TPU 芯片的 TPU pod 运算阵列。这个运算阵列, 最多可以为单个 ML 训练任务提供每秒 11.5 千万亿次的浮点计算能力,大大加速机器学习模型的训练。

也有专业媒体提到,新的 TPU 在左右两侧各有四个对外接口,在左侧额外增加了两个接口。这些接口未来可能允许 TPU 芯片直接连接存储器,或者是直连高速网络,从而实现更加复杂的运算。理论上,开发者也能在此基础上设计更多的功能,添加更多的扩展。

三、服务方面

从 Cloud TPU 的命名上面,也可以直观地了解到,新一代的 TPU 将加入谷歌云计算平台,并对外提供云服务。这也就意味着 TPU 不再只是谷歌内部的独享服务,而将成为任何人都能轻松分享、应用的神器。

这里就看出谷歌比较贼的地方了,第一代刚出来的时候,藏着掖着的,还特别低调地说只打算自己内部使用。二代研发出来,直接就上云了:硬件不对外销售,服务可以啊。

如果是直接的硬件销售,很多中小型的公司(比如我们公司:智慧思特)可能会更加偏向于选用 GPU:应用范围更广,可以根据需要安排处理不同的任务。大型的公司(比如阿里、Facebook),ML 任务量非常大,才会考虑采购 TPU,甚至出于经费、效率的考虑,自主组建团队进行研发(比如这次谷歌自己做 TPU,Facebook 也有过自主研发数据中心硬件设备的报道);

对外销售服务的话,首先是激活了中小企业的这块需求市场,用户只需根据使用时间进行付费,节省了成本。另外,大型企业自身的资源利用率也有了很大的提升,摊薄了成本。比如阿里,为了应对双十一准备的海量服务器,在闲暇时间可以对外提供云计算服务。最后,避免了跟硬件厂商(比如英伟达)直接的利益冲突。

四、小结

综合来说,TPU,尤其是 Cloud TPU 让大型互联网公司印证了自主研发硬件的可行性。

性能上,针对自主业务进行成倍优化,节约硬件采购、数据中心建设、时间消耗等成本;应用上,可以灵活地与现有设施、设备进行组合、扩展;服务上,通过云实现资源的对外销售,赚取收益。

对应的,根据企业自身业务的不同,未来可能出现的定制化硬件设备也会不一样。比如针对在线交易数据处理的 APU?针对在线社交互动的 FPU?

至于如何评价 Cloud TPU,大概可以算是标志着人工智能专业硬件时代的到来吧。

====================================分割线================================

本文作者:AI研习社

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-04 06:21:10

每秒 180 万亿次,谷歌新一代 TPU 三大变化值得关注的相关文章

美国部署最新超级电脑 每秒运算5340万亿次

气象专家利用超级电脑模拟大气变化 1月13日,据科技网站ZDNet报道,近日,美国推出了一台新型超级电脑,其运算速度可达每秒5340万亿次.据悉该电脑将在GPS和其他传感器技术的协助下对极端天气进行预测. 这台超级电脑名为夏延(美国地名),它将被安装在美国国家大气研究中心(NCAR)位于怀俄明州的超级计算中心.这台电脑比NCAR现有的超级电脑"黄石"快的不止一点. 黄石超级电脑也不是什么善茬,其运算速度可达1500万亿次每秒,绝对是世界级的超级电脑之一,黄石由IBM公司打造,其机身内搭

中国首台万亿次计算机诞生 仅微波炉大小

我国首台采用自主设计的"龙芯3B"八核处理器和超多端口千兆以太网交换芯片的万亿次高性能计算机"KD-90"由中国科学技术大学与深圳大学联合研制成功,并于12月26日通过了以陆汝钤院士为组长的专家组鉴定. 这是我国高性能计算机国产化的又一次重要突破.此前,陈国良院士团队成功研制出我国首台基于"龙芯2F"处理器的国产万亿次高性能计算机"KD-50-I"和基于"龙芯3A"四核处理器的国产万亿次高性能计算机&quo

中国首台万亿次计算机研制成功 集成龙芯8核CPU

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 据新华社合肥12月29日电(记者徐海涛鲍晓菁)我国首台采用自主设计的"龙芯3B"八核处理器的万亿次高性能计算机"KD-90",由中国科学技术大学与深圳大学联合研制成功,日前在合肥通过专家组鉴定. 据悉,高性能计算机KD-90采用单一机箱,集成了10颗八核龙芯3B处理器,理论峰值计算能力达到每秒1万亿次.

中国首台万亿次高性能计算机研制成功 成本低于20万元,功耗低于9

我国首台采用自主设计的"龙芯3B"八核处理器的万亿次高性能计算机"KD-90",由中国科学技术大学与深圳大学联合研制成功,日前在合肥通过专家组鉴定. 据悉,高性能计算机KD-90采用单一机箱,集成了10颗八核龙芯3B处理器,理论峰值计算能力达到每秒1万亿次.系统硬件由1个前置服务器.5个计算节点.2个千兆以太网交换机以及监控单元组成.其中,前置服务器和计算节点均采用了我国自主设计的龙芯3B八核处理器,主要互连部件采用了http://www.aliyun.com/zi

我国各地云计算规划点评 2015年产业规模1万亿

核心提示:据统计,到2015年,我国云计算产业链规模将达7500亿至1万亿元,在战略性新兴产业中所占的份额有望达到15%以上. 中国IDC圈6月15日报道:IDC圈记者日前获悉,国家发改委.工信部.科技部等多部委共同参与的<加快发展高技术服务业的指导意见>已进入起草阶段,其中,云计算产业将被作为未来高技术服务业的主角.北京.上海.深圳.杭州.无锡等五个"钦定"的试点示范城市自然不甘居人之后,多个政企合作的云计算应用项目有望在今年落地.据统计,到2015年,我国云计算产业链规

国产万亿次高性能计算机诞生

国产万亿次高性能计算机诞生 4月21日,中科大研制小组成员在介绍"KD-60"计算机使用的"龙芯3A"芯片.我国首台采用国产高性能通用处理器芯片"龙芯3A"和其他国产器件.设备和技术的万亿次高性能计算机"KD-60"近日由中国科学技术大学和深圳大学联合研制成功,并通过了专家鉴定.这是继2007年底中国科大成功研制基于"龙芯2F"处理器的高性能计算机"KD-50-I"后,我国高性能计算机国

首台基于龙芯3A国产万亿次高性能计算机诞生

新华网合肥4月21日电(记者 熊润频)记者从中国科学技术大学获悉,我国首台采用国产高性能通用处理器芯片"龙芯3A"和其他国产器件.设备和技术的万亿次高性能计算机"KD-60" 近日由中国科学技术大学和深圳大学联合研制成功,并通过了专家鉴定.据悉,这是继2007年底,中国科大成功研制基于"龙芯2F"处理器的高性能计算机 "KD-50-I"后,我国高性能计算机国产化的又一次重要突破. 去年9月,中科院计算技术研究所成功研制出了64

阿里巴巴电商零售额突破1万亿

制图:钟文静 2012年11月30日21时50分18秒,这是一个让阿里巴巴公司载入史册的日子,也是中国电商行业迈过的一道门槛.此时此刻,阿里旗下电商平台淘宝+天猫的销售总额突破1万亿元这也是中国第一家销售规模达到13位数的民营企业.在这1万亿元背后,有许多问题值得思考-- 1万亿意味着什么? "富可敌国"的阿里巴巴 在此之前,很少有人想到1万亿元对企业而言意味着什么.因为除中石油.中石化等极少数央企外,中国再也没有哪个企业的年营业额可以达到万亿级别,这其中不仅包括零售企业,也包括规模型

汽车后万亿市场谁将会是最后的赢家?

摘要: 黑马哥 中国,这台全球 汽车 业最大的发动机,仍在凶猛地咆哮.在刚刚过去的2014年,中国人买走了超过2300万辆汽车,连续六年保持世界第一.钱包鼓起来的中国人正把汽车梦变为现 黑马哥 中国,这台全球 汽车 业最大的发动机,仍在凶猛地咆哮.在刚刚过去的2014年,中国人买走了超过2300万辆汽车,连续六年保持世界第一.钱包鼓起来的中国人正把汽车梦变为现实.在北京等大城市开始限购之前,私家车在中国许多城市都经历了井喷式的爆发.当下,在中国的大街小巷上共行驶着1.6亿辆汽车.当这些汽车被交付