谷歌新论文:基于Linux的世界级跨数据中心服务器CPU监控

Google已经实现世界级数据中心服务器监控,新的技术可以监控世界范围内每台服务器上的每个任务;其最终目的是通过这些数据有选择对进程进行干预、甚至是关闭该进程让同CPU上的其它进程得以运行。

搜索巨头在技术论文(PDF)中详细的描述了这一世界级监视技术的实现方法,相信使用大型基于Linux云计算基础设施的机构都会对此感兴趣。

论文中写道:

性能隔离是云计算的主要挑战。不幸的是,Linux缺少对共享资源(比如:处理器缓存、存储器总线等)中性能干扰的防御;这样的话,公有云中的应用程序将无法避免来自邻居们的干扰。

&">nbsp;

CPI²方案使用从硬件性能计数器获得的CPI(cycles-per-instruction,平均指令周期数)数据检测问题,中断或者关闭“问题”进程从而达到预期的效果,当然它会根据相同作业中大量任务数据认知这个任务的反常与否。

本质上讲,CPI²让Google可以在集群上万个CPU核心中隔离单个核心上的单个性能低下任务,对这个任务进行检查并进行操作,而造成的CPU开销甚至不到0.1%。它并不需要特殊的硬件支持,唯一的软件依赖恰是使用Linux。

CPI²允许Google收集任何指定指令的预期CPU CPI,从这些数据中分析出标准的资源配置文件,然后使用这些标准的配置文件去帮助网络巨头确定哪些任务比一般情况下耗费了更多的CPI,从而解放与这些任务使用相同CPU的其它进程。

Google称,其绝大多数机器上都运行着多任务。作业的处理类型分为实时处理和批处理两种,同时这些作业由大量的任务组成。Google服务器上96%的任务都会与至少10个的任务组成一个作业,而87%左右的任务会与100或以上的任务组成一个作业。

但是这些任务可能会相互干扰,导致处理器缓存和内存分配问题,造成应用中的某个任务延时飙升——这正是Google不惜一切代价都想避免的问题。

为了实现任务流下每个处理器的控制,Google使用CPI监视所有运行的服务器。通过测量处理器硬件计数器,然后用CPU_CLK_UNHALTED.REF除以INSTRUCTIONS_RETIRED来获得CPI数据。

通过计算模式下的perf_event工具,Google每分钟都会收集一个长为10秒周期的数据。系统中总CPU的开销低于0.1%,并且不会对延时产生影响。

因为集群需要跨大量的平台运行,CPI的目的在于体现各种平台下的CPU运行情况。CPI的值通过每台机器上的agent进行本地分析和测量。agent通常会被给予作业中任务预期最常见的CPI分布,所以它可以独立的分析出运行的正常与否。

如果agent发现有“victim”任务受到影响变得缓慢,它将会每秒一次的对“antagonist”任务进行干涉。agent会使用一个算法来判断“antagonist”任务的CPU占用增加与“victim”任务的迟缓是否曾在关系,依据的则是指令的周期数。

如果agent识别了一个“antagonist”并发现它是个批量作业,系统将会“通过CPU hard-capping来强制减少‘antagonist的CPU占用率’”。

鉴于CPI²和Omega论文的联合作者中都有John Wilkes,Google很有可能是通过Omega(Google大型基础设施管理系统的一个组件)给agent发布任务。

“antagonis”任务的配置文件与CPI数据进行的是离线的记录和存储,这样管理员就可以通过Google的主要网络分析工具Dremel进行查询。

Google工程师使用Dremel进行性能取证,用以确定“antagonists”任务,在将来他们可能为“antagonists”任务重新制定策略,让它们在单独的主机集中运行,然后使用这个调度进度来彻底的避免这个问题。

其中有一个需要改进的方面是处理多个“antagonists”,它将会复杂化算法;另一个则是为capping任务建立的反馈途径。

论文中写道:“即使这两方面还未改善,但是CPI²是个强大的、实用的工具。”

使用CPI²获得应用性能可行信息的开销比Google其它方案来的更少,这里还存在一个被称为“Google-Wide Profiling”可同时对硬件和软件性能进行追踪的平行技术,但是只在Google小范围的进行使用。

从整体上看,CPI²提供的不只是管理,更倾向于让集群运行的更加稳定、效率。如果你在执行搜索或者查看Gmai、通过Google服务查找地址时发现比平常需要更多的时间,那么你可能就会被CPI²冷酷及无情的当做是“antagonists”。

(CSDN )

(责任编辑:蒙遗善)

时间: 2024-10-28 16:24:45

谷歌新论文:基于Linux的世界级跨数据中心服务器CPU监控的相关文章

百度推易手机背后:将开发跨数据中心存储系统

百度与戴尔近日联合推出百度易手机,这款手机上每个用户可拥有100G免费存储空间.这也引发了业界对百度大数据存储能力的关注.百度为何能提供100G免费存储空间,未来又将在大数据存储方面做哪些工作. 百度技术委员会理事长陈尚义对腾讯科技解密,称百度成立之初就开发了自己的大数据存储系统.团队云集包括谷歌.IBM.微软等数据存储和处理方面专家.他还透露,百度未来将开发跨数据中心存储系统. 陈尚义介绍,百度每天面对海量数据.每天收集几千亿网页,系统每天都产生海量日志,容量达到百PB级,需要数万台服务器存储

百度未来将开发跨数据中心存储系统

近日,百度与戴尔联合推出百度易手机,这款手机上每个用户可拥有100G免费存储空间.这也引发了业界对百度大数据存储能力的关注.百度为何能提供100G免费存储空间,未来又将在大数据存储方面做哪些工作. 百度技术委员会理事长陈尚义对腾讯科技解密,称百度成立之初就开发了自己的大数据存储系统.团队云集包括谷歌.IBM.微软等数据存储和处理方面专家.他还透露,百度未来将开发跨数据中心存储系统. 陈尚义介绍,百度每天面对海量数据.每天收集几千亿网页,系统每天都产生海量日志,容量达到百PB级,需要数万台服务器存

跨数据中心二层网络——H3C云间互联解决方案

数据中心间通常部署以下三种互联链路,每种互联链路所承载的数据不同,实现的功能不同,如下图所示: 三层互联.也称为数据中心前端网络互联,所谓"前端网络"是指数据中心面向企业园区网或企业广域网的出口.不同数据中心(主中心.灾备中心)的前端网络通过IP技术实现互联,园区或分支的客户端通过前端网络访问各数据中心.当主数据中心发生灾难时,前端网络将实现快速收敛,客户端通过访问灾备中心以保障业务连续性. 二层互联.也称为数据中心服务器网络互联.在不同的数据中心服务器网络接入层,构建一个跨数据中心的

基于云计算的铁路信息系统数据中心研究

铁路信息化经过多年的发展已经成为铁路日常工作的重要支撑,各类信息系统在运输组织.客货营销.经营管理和安全监控等工作中发挥的重要作用日益彰显.为满足业务需求,在运输站段.铁路局.铁道部都建立了各种等级的信息系统机房,并根据业务最大数据量及计算量的需求购置了主机.存储设备及相应的平台软件等,为确保信息系统安全可靠运行,主要系统大多数采用了主备机.单(或多)存储阵列结构.这些设备分布在铁路局或站段机房.在运营实践中,存在如下问题:(1)基础设施庞大,投资和维护成本需求不断增加.(2)资源使用不均衡,资

谷歌认为无制冷设施数据中心服务器温度最高可达95华氏度

谷歌位于比利时圣吉斯兰的数据中心此前没有采用任何制冷设施,而是采用自然空气进行冷却,该数据中心允许的最高温度为80华氏度.如今,谷歌又曝出消息,这家技术巨头认为无制冷设施数据中心服务器温度最高可达95华氏度. 大多数数据中心温度都保持在68至72华氏度之间,因为通常认为在更高温度下设备不能正常工作,但谷歌证明事实并非如此.保持机房更加凉爽需要耗费更多的电力,据统计,数据中心每提升一度,大约会节省4%的能源费用. 谷歌并不是唯一一个让服务器运行在更高温度并能正常工作的厂商,戴尔在大概一年前验证了其

Linux还未在数据中心层面取代Unix

Linux还没有在数据中心层面中取代Unix.尽管有Unix服务器厂商整合.但大多数数据中心仍然运行着多个版本的物理Unix服务器. Gabriel Consulting首席分析师Dan Olds称,虽然Linux和Windows的服务器的销量一直在增长,但Unix服务器不会消失.这些Unix系统在大部分企业中也扮演着不可或缺的角色:运行于系统上的关键任务应用是企业正常运营的基石.打个比方说, 虽然小型节能省油的车型在全球热卖,但这并不意味人们就不再需要翻斗车了. 在http://www.ali

基于HBase的医疗卫生数据中心构建与异构数据库同步研究

基于HBase的医疗卫生数据中心构建与异构数据库同步研究 电子科技大学 方诗伟 为确定数据模型,提出以关系数据库的E-R建模基础提出HBase的C-O-R建模思想,然后综合分析卫生部颁布医疗卫生元数据标准和部分医疗卫生机构的实际情况,实现医疗卫生信息的HBase数据中心构建.为实现把各医疗机构的异构关系数据库中的数据透明无差异的同步到数据中心,提出以下方案.首先,在数据格式上提出异构数据库产生的异构数据进行标准化的XML和JSON通用数据格式封装实现屏蔽异构数据库的数据差异;其次是传输协议简单及

谷歌发论文披露TPU详细信息,比GPU、CPU快15-30倍

自从Google去年透露自己开发了一款名为TPU的专用芯片,用于提高人工智能计算任务的执行效率,关于这种新芯片的猜测就从未停止. 今天,Google终于披露了关于TPU的更多信息.除了发表一篇有75位联合作者的论文<In-Datacenter Performance Analysis of a Tensor Processing UnitTM>外,文章的第四作者David Patterson还在美国国家工程院的活动上发表了演讲. 关于TPU的论文将正式发表于今年6月在多伦多召开的计算机体系结构

谷歌签新北欧电力购买协议 为欧洲数据中心供电

据国外媒体雅虎金融报道,谷歌与挪威瑞典两家尚未建成的风力电厂达成购买协议,希望以此来为谷歌在欧洲的数据中心提供电能. 谷歌在一份声明中表示,谷歌还购买了一些瑞典小型发电厂的电力,总计236兆瓦(MW). 挪威的Zephyr和Norsk Vind Energi公司表示,新的电厂将在2017年底投入使用,该电厂将会是挪威最大的风力发电厂. 瑞典的电厂则位于瑞典中部城市Mariestad附近,该电厂拥有22台发电机组,将于2018年年底建成. 谷歌此次交易的价格尚未对外公布.谷歌全球基础设施建设负责人