Kubernetes性能测试和发展计划

本文讲的是Kubernetes性能测试和发展计划,【编者的话】Kubernetes是谷歌在2014年发起的开源容器编排框架,本文作者Wojciech Tyczynski,谷歌软件工程师,文章主要阐述目前状态下Kubernetes的性能测试和下一步发展计划。

无论你的容器编排系统是多灵活多可靠,你最终还是会有些工作要做,而且你还希望它能够完成得更快。对于大的问题,常见的方案就是投入更多的机器。毕竟,更多的计算=更快,对吗?

有趣的是,投入更多节点有点像『火箭方程的暴政』(tyranny of the rocket equation,译者注:根据火箭方程,并不是火箭级数越多速度就会越快),事实上,在某些系统里加入更多的机器会使你的处理变得更慢。但是,又不像火箭方程,我们可以做的更好。Kubernetes在v1.0版本支持最多100个节点的集群,但是我们的目标是在2015年末将这个数字番10倍。这篇博文将会介绍我们现在的状态以及我们计划如何达到下一阶段的目标性能。

测量什么?

第一个需要回答的问题是Kubernetes可以管理一个多节点集群的真正含义是什么?用户期望是它处理所有操作都“相对较快”,但是我们需要精确的定义『快』。我们基于下面两个指标定义了性能和可扩展性的目标:

  1. “API响应性”:99%的API调用响应时间小于1秒
  2. “Pod启动时间”:99%的pods(已经下好镜像)启动时间在5秒以内

注意,对于『Pod启动时间』,我们明确地假设pod运行的所有镜像都已经提前下载到将要跑机器上。在我们的试验中,镜像之间虽然会有很高程度的差异性,如网络吞吐量、镜像大小等,但这些变化几乎不会影响Kubernetes的整体性能。

决定选择这些指标是基于我们在Google一星期内不断启动20亿个容器的试验。我们明确地希望测量与面向用户交互流(user-facing flows)的时延,因为这是我们的客户真的关心的事。

如何测量?

为了监控性能提高量和检测回归性,我们搭建了持续测试的基础设施。每2-3个小时我们会启动一个含有100个节点的集群,并且运行我们的扩展性测试这个集群上。我们使用一个GCE的n1-standard-4(4核,15G内存)机器作为master和多个n1-standard-1(1核,3.75G内存)机器作为节点。

在扩展性测试中,我们只专注于满集群情况,意思是一个满N个节点的集群含有30*N个pods运行在集群中,从性能测试的角度来看这是非常严苛的场景。为了重现一个客户可能的操作,我们按照下面的步骤运行:

  1. 构建pods和replication controllers去填充集群
  2. 制造一些负载,如创建或删除多余的pods或replication controllers,缩放现有的pods或replication controllers等操作,记录性能参数
  3. 停止所有运行中的pods或replication controllers
  4. 改变一些指标,检查是否满足我们的预期

需要强调的是测试主要部分是完成在满集群上(每个节点30个pods,一共100个nodes),启动一个pod在一个空集群中,即使它含有100个节点会变得更快。(译者注:这里不太清楚作者的意思)

为了测量pod启动时延,我们使用非常简单的pod,只含有一个容器,运行『gcr.io/google_containers/pause:go』镜像,镜像启动后就永远休眠。容器保证已经提前被下到节点上,我们使用它作为所谓的『pod-infra-container』。

性能数据

下面的表格包含pod启动的百分位数(第50位,第90位,第99位),在含有10%,25%,50%和100%的100个节点的集群中。

对于API响应性,下面图片展示百分位数是第50位,第90位和第99位的API请求时延,它们是根据操作和资源类型分类的。但是,要注意的是这些仍然包括内部系统API请求,并不仅仅是由用户发出的(这种情况下是由测试本身发出)

一些资源只出现在某些的图片中,这是因为图片是根据在这个操作过程中运行了什么画出来的,例如在『PUT』这个操作中并没有名字空间。

正如你看到的结果,我们已经领先的我们目标,在100个节点的集群里,对于一个pod启动时间,有14%的情况是一个满集群甚至会比99分位快5秒钟。有意思的是在『LIST』图中列出pod的时间会远远大于其他操作,这是可以理解的,在一个满集群中有3000个pods,并且每个pod大约有几KB的数据,意味着MB级的数据需要处理对于每个『LIST』操作。

已完成的工作和一些未来计划

起初的性能可以满足在100个节点的集群之上做任何测试都能足够稳定的运行,包括很多小的修复和协调,如在apiserver增加文件描述符的限制和对etcd在不同请求之间重新使用tcp连接。

然而,构建一个稳定性能的测试只是完成了第一步,使我们的集群支持增加10倍的节点。正如这个工作的结果所展示的,我们已经尽全力消除未来的瓶颈,包括:

  1. 重写controllers,使其可以被观察:之前他们是每隔几秒重新列出指定类型的对象,这会对apiserver造成极大的负载。
  2. 使用代码生成器去生成转换和深度复制的函数:尽管默认使用Go的反射功能非常方便,但它被证明效率非常的低,和生成代码相比慢10倍左右。
  3. 添加一个缓存给apiserver,避免从etcd多次读取相同数据而造成的反序列化。
  4. 减少更新状态的频率:显示一个缓慢自然变化的状态,只是在更新pod状态时,节点状态每10秒钟更新一次才可以理解。
  5. 在apiserver实现观察功能而不是重定向请求给etcd:我们更希望避免多次观察到相同的数据从etcd而来,因为,在很多情况下,它会被apiserver过滤掉。

进一步看,对于1000个节点的集群目标,建议实现的功能包括:

  1. 将事件从etcd中移除:他们更像是系统日志,并不是系统状态的一部分,也不是Kubernetes正确运行的关键点。
  2. 使用json解析器:默认使用的Go语言解析器非常慢,因为它是基于反射实现的。
  3. 重写调度,使其更高效和满足并发。
  4. apiserver和kubelets间沟通提升效率:特别是我们计划在每次更新节点状态时减小传输数据的大小。

这绝不是一个详尽的清单。我们会不断添加新的内容(或者删除现有的内容),基于在运行现有扩展性测试和新的测试中注意到的瓶颈。如果有特别使用场景和方案你希望我们去解决,请把它们加进来!

  • 我们会每周召开Kubernetes关于扩展讨论的小组会议去讨论问题和性能跟踪和提高的计划。
  • 如果你有性能和扩展性的问题,可以通过Slack加入我们的讨论:https://kubernetes.slack.com/messages/sig-scale
  • 一般性问题可以加入我们Kubernetes社区讨论: https://kubernetes.slack.com/m ... sers/
  • 提交合入和提出问题,你可以在GitHub上完成。非常欢迎每个人贡献你们的经验或者PR来使Kubernetes变得更好。

需要注意的是我们排除了API响应性参数中所有对『events』资源的操作,我们不提供任何保证对于它们,因为,这些不会影响Kubernetes去正确操作的能力(它们更像是系统日志)。

原文链接:Kubernetes Performance Measurements and Roadmap (译者:何炜)

原文发布时间为:2015-09-17

本文作者:hewei 

本文来自合作伙伴DockerOne,了解相关信息可以关注DockerOne。

原文标题:Kubernetes性能测试和发展计划

时间: 2024-10-03 16:00:20

Kubernetes性能测试和发展计划的相关文章

商务网站策划,网店发展计划策划书

www.taobaowang.com 掏宝网网站的发展计划1. B2C的处境从2001年开始兴起的电子商务,出现三种模式,B2B,B2C,C2C,B2B阿里巴巴.慧聪.买麦三足鼎立,C2C淘宝一家独大,B2C这种企业与消费者之间的电商模式由于先天的成本节约,必将成为本世纪最主要的贸易方式之一,但是在税收.价格战.物流.支付和C2C的多重夹击下,B2C却一直无法振作!但是2006年以后,B2C在疯狂的增长,却是不争的事实了.Web2.0和电子商务的互动,决定了理性的消费和更多忠诚的客户.贯彻落实党

雷军演讲:小米未来的发展计划和目标

"亚布力中国企业家论坛第十五届年会"于2015年2月28日-3月2日在黑龙江亚布力召开.小米公司董事长雷军出席并演讲.   尊敬的各位朋友,这是一个非常非常高层次的会议,我刚才就在想我应该讲一点什么,我要是讲小米讲得很多,大家就认为我在做广告,其实我真的不想做广告. 我在来之前想来想去,还是打算先介绍一下小米.因为可能每一个人都听说过小米,但不是每一个人都了解小米,尤其是在高层次的人群里,比如说我相信在座的人可能没有几个人用过小米手机,有没有用过的? 谢谢,比我想象得要多.这就说明,我

详析AT&T无线技术发展计划 AirGig可能成为真正突破

在近日于AT&T公司总部达拉斯举行的AT&T 2016行业分析师峰会上,AT&T概述了其关于AirGig.5G和LTE-Advanced技术方面的发展计划. AirGig可能成为网络架构的一个根本性改变和一个真正的运营商差异点,但是在AT&T正式在商用网络中进行部署AirGig之前,还有很多工作需要做.在5G和LTE-Advanced方面,AT&T则有着更加成熟的公共立场.峰会在这些领域并未带来任何惊喜,相反,这家运营商强调了其发展地位. Ovum的观点是,AT&a

我的分类信息网的发展计划

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 我的分类信息网的发展计划 分类信息网,从58同城到口碑网的出现,站长跟风热门的风浪一波接一波,于是网络上出现了各种种样的分类信息程序,ASP的网人,PHP的666分类,再到其它CMS的分类模块,一时间,大大小小的分类信息网在各大中小城市出现了. 经过一段时间网络无情的洗礼,一批分类信息网在亏本中倒下了,又一批新的分类信息网重新建了起来.但结束

IBM发布新全球渠道发展计划与中国渠道策略

日前,IBM在美国举办的"2014年PartnerWorld领导力峰会"上发布了最新的全球渠道发展计划,包括全新的应用开发云即Power开发平台.PartnerWorld全新的 "智慧商务就绪"计划以及增强的PartnerWorld内容,旨在帮助合作伙伴把握云计算.大数据和分析.移动.社交商务.Waston认知计算平台和安全相关的商业机会. 与此同时,IBM也面向中国的合作伙伴发布了2014年整体渠道策略.2013年,IBM立足业务创新,不断加大对合作伙伴的支持力度

智慧城市和低碳城市发展计划:全面提高信息基础设施建设水平

[<政府工作报告>"十项计划"之"智慧城市和低碳城市发展计划"原文表述] 全面提高信息基础设施建设水平,年内实现旅游景区和主要公共场所WIFI全覆盖.从政务.交通.城管.旅游.医疗等方面的信息共享平台和大数据应用入手,坚持"互联网+"战略,促进互联网与其他产业融合发展,积极打造智慧城市.今年要完成智慧城市和低碳城市的发展规划,并积极向前推进. [<三亚市国民经济和社会发展第十三个五年规划纲要>相关表述] 以数字化管理为基础

PPTV吕岩披露发展计划,可能推出智能电视

在8月7日,今年3月底出任PPTV CEO的吕岩首次公开露面,并且还披露了苏宁及弘毅投资后的PPTV发展计划,在其中,他透露道,家庭互联网未来将成为PPTV发展重点,有可能将会推出智能电视. 吕岩在此之前担任的是联想高级副总裁,负责的是全球供应链体系整合运营,吕岩在传统硬件和新媒体管理中拥有丰富的经验.但是他在出任CEO时,公司就一直期待他能够全面升级PPTV的家庭互联网战略. 据吕岩透露,目前PPTV已经成立家庭互联网事业部,约有百余人的团队,主要负责商务和涉及等供应链模块.目前该部门开发的产

LivingSocial宣布出售东南亚业务,推进策略发展计划

4月3日消息,美国第二大团购网站Livingsocial今天宣布将旗下的东南亚业务出售给iBuy集团,成交价格为1850万美元.据了解,iBuy集团是东南亚的一家 电子商务 公司. 业内人士分析称,Livingsocial的这项交易是为了推进他们的策略发展计划,并且深化再投资的形式. LivingSocial的CFO John Bax表示,Livingsocial在泰国.马来西亚.印度尼西亚和菲律宾的新兴电子商务市场上已经取得了很好的成绩.但是Livingsocial还是认为公司的东南亚业务如果

微软称仍在开发Zune品牌 但未透露发展计划

据国外http://www.aliyun.com/zixun/aggregation/31646.html">媒体报道,微软Zune软件客户端团队项目主管迈特阿克斯(Matt Akers)在Zune Insider播客中表示,Zune品牌仍然还活着,而且活得很好. 微 软最近一次发布Zune硬件产品的时间是在2009年,之后它再也没有发布过甚至也没有暗示过即将发布新的Zune11585.html">硬件设备.相反,微软一直忙着将 Zune的功能转移到Windows Phon