衡量云性能:我们需要一把不同于以往的标尺

正如开尔文勋爵所言:“衡量的目的在于了解。”不过这项简单的格言实现起来却难度极高。其真实含义分为以下两点。

第一层含义非常明确:我们无法在不加以衡量的情况下,对事物加以认知。举例来说,如果大家希望快速了解应用程序的运作情况,那么必须选取几项关键并加以追踪。“良好的性能”意味着功能可在短时间内完成,而糟糕的性能则代表着功能要耗时极久才能实现。

另一项重要指标在于,应用本身是否拥有“理想的性能”。例如,性能是否在不同负载条件下保持稳定,或者在应用的不同组件之间保持稳定?

而第二层含义则相对隐晦,但却同样重要:通过定义衡量标准,我们实际上也是在定义自身的知识界线。在应用环境当中,这可能并不是什么大问题; 但云环境则提出了完全不同的挑战。由于我们无法对环境加以全面控制,因此不能衡量一切将变得非常可怕。

当应用被迁移至云端

有鉴于此,当将服务迁移至云端时,大家必须切实利用衡量手段掌握用户的使用体验。如果做不到这一点,或者同时只能关注同一项指标,那么我们将很难做出正确的判断。

例如,在传统Web应用环境当中,我们往往会将与页面加载或者渲染速度指标视为其它组件的性能参照。例如,缓慢的页面加载速度可能意味着数据库后端存在故障或者承受的强度过大。

不过这种思考方式明显有着自己的局限:其假定应用之间的连接并不存在问题。在内部运作的基础设施当中,我们可以以此为前提进行排查——这种作法非常合理。但在云环境中,问题显然没那么单纯。

云改变了一切

在云环境内,这种假设不再成立。我们的云服务供应商会随时变更当前环境,且整个重新配置过程完全超出大家的控制范围。服务本身就是我们付费所应得的范畴,再无其它!而如果想像内部基础设施那么租赁完整的云资源,那么成本则会超出承受能力。

事实上,我们之所以将负载交由云环境打理,是因为其能够提供传统数据中心所无法企及的容量上限。这意味着底层基础设施——包括服务运行所在的网络、硬件乃至环境——始终作为变量存在。

这当然不是坏事,但问题在于衡量众多独立变量会带来巨大挑战。幸运的是,云环境本身提供了一种能够切实完成管理任务的办法:

获取数据:大多数云服务提供单个指标或者查询机制,即使您所选择的供应商不提供相关方案,也可求助于其它厂商。每秒总线信息、存储操作、计算资源使用量等等都能够成为把握底层服务动态的线索。

处理数据:

一部分云服务会聚合数据并以易于使用的方式集中提供。大家可以借此随时检查数据流量,这也应当成为任何形式的云系统的必要配套方案。

数据可视化:

大多数数据聚合服务都提供多种可视化工具。运维人员可随后借此讨论并向管理层解释当前运行状况,并确保一切处于“基准”范围内。只有把握住这种“正常”状态,异常问题才能被及时发现。

确保应用生成有价值数据:

应用日志通常分为两种类型:全面调试与停止发报。确保应用能够生成有价值且具备可操作性的指标。

不要仅依赖单一来源:

如果大家只使用当前云服务厂商提供的衡量指标,那么恐怕无法保证审计合格。正如良好的财务控制与审计是保障业务成功的关键,我们在技术层面需要采取同样的心态。事实上,大家不妨以怀疑的态度审视一切,并在必要时求助于第三方厂商。

当然,云服务供应商本身往往是最先发现问题的一方。遇到这种情况,我们应当与外部监控厂商交流问题,从而建立更可靠、更及时的衡量体系。

本文作者:谭盼雨

来源:51CTO

时间: 2024-09-19 20:42:43

衡量云性能:我们需要一把不同于以往的标尺的相关文章

采用云性能监控工具消除IT的盲点

使用公共云并不意味着企业必须牺牲应用程序和工作负载性能的可见性.使用正确的工具集可以给IT一个更全面的场景. 公共云已经成为许多企业IT计划的关键要素.越来越多的企业将他们的应用程序交付给公共云提供商,如亚马逊网络服务公司(AWS)和微软Azure.尽管IT专业人士经常将安全性视为将应用程序保留在内部部署的数据中心的原因,但是性能监控可能是另一个原因,因为组织在业务异地迁移时难以保持可见性.然而,公共云性能监控工具可以帮助克服这些挑战. IT性能监控涉及到通常难以衡量的复杂的交互网络.在私有和公

提升云性能监测水平,正逢其时

视频会议.软件电话以及UC云服务等新技术的出现,为统一通信技术与功能带来了极大的发展.微软商用Skype.思科Spark等一系列产品已经打破了传统的行业格局,这些便于使用的一体化应用使用户得以不受时间地点限制,灵活地沟通. 云则是另一个颠覆性且成长迅速的技术.公共云服务的使用(SaaS.PaaS与IaaS等)得到了突飞猛进的发展.Gartner预计在2014-2019年间,云技术的年增长率将达到22.3%.EMA最近发布的"2016网络管理大趋势报告"则显示,全网41%的流量来自外部云

提升混合云性能的六种最佳实践

经过多年公有云和私有云之争,企业用户的实际业务需求和ROI终于战胜了云厂商的情感,混合云大行其道,得到了充分的开发和利用.人们逐渐开始寻求最佳策略和最优方法以更好地管理.提升混合云性能.软件业已不再轻率地对待云端的各种应用,而是正在为云运维一体化(CloudOps)寻找最优方法. 为了更好的传递本文宗旨,我们将混合云分解成几个组成部分,并针对如何最优地管理混合云性能进行探讨.这样做的好处是,我们能将这几个组成部分融合为一个完整的混合云架构,并能对整体性能管理特征进行分析,然后再把这一切融入云运维

克服云性能问题小贴士

糟糕的性能会对公有.私有和混合云造成毁灭性的影响.使用这些快速技巧解决云应用,API等相关的性能问题. 无论是公有,私有还是混合云,都有许多移动的组件,而让一切无缝的工作至关重要.不幸的是,没有什么东西是完美的,性能问题可能对云平台产生负面影响,就像对传统的本地部署环境一样. 云性能问题主要来自于总体可用性,网络延迟和应用处理延迟.最终用户的体验是云计算的重要组成部分,性能监控工具可以帮助防止潜在的问题. 使用这些快速技巧来解决云性能问题,并在将来彻底避免这些问题. 使用云性能监控工具 将应用迁

深度学习提速280%!阿里云性能怪兽GN6 V100 GPU实例深度测试

高性价比深度学习神器!阿里云GPU实例V100 最深度评测 在 GTC 2017 大会上,NVIDIA 的 CEO 黄仁勋正式发布了其新一代旗舰计算卡 Tesla V100,但是一项技术从发布到真正使用到生产环境中,仍需要大量的时间.V100 何时才能够被广大消费者接触到呢?阿里云首先交出了自己的答卷. 近期,国内云计算一哥阿里云开启了新一代高性能 GPU 计算云服务器 GN6 系列的公测,也是国内运营商中首个提供最新 NVIDIA V100 GPU 的云服务提供商. GPU 云服务器 V100

新型存储技术助力私有云性能

共享是伟大的,但是共享是否能够提高私有云存储服务性能呢?可考虑使用新型固态硬盘(SSD)和网络选项来帮助您获得您所需的速度. 私有云可提供一个集敏捷性.灵活性和运营开销于一体的定价模式,但是其性能,尤其是与存储服务相关的性能是一大挑战.当用户在管理私有云时,管理员们需要经常地了解底层存储资源的使用状况,以避免出现存储资源短缺的情况. 企业中的所有用户都在共享使用他们的私有云存储服务.这是可能的,因为私有云是网络存储,同时根据数据中心的配置,私有云可能距离服务器实例并不遥远.网络和协议的延迟将降低

新型存储技术提高私有云性能

共享是伟大的,但是共享是否能够提高私有云存储服务性能呢?可考虑使用新型固态硬盘(SSD)和网络选项来帮助您获得您所需的速度. 私有云可提供一个集敏捷性.灵活性和运营开销于一体的定价模式,但是其性能,尤其是与存储服务相关的性能是一大挑战.当用户在管理私有云时,管理员们需要经常地了解底层存储资源的使用状况,以避免出现存储资源短缺的情况. 企业中的所有用户都在共享使用他们的私有云存储服务.这是可能的,因为私有云是网络存储,同时根据数据中心的配置,私有云可能距离服务器实例并不遥远.网络和协议的延迟将降低

使用C#设置系统时间(不同于以往的文章,是经过测试的)

using System;using System.Drawing;using System.Collections;using System.ComponentModel;using System.Windows.Forms;using System.Data;using System.Runtime.InteropServices; namespace WindowsApplication1{  [StructLayout(LayoutKind.Sequential)]  public st

阿里云SSD云盘第二轮公测 性能提升20倍

本文讲的是阿里云SSD云盘第二轮公测 性能提升20倍6月9日,阿里云开启了"大杀器"SSD云盘的第二轮公测,其IOPS提升到了20000,是当前云盘性能的20倍.同时,盘内数据全部实时落盘,可靠性9个9.尤其适合中大型关系数据库.核心业务系统以及中大型开发测试环境使用.SSD云盘已在杭州地域公测,公测期至7月15日免费使用. IOPS(Input/Output Per Second)即每秒的输入输出量(或读写次数),是衡量磁盘性能的主要指标之一,一个普通的7200转的家用磁盘的IOPS