DevOps:软件架构师行动指南3.3 服务运维功能

3.3 服务运维功能


监控是运维过程中最重要的核心,因为它收集事件、检测事故和度量以判断是否符合服务级别协议。它提供了服务改善的基础。服务级别协议也可以定义和监控运维活动,例如,发生事故后的响应时间。

监控可以和其他控制结合在一起,例如,对云资源的自动伸缩,即在一个Web服务器池中,当平均CPU负载达到70%时就触发一个规则来启动新的Web服务器。控制可以是开环或者闭环。开环控制(即不考虑监控反馈)可以用于在预定的时间进行常规备份。在闭环控制中,在决定采取行动时考虑监控信息,例如在自动伸缩的例子中,闭环反馈周期可以嵌入在更复杂的控制环中,其中低级别的控制对具体的度量指标进行反应,而高级别的控制考虑更广范围的信息和长时间跨度的发展趋势。在最高级别,控制环可以连接不同的生命周期活动。根据所需度量的测量偏差,持续服务改进可以产生服务策略、设计和移交的改变——所有这些最终也都会反过来改变服务运维。

监控的结果由开发或运维团队来进行分析并采取行动。当制定DevOps过程时必须做一个决定:应该由哪个团队负责处理事故?参见第10章关于事故处理的讨论。有一种DevOps实践是开发团队分析他们自己开发的单系统监控的结果,而包括基础设施的多系统监控则由运维团队负责,同时运维团队还负责需要一个或多个开发团队合作处理的事故上报。

时间: 2024-10-09 13:31:59

DevOps:软件架构师行动指南3.3 服务运维功能的相关文章

DevOps:软件架构师行动指南3.2 运维服务

3.2 运维服务 运维服务包括供给硬件.供给软件,或者支持各种不同的IT功能.由运维提供的服务,还包含服务级别协议(Service Level Agreement,SLA)的规格说明和监控.容量规划.业务连续性以及信息安全. 3.2.1 供给硬件 硬件可以是组织拥有的物理硬件,也可以是由第三方或云供应商管理的虚拟硬件,也可以是由个人.项目,或者大型组织中的一部分所使用的硬件.表3-1展示了这些可能性. 表3-1 个人.项目和组织使用的硬件类型 使用者 物理硬件 虚拟硬件 个人 笔记本电脑.台式机

使用DevOps实现从服务设计到服务运维的核心转换

然而,许多组织仍然在如何实现 ITIL 流程方面遇到困难,尤其是变更管理.服务资产管理.配置管理,以及发布和部署管理方面.这篇文章分享了一些实践指南,关于如何使用 DevOps 实践来实现 ITIL v3 中"从服务设计到服务运维的核心转换"("Core Transition from Service Design to Service Operation")部分所提及的过程和功能. 许多组织,从大型国际银行到互联网起步公司,都关注如何确保他们关键的基础设施及核心应

【先锋】万国数据高可用云服务背后是强大的服务运维+开放平台

在9月份的"2014全球云计算大会"上,万国数据正式发布了GDS云灾备解决方案,这一举措进一步巩固了其作为中国灾难恢复行业领军企业的地位,成立于2000年的万国数据,开始阶段主要以灾备业务为主,从2007年开始拓展整个数据中心业务,目前在上海.深圳.昆山.成都都拥有自建的高等级数据中心,全国范围内有17个数据中心在运营.在和万国数据高级副总裁陈怡琳的采访中,提及以后有无向北美.欧洲等地区扩展时,她表示,客户到哪里,我们便响应到哪里. 万国数据高级副总裁 陈怡琳 凭借世界级新一代数据中心

DevOps:软件架构师行动指南3.5 运维和DevOps

3.5 运维和DevOps 讨论完ITIL的核心概念和阶段后,现在我们强调将来传统IT运维和DevOps之间将形成什么样的交互.我们想要传达的信息是,如果认为ITIL是过于"重量级"而不适合DevOps过程,那么这个观点是短视的,并且这个观点将导致要再走过那些ITIL框架中所试图解决的"坑". 运维的职责是供给硬件和软件.拥有特殊技能的人员.服务级别协议的规格说明和监控.容量规划.业务连续性和信息安全.这些职责的大部分包含在DevOps过程中和过程外.任何关于运维的

阿里云黎山:如何利用开源DevOps工具完成云上的自动运维

编辑IT大咖说字数:2916用时:8分钟 内容概况云计算的特点是开箱即用,可以随时的扩缩容,不用考虑硬件的损坏问题,也有丰富的云服务和云平台供我们选择.在本次演讲中,黎山通过实际应用场景为我们讲述了基础设施及代码的重要性,以及在云计算的运维中,如何利用工具来实现自动化,提高效率. 大家好,今天我们围绕几个议题展开: 通过实际的应用场景来讲解IaC的重要性. Terraform.Packer的使用介绍. 多个工具组合案例+操作演示. 实际应用场景 应用场景解析一 某应用为了增大吞吐量,做了流量的均

业务服务运维是ICT运维的必然趋势

随着社会及科技的进步,已经很少有企业不使用IT设备了,上至大型的跨国公司,小到街边的便利店,无不依靠IT系统来支撑必要的办公及生产活动.因此,企业也都越来越重视IT系统的建设及维护,设立了专门的IT部门,来进行企业内的网络.IT等系统的建设及维护. 由于企业信息化的深入, IT运维部门所负责的IT设备及软件的运行维护工作变得越来越复杂, 技术难度越来越高,支撑的业务也越来越多.依靠简单的IT技术人员单打独斗的维护方式已不能满足业务的发展,必须建立一个基于人/组织,流程以及工具统一的运维体系.说到

《DevOps:软件架构师行动指南.》导读

本节书摘来自华章出版社<DevOps:软件架构师行动指南.>一书中作者伦恩·拜斯(Len Bass) [澳]   英戈·韦伯(Ingo Weber)    著 朱黎明(Liming Zhu)   前言   多年以来,我们一直在探索研究运维中的问题.自然而然地,我们也一直在追踪DevOps运动.它正在沿着Gartner成熟度曲线向上发展.这种现象有着坚实的业务原因.我们能够找到从信息技术经理视角对DevOps的探讨(例如小说<凤凰项目:一个IT运维的传奇故事>),也能找到从项目经理视

DevOps:软件架构师行动指南2.2 云的特性

2.2 云的特性 云最根本的推动者是构筑在成千上万通过因特网访问的主机之上的虚拟化技术.我们首先探讨以IaaS为中心的特性,即虚拟化和IP管理,接着是PaaS提供的一些特性.然后,我们探讨一些普遍的问题,例如数以万计的主机所带来的后果,以及云是如何支持弹性的. 2.2.1 虚拟化 在云计算中,虚拟机(Virtual Machine,VM)是物理机的模拟.一个虚拟机镜像就是一个文件,其中包含了可引导的操作系统和在其上安装的软件.虚拟机镜像提供了启动虚拟机(或者更准确一些,虚拟机实例)所需的信息.本

游戏运维编年史:可能是目前最详细游戏运维指南

游戏运维编年史:可能是目前最详细游戏运维指南 从端游到页游再到手游,15年来中国网游在世界上都有着举足轻重的地位.但是再好的游戏如果出现连接.延迟等问题时也会造成巨大损失,这时游戏运维便发挥了举足轻重的作用.中国网游的发展史,其实也是游戏运维的变革史,今天便由经典武侠手游<大掌门>运维掌门人吴启超来向我们讲述,进入游戏领域10余年来的风风雨雨. 有服务器的地方就有运维 如今我们说到游戏,可能想到的是火爆异常的VR,办公室里一言不合带上眼镜就地开打:亦或是刚刚虐了李世石的AlphaGo,扬言要挑