运维人要理清运维产品的能力分层体系

一个好的运维产品分层体系,是运维平台理解清晰与否的标志。

建设一个完整的运维平台,绝非一日之功,也非一两个平台所能覆盖,因此我非常喜欢用分层体系来归纳问题。无论是整体运维产品的规划体系,还是自动化体系,还是数据化体系,甚至说CMDB平台的资源体系,都可以用分层归纳总结。以下是我对运维产品整体分层体系的理解:

1.运营能力层

运营能力是体现IT运营价值,把IT的价值和业务场景紧密联系在一起,这些场景和之前谈的运营价值体系是一致的。在运维发展的不同阶段,IT系统的运营价值体现有所不同,IT运营的核心方法是有迭代式的思维

对于很多企业来说,自动化提升效率是运维第一个价值突破点,再往后,业务的高可用保证和成本控制,则是下一个价值方向;在之后,精细化运营的业务支撑则是更高的诉求,类似质量要求(质量的概念非常宽泛)。越往后,越凸显数据的价值,而非自动化工具的价值。因此我个人觉得在某一个阶段,自动化平台突破之后,自动化则不是主要瓶颈,而是数据化运营的能力。该能力在依赖平台的同时,更依赖的是运维团队的业务理解能力和经验总结。

这一层的能力都表现为一个具体的产品形式+运营方法,从而确保能够很好的闭环起来。

2.平台能力层

在一个完整的运维平台中,其能力是集成的,而非离散的--系统需要提供很好的集成能力,让系统得到收敛,避免系统被割裂成一个一个的执行单元,用户为此痛苦不堪;是场景化的,而非基于功能需求的--场景能够串联工具的能力;是基于角色的,而非基于单一用户的--运维的角色能过清晰定义场景需求,用户的需求往往是片面而不真实的需求;基于事务的,而非基于职能的--事务能过跨越职能组,让运维组织的自动化和数据能力流动起来。

平台能力是指基于底层平台构建起来的运维自动化/数据化(监控+分析)/安全的能力平台,这层能力实现了底层能力的组合与封装,屏蔽底层各个专业子平台的实现细节,是面向业务运维场景的,比如说应用交付/资源交付/业务交付/持续反馈等等。

3.通用能力层

通用能力层是基于基础设施之上封装的公共服务能力,这层架构的能力分成两部分:一部分是面向业务技术架构的,另一部分是面向运维服务架构的。图中列的服务只是其中的部分,这个也是我经常和交流者强调能力建设的核心,不能把这个问题留给下面资源能力层,也不能交给上层平台能力层。

对于线上技术架构来说,里面涉及到名字服务/负载均衡服务/分布式缓存/消息队列/分布式关系存储等等,运维需要对其技术实现的同学要求API直接调用的服务能力。

对于运维服务来说,提供了资源服务/作业服务/部署服务/F5管理/GSLB等等。这层的平台能力我一直理解成PAAS平台的核心,有了它们其实就可以实现端到端的能力调度。

该层服务能力平台可以很好的对上层平台进行积木式的支撑,同时可以对底层设施层能力做服务化能力交付,脱离了资源交付的范畴。

4.基础设施层

基础设施层是资源交付层,对于一个运维系统来说,应该屏蔽底层基础设施的交付能力,无论是IaaS,还是物理。特别对于一些IaaS云平台来说,更应该屏蔽IaaS底层实现的细节差异,通过api网关向上提供能力。国外早年有同类的产品,如RightScale,很好的实现了多云管理的能力。

基于这个思路,可以对其他系统或平台不断的进行分层分解,最终让平台的落地可执行性变得很强,而不是人云亦云的系统工具建设。

作者:老王

来源:51CTO

时间: 2024-09-21 18:27:21

运维人要理清运维产品的能力分层体系的相关文章

报名还来得及!运维人的痛点,以及如何转型,尽在今晚——2017运维/Devops在线技术峰会

策划.准备和等待了两个月,2017运维/Devops在线技术峰会直播的"正日子"终于来了. 怀着激动,以及期待大家有所得的心情,我们将和你一起度过这个难忘的"升级"之晚. 今晚的日程 当然,如果你现在还没报名,现在还来得及--这是大会官网,戳此进入报名 报名用户,可以在会后第一时间得到所有学习资料,包括全部视频和PPT. 以下是本次在线技术峰会的背景: 近几个月,运维事件频发.从"炉石数据被删"到"MongoDB遭黑客勒索",

从携程到知乎,运维人该如何觉醒?

最近互联网也是非常有意思,接二连三的发生故障,让我们一起先回顾一下. 2015年5月11号晚上21点左右开始,网易的网易新闻.云音乐.易信.有道云笔记等移动应用均无法正常刷新,网易名下的游戏也全线瘫痪.故障原因:骨干网络遭受攻击. 2015年5月27日下午,部分用户反映其支付宝出现网络故障,账号无法登录或支付.故障原因:光纤挖断.影响时长:4个小时 2015年5月28日上午11:09,携程官网及APP出现故障无法打开,到28日23:29全面恢复,整个过程耗费12个多小时.故障原因:误操作.影响时

运维人,你应该具有的五大O2O思维

在最近的多次客户交流中,我反复强调运维要有以下思维:"三分线下,七分线上:三分运维平台,七分技术架构".运维需要"从线下走到线上,从离线走向在线",简而言之就是一种O2O的运营思维.具体的O2O思维如何理解?(文末有O2O的四象限能力提取) 1.O2O中的Offline思维 这是三分运维平台的部分,也就是线下的内容.运维平台的建设要把握主线,以CMDB平台为核心,在之上分为两块,一块是持续交付平台,大家说的自动化,用来提升交付的效率和质量,同时降低对人的依赖:另外一

运维人必备:日志分析工具日志易之银行业解决方案

运维人必备:日志分析工具日志易之银行业解决方案银行和金融服务行业面临着因为技术革新带来的许多挑战和机遇.系统每天产生数以 TB 计的交易.支付.渠道等各种日志数据.银行机构必须为迅速增长的海量数据建立全新的处理策略和维护能力,以应对日趋复杂的管理需求和抓住不断变化市场机遇.日志数据中蕴藏着丰富的知识,可以帮助银行机构提高服务质量,占据竞争优势.1.关联事务查询横跨多个应用.设备进行实时关联分析,帮助金融机构从头到尾地跟踪事务,确保事务完整性.2.多维度异常分析帮助金融机构实时了解用户行为,在用户

二维码-做一个微信计算运势和命理的程序

问题描述 做一个微信计算运势和命理的程序 想做一个微信计算运势和命理的程序,请问在使用visual studi环境中,如何构一个这种程序,又怎么通过微信二维码收费? 解决方案 http://www.huaihai.tv/news/bendi/2014-06-22/78159.html看看人家的模式,通过广告和盗窃用户隐私赚钱吧. 解决方案二: 现在这种 东西太热门也太不道德了 解决方案三: 现在这种 东西太热门也太不道德了

数据中心运维人的中年危机

数据中心属于年轻人的行业,紧随科技前进的步伐,在数据中心里从事技术运维的人普遍年龄较轻,一般在30岁以下,尤其是一些技术操作人员都很年轻,这是由这个行业的发展特点所决定的.数据中心里技术更新换代很快,很多人跟随不上这样的节凑慢慢也就被淘汰了,还有一些就是仅掌握了初级操作水平的人员,这些工作替代性强,新手往往几个月就可以上手,这样的工作自然不需要经验丰富的老员工,与其为老员工支付高工资,不如用年轻员工,这样人力成本大为降低,工作基本也不会受到影响.在富士康的经营中,我们看到其永远都处于缺人,不断招

运维杂谈老王:详谈运维可视化、DevOps和运维危机

本文分为三个部分,第一部分从服务交付和服务度量两方面介绍运维可视化:第二部分介绍什么是DevOps以及它给运维带来的改变和影响:第三部分结合最新的数据资料和趋势聊一聊运维人可能面临的危机. Part 1    可视化 没有比"可视化"更好的一个词能概括运维的本质,而"可视化"又应该分成两部分:可视化的服务交付和可视化的服务度量.   一.可视化的服务交付 早期的运维是从ITIL开始的,那个时候大家都不知道运维是什么,幸好找到了一个IT服务最佳实践--ITIL.开始了

面向200到500人教育行业的SaaS产品推荐

笔者按: 本文讲的是面向200到500人教育行业的SaaS产品推荐,对于教育行业的企业而言,花费巨额资金用于改善.维护自身工作环境,不仅企业难以承受,而且浪费了大量的资源,显然,这种传统的教育信息化模式已经开始受到挑战. SaaS(Software-as-a-Service,软件即服务的简称),提供一种全新的软件运营模式,通过互联网提供软件服务,用户无需购买软件,而向运营商租用基于SaaS平台的软件服务,来管理企业的经营活动,大大降低了学校运营成本,而SaaS系统使用熟悉的微软的界面,在操作过程

生成二维码 并且在二维码上面加logo 求助

问题描述 我需要做二维码,同时需要加logo在二维码的正中间,求助,各位给个意见,最好详细点了,多谢 解决方案 解决方案二:是生成二维码?http://www.codeproject.com/KB/cs/qrcode.aspx这个就是了.至于中间只要不复盖所需的数据都没问题的解决方案三:这种二维码太常见了,能自定义么??解决方案四:如果你想自定义就要自己编码,而且还要自己做解码软件.加logo只要叠加上去就行,盖掉内容也没事,二维码有容错性,纠错码会搞定被盖掉的部分.解决方案五:下载:解决方案六