运维人,你应该具有的五大O2O思维

在最近的多次客户交流中,我反复强调运维要有以下思维:“三分线下,七分线上;三分运维平台,七分技术架构”。运维需要“从线下走到线上,从离线走向在线”,简而言之就是一种O2O的运营思维。具体的O2O思维如何理解?(文末有O2O的四象限能力提取)

1.O2O中的Offline思维

这是三分运维平台的部分,也就是线下的内容。运维平台的建设要把握主线,以CMDB平台为核心,在之上分为两块,一块是持续交付平台,大家说的自动化,用来提升交付的效率和质量,同时降低对人的依赖;另外一块是数据化平台,里面涵盖端到端的监控体系和数据分析体系。

最近,我思考最多的是运维自动化平台该不该称之为自动化?后来我的思考是把这个运维自动化从我们的平台中去掉了,不叫自动化了。我仔细看了很多产品,包括传统企业的自动化方案,比如说bmc的自动化,做得都不差,因为本质上就是一个流程引擎加执行器,体现不出能力差异。那到底是什么让互联网运维自动化和传统有所不同,我的答案是在交付能力。交付是一个动词,后面可以连接很多宾语,交付价值,交付服务,交付资源,交付能力,交付配置,交付应用都可以,不是么?其实自动化是交付能力的一个要求而已,最重要的交付的质量,交付的效率。我们需要有持续交付的全局思考能力,把交付能力按照角色,按照场景,按照IT成熟度来构造不同的交付能力,这样产品才能真正的带来价值。

在前不久看过一个金融的应用发布流程,里面涉及到几十个环节,很多人一看惊呆了,我说恰恰这个流程暴露出一个问题,内部很多平台的服务化能力不足。比如人为的把一个机器获取分成了多个过程,而不是一次完整的资源交付。但我去要一个设备的时候,我要拿到一个物理机,然后自己去根据KS文件装操作系统,开通防火墙,其实这些都应该被打包(package)到一个交付机器的服务里面呀!

这两大平台,最终基于CMDB的业务信息管理,可以实现平台闭环和互通。工具平台的能力,可以被监控平台使用,提高故障自动处理的能力;数据分析平台的数据分析结果和模式发现,可以作为持续交付耦平台的调度决策的输入。

2.O2O中的Online思维

这是七分技术架构的部分,也就是线上的内容。我觉得运维质量/效率的提升,成本的降低,深度依赖这个线上的技术架构服务化能力。但我们绞尽脑汁考虑如何提高持续交付的自动化能力,降低应用发布的复杂度的时候,从来没有考虑过对线上下点功夫。一个应用的规范打包过程,可以降低对cmdb自动发现的依赖;一次服务关系调用的上报,可以降低对日志监控的依赖;对F5和DNS能力的自动化封装,可以降低对人为变更的依赖;一旦服务调用经过防火墙或者F5,你的服务调度就不再单纯了。

我为什么和大家讲精益运维,要知道日本人对生产线的苛刻要求是,一旦发现生产线质量问题,要终止所有的生产活动。精益的观点,就是带着吹毛求疵的态度来面对运维!

3.O2O中的OO互通思维

没有一个很好的平台支撑,线上的能力也没法进一步加强;没有线上能力的配合,线下的平台也没法足够简单,两者相辅相成,互相促进。

一定不要在错误的道路上越走越远!把线下和线上打通,方得始终。就拿我们自身现在的创业项目来说,我们从一开始就对线上的能力设定了很高的要求,他把可运维性作为一个严格的标准(可能跟我们是运维出身有关系吧!CTO是设计和实现腾讯“织云”的)。我们接入了统一调度,使用了名字服务,借助了自动化测试;还使用了统一接口规范,方便自动生成接口说明文档,也方便可测试;统一打包,方便变更。实现了这些能力,我们就减少了对人肉运维的依赖,我们未来某个节点需要扩容,直接告诉客户加入一个节点就好了,不需要写复杂的文档了。

4.O2O中的持续运营思维

在客户交流时,客户难免会说,你提的很多想法都非常好,但是在我们这边改变很难,其实我也知道改变很难。我说可以尝试一些运营的思路,之前一直不是和大家说运维其实是IT运营么?

首先,我们需要有灰度的思维,灰度的过程是从非核心业务到核心业务,从关系好的研发到关系一般的研发,从技术热情高的研发到技术热情一般的研发。你必须掌握这个路径,你不能一开始就Cover所有,让所有的人和业务都按照你的思路来,必然失败。

其次,你必须能够系统化描述你的思路和达到的收益。很多运维都只是只言片语的描述自己的思路和方案,这一点非常不好。我们需要这样一个成体系的语言来和开发/测试进行沟通,甚至是业务部门,沟通这个可运维性方案带来的好处。做成一个PPT,每个月沟通,在UC九游,他们有个规划沟通会,部门花费几天,把干系方拉到一起,大家依次讲自己的方案,效果非常好。其实研发和运维之间本没有墙,人多了便有了墙!

最后,你必须要有一个平台来承载和可视化你的想法。甚至在你没有业务接入的时候,你也需要有一个可视化的平台来呈现你的Idea,让对方看到效果,往往这个是最能打动人心的。人是理性的,也是视觉的,直接看到视觉呈现后带来的直观收益,没有理由拒绝的。

剩下的就是运维认定目标,开始干活了。万事开头难,当你接入了第一个业务之后,其他的业务的进展会大大提升。我一直认为研发不是运维的敌人,其实他们对待自己开发的应用或者程序更认真,更希望他们可用性更高,只是很多时候也苦于时间和无运维思路罢了。但一定要注意,这招别玩坏喽,就是说一出手必须要成功!

5.O2O中的“补贴”思维

其实都能看得到,开发拒绝运维需求就是那么几招,第一招:如果上了你们的方案,性能下降,会需要更多的机器;第二招:如果这期上线运维的需求,产品上线的进度会有影响。对付第一点,特别简单,补贴他们一些资源。之前在UC推MySQL高可用方案的时候,就是采用的这个策略;做双中心的时候,说需要一倍的机器,我说能带来双中心的运维突破,给机器好了。但第二点,我觉得破局的策略就是运维需要走出去,往研发侧走,往研发流程前面走,研发阶段-》设计阶段-》需求阶段,多做时间上的补贴,不断的宣导。

O2O的思维是让运维意识到不要太迷恋平台的能力,工具就是工具,永远不能超越技术架构设计思想背后所蕴藏的能量。O2O思维也是一种DevOps思维,O要懂运维和研发,不懂研发的运维不是好运维。今天也要强调,不懂运维的研发,我觉得也不是一个好的研发。O2O思维更是一种运营的思维,不想着持续迭代和优化,运维是走不出困境的。

附录参考:

运维的O2O四象限总结如下:

作者:老王

来源:51CTO

时间: 2024-09-27 23:16:32

运维人,你应该具有的五大O2O思维的相关文章

报名还来得及!运维人的痛点,以及如何转型,尽在今晚——2017运维/Devops在线技术峰会

策划.准备和等待了两个月,2017运维/Devops在线技术峰会直播的"正日子"终于来了. 怀着激动,以及期待大家有所得的心情,我们将和你一起度过这个难忘的"升级"之晚. 今晚的日程 当然,如果你现在还没报名,现在还来得及--这是大会官网,戳此进入报名 报名用户,可以在会后第一时间得到所有学习资料,包括全部视频和PPT. 以下是本次在线技术峰会的背景: 近几个月,运维事件频发.从"炉石数据被删"到"MongoDB遭黑客勒索",

从携程到知乎,运维人该如何觉醒?

最近互联网也是非常有意思,接二连三的发生故障,让我们一起先回顾一下. 2015年5月11号晚上21点左右开始,网易的网易新闻.云音乐.易信.有道云笔记等移动应用均无法正常刷新,网易名下的游戏也全线瘫痪.故障原因:骨干网络遭受攻击. 2015年5月27日下午,部分用户反映其支付宝出现网络故障,账号无法登录或支付.故障原因:光纤挖断.影响时长:4个小时 2015年5月28日上午11:09,携程官网及APP出现故障无法打开,到28日23:29全面恢复,整个过程耗费12个多小时.故障原因:误操作.影响时

数据中心运维人的中年危机

数据中心属于年轻人的行业,紧随科技前进的步伐,在数据中心里从事技术运维的人普遍年龄较轻,一般在30岁以下,尤其是一些技术操作人员都很年轻,这是由这个行业的发展特点所决定的.数据中心里技术更新换代很快,很多人跟随不上这样的节凑慢慢也就被淘汰了,还有一些就是仅掌握了初级操作水平的人员,这些工作替代性强,新手往往几个月就可以上手,这样的工作自然不需要经验丰富的老员工,与其为老员工支付高工资,不如用年轻员工,这样人力成本大为降低,工作基本也不会受到影响.在富士康的经营中,我们看到其永远都处于缺人,不断招

运维人必备:日志分析工具日志易之银行业解决方案

运维人必备:日志分析工具日志易之银行业解决方案银行和金融服务行业面临着因为技术革新带来的许多挑战和机遇.系统每天产生数以 TB 计的交易.支付.渠道等各种日志数据.银行机构必须为迅速增长的海量数据建立全新的处理策略和维护能力,以应对日趋复杂的管理需求和抓住不断变化市场机遇.日志数据中蕴藏着丰富的知识,可以帮助银行机构提高服务质量,占据竞争优势.1.关联事务查询横跨多个应用.设备进行实时关联分析,帮助金融机构从头到尾地跟踪事务,确保事务完整性.2.多维度异常分析帮助金融机构实时了解用户行为,在用户

云计算来袭 运维人准备好了吗?

目前,大多数中小企业的运维在做什么?配置服务,协调上线,服务监控,数据备份,还有免不了的做苦力扛机器?? 如果有一天,这一切都不再需要人来做,你该怎么办? 运维领域的变化 随着云计算的落地,这一趋势正变的越来越明显.最近,一个做运维的朋友跟我聊天的时候发感慨,说感觉现在整个业界的热点都在开发领域,忽然觉得运维领域没什么可发展的.再之前,我在车库开源小组跟白清洁聊天的时候,他们也不约而同的感慨运维领域正在发生的一些变化. "以前,你要去买服务器,找IDC找机房,架个系统,然后就做各种事情保证业务不

运维人要理清运维产品的能力分层体系

一个好的运维产品分层体系,是运维平台理解清晰与否的标志. 建设一个完整的运维平台,绝非一日之功,也非一两个平台所能覆盖,因此我非常喜欢用分层体系来归纳问题.无论是整体运维产品的规划体系,还是自动化体系,还是数据化体系,甚至说CMDB平台的资源体系,都可以用分层归纳总结.以下是我对运维产品整体分层体系的理解: 1.运营能力层 运营能力是体现IT运营价值,把IT的价值和业务场景紧密联系在一起,这些场景和之前谈的运营价值体系是一致的.在运维发展的不同阶段,IT系统的运营价值体现有所不同,IT运营的核心

GOPS2016全球运维大会 精彩首度披露

本文讲的是GOPS2016全球运维大会 精彩首度披露[IT168 资讯]     1.关于全球运维大会 全球运维大会由开放运维联盟(OOPSA)和高效运维社区(GreatOPS)联合主办,指导单位为工信部信息通信研究院数据中心联盟(DCA).全球运维大会是国内第一个运维行业的垂直技术会议,面向互联网及传统行业.广大运维技术人员,传播先进技术思想和理念,分享业内最佳实践. 开放运维联盟由运维行业资深专家联合发起,成立2个月,注册会员2500余名.高效运维社区是国内第一个运维垂直技术社区,汇聚国内一

【资料合集】运维/DevOps在线技术峰会:文章、PDF+回顾视频!

从传统IT部署到云,人肉运维已经是过去式,云上运维该怎么开展?尤其是云2.0时代,运维已经向全局化.流程化和精细化模式转变.与此同时,人工智能的发展,"威胁论"也随之袭来--运维是不是快要无用武之地了?如何去做更智能的活,当下很多运维人在不断思考和探寻答案. 1.同城容灾架构剖析--夸父 演讲视频:http://yq.aliyun.com/webinar/play/202 PDF下载:https://yq.aliyun.com/attachment/download/?id=1523

清华裴丹分享AIOps落地路线图,看智能运维如何落地生根

大家上午好,非常荣幸,能有这个机会,跟这么多的运维人一起交流智能运维.最近这两年运维里面有一个很火的一个词叫做AIOps(智能运维),并且有一小部分人一往无前的投入到AIOps中去了, 但是更多的人都还在持观望态度,因为大家内心中还存在一个无法回避的问题:AIOps到底在自己的场景下怎么落地?所以今天我要跟大家分享我认为的AIOps落地应该遵循的路线图.既有技术路线图,也有战略路线图.这虽然不是唯一的一个路线图,但这是我今后十年会不断努力.专注和迭代的一个方向,希望为那些对AIOps感兴趣的朋友