《IT运维之道》——3.3 掌握服务平衡

3.3 掌握服务平衡

IT运维的第一件要事是按照IT运维服务的原则做事,第二件要事就是将这些原则应用到IT运维服务工作当中。IT运维服务工作从服务的发起方来看可以分为主动服务和受理服务。

我们曾将IT运维专家比作IT系统的保健医生,保健医生最重要的能力是“治未病”的能力。在我国关于“治未病”最著名的故事是扁鹊见蔡桓公的故事。有一天,扁鹊进见蔡桓公,在蔡桓公面前站一会儿,说道:“您的皮肤纹理间有点小病,不医治恐怕要加重。”蔡桓公说:“我没有病。”扁鹊离开后,蔡桓公说:“医生喜欢给没病的人治‘病’,以此作为自己的功劳。”过了十天,扁鹊又进见,他对蔡桓公说:“您的病已到了肌肉和肌肤之间,再不医治,会更加严重的。”蔡桓公不理睬,扁鹊走后,蔡桓公又不高兴。过了十天,扁鹊又进见,他对蔡桓公说:“您的病已到了肠胃,再不医治,会更加严重的。”蔡桓公还是不理睬。扁鹊走后,蔡桓公又很不高兴。又过了十天,扁鹊再进见时远远看了蔡桓公一眼,转身就跑。蔡桓公特意派人去问他为什么跑,扁鹊说:“皮肤纹理间的病,是烫熨的能力所能达到的;肌肉和肌肤之间的病,是针石的能力所能达到的;肠胃的病,是药剂的能力所能达到的;病到了骨髓里,那是管辖命的神的事情了,医生是没有办法的。蔡桓公的病现在已到了骨髓,因此我就不再请求给他治病了。”过了五天,蔡桓公身体疼痛,派人去寻找扁鹊,扁鹊已经逃到秦国去了。蔡桓公后来就不治而亡了。

“治未病”的概念最早出现于《黄帝内经 》,在《素问·四气调神大论》中提出:“是故圣人不治已病治未病,不治已乱治未乱,此之谓也。夫病已成而后药之,乱已成而后治之,譬犹渴而穿井,斗而铸锥,不亦晚乎!”对于IT运维服务而言“治未病”就是主动服务,“治已病”就是受理服务。

3.3.1 主动服务
主动服务是服务者主动为用户提供一系列运维服务,其目的是为系统提供防患于未然的维护保养服务,使得系统长期处于一个健康稳定的状态。主动服务是确保信息化系统安全、高效、平稳运作的有效手段。主动服务还可以让用户获得更好的服务体验,更好地了解系统的运行状况和未来需要配备的备机及备件资源等,从而使用户对服务者产生信赖感。主动服务的形式包括:向用户提供服务计划、对IT系统定期巡检、设计必要的应急预案等。主动服务的工作内容包括:远程监控、现场巡检、技术培训、服务报告、问卷调查等。主动服务完成的效果可以从策略制定、计划实施、服务评价三个方面进行评价。

能够做好主动服务的IT服务者通常是条理性好、目的性强、对IT系统的各子系统了解比较清晰的人。他们会用心地研究IT服务的内容,编制好系统定期养护的计划。

3.3.2 受理服务
受理服务是用户在发生故障时向运维服务者提出服务需求并获得运维服务的过程,其目的是在信息化系统意外发生故障时得到快速有效的解决,从而减小对业务的影响。受理服务包括受理各类用户电话请求(故障请求、服务请求、咨询请求等)、远程请求和现场服务请求。受理服务标准包含三方面:受理服务分类标准、受理服务处理规范、受理服务效率要求。这些工作将由服务提供商和用户共同确认,双方彼此都接受与认可,作为日后执行受理服务的目标与要求。

服务提供商的资源是有限的,而用户的需求依据不同的服务类型是有轻重缓急之分的,如何将有限的资源分配给不同类型事件,需要对事件依据一定的策略进行分级,这就形成了受理服务分类标准。在分类标准的基础上,针对不同类型的事件应有相应的处理规范与子流程,以确保资源得到合理分配,这就形成了受理服务处理规范。而每一事件的处理都有一个完成目标,比如目标恢复时间与目标解决时间,将这些都详细地一一约定出来,这就形成了受理服务效率要求。这三个部分是有机的整体,也是确保受理服务能够贴近用户需求的必要保障。

1.受理服务分类标准
对于用户提出的各类请求,即故障、服务、咨询及变更等请求(统称为“受理服务事件”),我们将对其提供的服务称为受理服务,依据服务提供商在有限资源下,如何最大限度地满足用户需求、提升用户满意度,我们将受理服务按重要性来进行划分,重要性主要依据于两个维度——紧急度与影响度——来判断,详见图3.2。按照受理服务的重要性可以将服务划分为若干级(企业可根据自身实际情况划分等级,推荐为7级),不同级别的受理服务处理的流程与方式也有所不同,因此分类的情况应先取得用户的认可。

2.受理服务处理规范
受理服务处理规范包括响应时间要求、电话作业规范、事件处理流程三部分,其中:响应时间要求是针对用户拨入电话的响应速度,将用户的等待时间限定在一定范围内;电话作业规范主要约定了电话用语,以使用户感到整个受理服务过程是热情、专业、规范的;事件处理流程规定了事件从受理开始到受理结束应经历的过程,以确保每一事件的服务质量。

3.受理服务效率要求
受理服务的效率要求包括目标恢复时间要求与目标解决时间要求,依据受理服务分类与事件类型确定了每一类、每一级事件的目标恢复时间与目标解决时间。

能够做好受理服务的IT服务者通常是在平时注意积累与IT运维服务相关知识并且学以致用的人,所以他们在遇到IT故障时可以从容不迫地解决系统的故障,同时还能处理好用户的情绪。

3.3.3 服务的平衡
好的IT运维服务能为IT系统提供全方位的维护保养,IT运维专家能够把IT技术和IT服务当作一个有机的整体,为IT系统安全、高效、平稳的运作而保驾护航。我们将IT运维服务比作保健医生,那么保健医生既要能够“治未病”,也能够“治已病”。在运维服务工作中,主动服务相当于为IT系统“治未病”,受理服务相当于为IT系统“治已病”。这两项服务工作都要做,并且要做好!那么主动服务和受理服务在实际工作中的占比应该是多少呢?这需要根据每个企业的实际情况和用户对IT系统维护的需求而定。

在现实情况中,我们遇到很多主动服务和受理服务占比不合理的例子。比如当企业的IT系统处在建设期刚结束、运维期刚开始之际,运维人员没有提前在系统建设期做好准备,没有及时介入到系统运行的保障当中,那么就容易出现手忙脚乱的局面,疲于应付受理服务而无暇顾及主动服务。要避免这样的情况发生,最好在系统规划时期对IT系统的运维需求进行调研,并对IT系统的运维指标进行预先规划。规划的主要内容包括运维服务工作量的测算,运维服务中涉及的运维范围,运维服务中涉及的各子系统的技术资料,以及运维期预测产生的资源需求等。一旦在系统规划期对运维服务进行了同期规划,那么在系统建设期能够及时考虑运维服务的具体需求必然顺理成章。当系统建设期进入后期,运维服务团队及时介入到建设期的收尾工作中,将有利于IT系统平稳顺畅地过渡到运维服务期。由于提前介入,运维服务团队可以有效地开展主动服务工作,切实起到为系统保驾护航的积极作用。进入运维期,按照主动服务的工作内容(主动服务的工作内容包括:远程监控、现场巡检、技术培训、服务报告、问卷调查等)与用户进行沟通确定当期重点需要执行的主动服务项目,将主动服务工作落实到位。

主动服务虽然能够最大限度地防患未然,但不能保证系统不出现意外的故障。比如,系统设备由于使用年限的问题,出现自然老化的现象,系统设备因此产生故障,这就需要我们在受理服务工作上提供必要的保障,确保故障出现时能够快速响应用户需求,及时恢复服务。因此受理服务的工作量和工作质量也是衡量运维服务是否达到优良的重要指标。因为主动服务和受理服务的平衡是用户满意不可或缺的两项工作。这就好比武侠小说中的双剑合璧,所向披靡,如图3.3所示。

时间: 2024-10-01 01:15:14

《IT运维之道》——3.3 掌握服务平衡的相关文章

DevOps&SRE 超越传统运维之道 (上海站) 火热开启!

5月&6月, 优维科技与数人云分别在深圳和上海, 做了两场关于DevOps&SRE落地实践的深度分享, 带着大家的期待, 我们将<DevOps&SRE超越传统运维之道>话题在上海继续. 匡云竹@优维科技.张保珠@数人云.于绮@京东.周炎@东方财富网 四位业界大牛齐聚, 结合传统运维现状及实践案例,讲述DevOps&SRE的超越之道. DevOps与SRE.传统行业与互联网行业, 多个不同场景的DevOps.SRE落地实践,总有一个适合你! DevOps&

《IT运维之道》——第2章 机遇就是选择大于努力2.1 IT开发还是IT服务

第2章 机遇就是选择大于努力 IT运维之道 前面的故事说明一个道理,人生的选择很重要,选择有时大于努力,大象与蚂蚁都很努力,但结果的分量是不一样的,2004年如果你一咬牙(或者再晚点)买了房,十年的巨幅增值,比你现在干哪行都赚得快,但是往往有选择就有痛苦,这种痛苦来自于对未知的恐惧和现实需要的付出,作为一个IT从业者或是即将从业者,你该怎么选择,我们来分析分析. 2.1 IT开发还是IT服务 从宏观上讲,现在软件产品已是百花齐放,品种众多,而整个国家GDP增速也不会像以前那么高,大规模的开发时代

《IT运维之道》一导读

前 言 IT运维之道 这么多年,从事IT服务及其管理工作,觉得IT服务就像一本奇书,初读它时,觉得懂了,用起来却差强人意:有时候突然从里面发现了什么似的,又转瞬即逝:有些道理看似平淡,多年的感悟才体会到是千真万确的真理.于是,兴趣所致,常常在夜深人静时把一点一滴的得与失进行思考总结,日积月累,便有了一些积淀.而平时,在日常的工作中发现不少积极向上的同事也在探索IT服务的道路.在朋友和家人的提点与鼓励下,把多年的经验与心得凝聚成册,最终促成了此书的面世.希望与广大读者分享自己的经验,在IT服务的道

《IT运维之道》一第2章 机遇就是选择大于努力

第2章 机遇就是选择大于努力 IT运维之道 前面的故事说明一个道理,人生的选择很重要,选择有时大于努力,大象与蚂蚁都很努力,但结果的分量是不一样的,2004年如果你一咬牙(或者再晚点)买了房,十年的巨幅增值,比你现在干哪行都赚得快,但是往往有选择就有痛苦,这种痛苦来自于对未知的恐惧和现实需要的付出,作为一个IT从业者或是即将从业者,你该怎么选择,我们来分析分析.

《IT运维之道》一第1章 奇葩的IT男

第1章 奇葩的IT男 IT运维之道故事总是充满奇遇,我们这篇的主人公也不例外,几年前还是在校生的王某某,我们就叫他王大锤吧,在毕业前夕也不知不觉经历了一次人生重大机遇.

活动报名 | DevOps&amp;SRE 超越传统运维之道(北京站)

五月,优维科技与数人云的两位老王以及腾讯大梁相约深圳,做了一场关于DevOps&SRE落地实践的深度分享,现场气氛十分热烈: 带着大家的期待,由中生代技术社区发起,我们将<DevOps&SRE超越传统运维之道>话题在北京继续. 黄星玲@优维科技.邱戈川@数人云.王一男@百度.任发科(网名常新居士),四位业界大牛技术齐聚,结合传统运维现状及实践案例,讲述DevOps&SRE的超越之道. 嘉宾介绍 活动议程 13:30-14:00 签到14:00-14:40 黄星玲主题分享

DevOps&amp;SRE超越传统运维之道技术沙龙报道

6月10日,中生代技术联合数人云.优维科技在北京微软大厦举办了DevOps&SRE超越传统运维之道技术沙龙. 演讲嘉宾嘉宾黄星玲.邱戈川.任发科和王一男分别分享了<DevOps在传统企业的落地实践及案例分享><Scrum模式经验分享><如何打造易用的DevOps工具链><百度研发工具链的应用实践>,为大家带来了一场精彩纷呈的技术盛宴. 签到现场花絮 中生代北京站长Charles王做精彩开场主持秀 黄星玲讲解<DevOps在传统企业的落地实践及案

《IT运维之道》—— 导读

前言 这么多年,从事IT服务及其管理工作,觉得IT服务就像一本奇书,初读它时,觉得懂了,用起来却差强人意:有时候突然从里面发现了什么似的,又转瞬即逝:有些道理看似平淡,多年的感悟才体会到是千真万确的真理.于是,兴趣所致,常常在夜深人静时把一点一滴的得与失进行思考总结,日积月累,便有了一些积淀.而平时,在日常的工作中发现不少积极向上的同事也在探索IT服务的道路.在朋友和家人的提点与鼓励下,把多年的经验与心得凝聚成册,最终促成了此书的面世.希望与广大读者分享自己的经验,在IT服务的道路上早入门.少走

《IT运维之道》一3.1 IT运维的四件要事

3.1 IT运维的四件要事 IT服务中最主要也是最基本的服务就是IT运维服务,我们就从这里说起. 当2014年春节微信红包派发之际,移动互联网行业惊呼"微信一个晚上绑定一个亿的用户,干完了支付宝八年的工作".微信只用一晚上就完成一个亿的用户绑定,按照一晚上8个小时计算,平均每小时微信需要处理1250万用户发起的绑定请求,平均每秒钟微信要处理3472个用户,同时完成每个用户的红包派发流程.凡是参与过2014年微信红包派发或领取过的人,几乎都能较为顺畅地绑定银行卡,派发或领取红包,个人的微

《IT运维之道》——第3章 IT运维做什么 3.1 IT运维的四件要事

第3章 IT运维做什么 3.1 IT运维的四件要事 IT服务中最主要也是最基本的服务就是IT运维服务,我们就从这里说起. 当2014年春节微信红包派发之际,移动互联网行业惊呼"微信一个晚上绑定一个亿的用户,干完了支付宝八年的工作".微信只用一晚上就完成一个亿的用户绑定,按照一晚上8个小时计算,平均每小时微信需要处理1250万用户发起的绑定请求,平均每秒钟微信要处理3472个用户,同时完成每个用户的红包派发流程.凡是参与过2014年微信红包派发或领取过的人,几乎都能较为顺畅地绑定银行卡,