关于运维平台的建设,元数据一直是一个很重要的环节,之前在听了ITIL方面的一些讲解之后,发现其实早已经是体系之中的,想必是很多公司很多人还没有重视起来而已。
而要说运维平台和元数据,其实我也一直比较纠结,因为我不是专业的,只是在工作中越来越意识到它的重要性,很多时候不是口上说说,提提而已,而要落到实处,更不能图形式。
我们先来说说工作之中的沟通,其实我有时候也蛮偷懒的。用一个基本的沟通方式来说,能当面就不电话,能电话就不用lync,能用lync就不用邮件。这个是一个方向,实际做起来就很难,我之前的公司的很多领导都会这么提倡,也是提高工作效率的一种方式,相比于现在的敏捷运维而言,不就是类似的思路方法嘛。
工作之中的邮件本身只是一种工作形式,我们无法根据邮件数来考核KPI,无法根据邮件的回复情况来判断每个人工作的情况,我也看到过很多工作中邮件踢皮球,邮件中的办公室政治(有时候都分不清情况,不好站队),邮件中的各种推诿。算了先不提这些,我们要说的是,邮件也可以提高工作效率,就是一种正式的,信息量比较多的时候,前提还是要通过基本的沟通清楚明白了之后。
就比如我们处理日常工单,有些工单开发同学都不用发邮件,电话,lync告诉我,我一看到工单就知道他要做什么,在什么环境等等,都一目了然。而有些同学开的工单就让人比较纠结。我看了工单看不明白,里面也没有任何环境描述,每次发邮件回复就非常费劲,来来回回可能一上午就过去了。而且不一定马上能得到我希望的结果。有时候在lync上能几句话说清楚的,也还好,不过我就想为啥一次不说清楚呢。那些邮件,lync都搞不定的,赶紧电话吧,很多时候问题听起来很紧急,很严重,其实明白了问题就很容易处理了。比如之前有个开发同学联系我,说有个问题非常紧急,但是工单里也没有提供环境,没有更多的辅助信息。最后确认发现他所说的环境就不是我负责的。还有个开发同学在我坐地铁的时候打电话,说有个任务非常紧急,希望马上处理,当时信号不好,大体听明白了问题,其实就不是数据库的问题;还有些问题听起来很紧急,好像是交到我手上开始就很紧急,结果一看工单,又是个三无工单(没有环境,没有描述,描述脚本),你说让我怎么快速处理,好容易要来脚本,发现脚本又有问题,我这个时候就会认真的告诉他们,这是线上环境,这一点上标准和规范优先级要更高。
所以我引申出一个观点,制度和规范也是元数据的一部分。
就拿最近的一件事情为例。我们有一个基本的退换服务器的流程,群发邮件大家都收到了。但是后面应该是发现直接关闭防火墙有一些风险,所以又收到了一封邮件,里面的描述就是这个流程中需要注意,不要直接关闭防火墙。而我在处理这个问题的时候,邮件实在太多了,于是就搜索关键字,找到的邮件就是第一封,因为里面的步骤最全,而且其中就有一条是可以添加主机信任,或者直接关闭防火墙,我也是为了图省事,直接就关闭了防火墙,做了服务器退还,当然退还之前我在现有系统做了屏蔽和注销,所以我们没有收到任何的异常报警,但是系统组反馈说他们收到了大量的报警短信,于是这个问题就最终变为了开通防火墙的事情了。然后又收到一封邮件,如果退还服务器关闭防火墙算是人为故障,你说这种事情你找谁说去。当然我选择了沉默,这种事情纠缠起来也很费劲,但是我的总结如下。第一个是报警的划分,如果不是具体负责的同事和组,报警信息都他们是无效的,发与不发有什么意义,这个需要明辨,而一种方式就是在资产和监控系统对接起来。第二个就是规章制度类的信息也是元数据,这类信息很重要,通过邮件又很容易出现信息不同步不一致的情况,为何不通过统一的portal或者公共页来显示,如果有什么变更情况,也很容易同步过来,新来的同事可以马上了解到这个流程。就可以避免更多的问题,信息不共享,不同步是主要根源,而不是通过加重惩罚力度来实现。
所以元数据的责任还是意义重大,我们希望更加这些信息来组织得到一个完整全面的信息链,这个意义更为重大。
运维平台的建设思考-元数据管理(五)
时间: 2024-10-09 23:53:28
运维平台的建设思考-元数据管理(五)的相关文章
运维平台的建设思考-元数据管理
之前也写过一篇比较基本的文章,也算是自己对运维平台的一个基本思考.当然想法简单,而且缺乏实践,但是朝着这个方向迈进是没有错的.从我的观点来看,现在能够实现半自动化运维已经很了不得了.而且把这些工作能够落到实处,更是不易 . 比如举几个简单的例子. 比如对于数据库的数据文件添加这个功能来说,其实完全可以实现自动化扩容.但是是否完全可行呢,我觉得还有待斟酌.比如temp设置为自动增长,如果出现了sql语句导致的问题,结果导致temp被撑爆,听说过temp无限扩展达到TB级的问题,最后还是sql语句的
运维平台的建设思考-元数据管理(二)
之前分享过一篇元数据管理的文章 http://blog.itpub.net/23718752/viewspace-1960938/ 如果服务器不多,或者人也不多,基本都是按照下面的方式来管理. 比如下面是14台服务器,会在特定的服务器(比如中控)设置一个专门的路径来存放一个文件,即服务器列表信息,然后把对应的责任人都划分出来. 当然这种方式是比较简单,也看起来确实很清晰,对于基本的管理应该是没有问题,但是一旦发生了信息的变化,这部分信息就比较容易出现遗漏,比如服务器2出现了问题,做了故障退还,那
运维平台的建设思考-元数据管理(三)
继第一篇,第二篇介绍了关于元数据的一些想法,最近做了一些改进. 对于一部分的元数据抽取大体有下面的两种方式.假设数据源已经做了很大的努力,终于统一起来了.我们现在要通过ssh的方式从源端抽取出数据来. 一种方式就是直接通过ssh的方式发送对应的查询脚本,然后可以得到一个完整的列表,二次加工即可. 另外一种方式是直接在每台服务器上都部署一个类似agent的载体,每个服务器端都会独立的运行这些脚本内容,然后通过ssh的方式返回即可. 当然下面的图有一些夸张,实际上没有这么多的数据源,只是说明了这种方
运维平台的建设思考
自己最近也在琢磨如何搭建出一个完善有效的运维平台,当然这个工作不是一朝一夕就能完成,前行的道路上肯定会有各种各样的困难和牵绊,但是自己还是能够学以致用,把一些重复性,繁琐性的工作都能解放出来,能够更加关注于更高的一个层级来看待整个系统. 我把搭建运维平台的过程分成了5个阶段,当然纯粹是个人之见,难免有不足和改进之处,欢迎交流. 第一个阶段,不同的人积累了一些的经验,可能会有针对一些功能的实现,比如脚本,工具集等等,这个时候,每个人的习惯和水平不同,没有统一的标准,但是都能够基本解决手头的问题.
优云运维专家浅谈运维平台选型,提速DevOps运维
现如今DevOps已经深入人心,在这个大量数据中心建设加速的时代,运维部门都在高度强调自动化,而自动化的关键即DevOps.但是,大家在推进DevOps的过程中却发现其前途坎坷. 一种方案是建设自己的开发队伍从头开始,做CMDB.做监控.做自动化.做流程.做服务目录.做大屏展现,这种造轮子方法需要强大持续的研发投入,成本极高: 第二种方案则是寻找开源产品改造,以适合自己,如CMDBBuild.Zabbix.JBPM等,但是开源社区的产品,技术风格迥异,成熟度低,技术团队的素质要求高.踩的坑很多,
浅谈运维平台选型,提速DevOps运维
作者简介:蒋君伟,广通软件研发中心产品部总监,IT网管与运维领域的十年老兵,负责国内多个全国性的网络管理与运维管理系统产品研发,拥有丰富的网络管理.系统运维与产品研发经验.现从事广通新一代数据中心运维产品研发工作,主要负责产品线规划.核心技术研发.研发团队建设与运维咨询等工作.此外,个人还热衷于开源社区的技术推广与研究,喜欢Emacs.Lisp与Python,实现过开源.Net SNMP协议栈,目前主要研究去中心化的大规模软件集群技术. 现如今DevOps已经深入人心,在这个大量数据中心建设加速
新华三U-Center智能运维平台问世
新IT转型趋势下,为支撑业务敏捷.稳定.创新发展,IT运维的重要性已日益凸显.IT运维业务定位也从传统支撑中心.服务中心逐步向价值中心转变.伴随着IT运维管理目标.管理范围.管理对象,管理深度的转变,IT运维平台建设呈现管理一体化.运维自动化.运维智能化.业务可视化及端到端敏捷化的关键趋势转变. 顺应这一趋势,在4月8日举办的在"新IT 新经济--H3CNAVIGATE 2017"领航者峰会上,新华三发布了全新的智能运维平台U-Center.H3C U-Center是以面向业务服务为目
阿里智能运维平台如何助力研发应对双11挑战
12月13-14日,由与阿里巴巴技术协会共同主办的<2017阿里巴巴双11技术十二讲>顺利结束,集中为大家分享了2017双11背后的黑科技.本文是<阿里智能运维平台如何助力研发应对双11挑战>演讲整理,在回顾了阿里巴巴运维历程后,为我们讲解了阿里基础运维平台和应用运维平台,并介绍了阿里相关运维产品及阿里在智能运维平台上的发展成果.内容如下. 分享嘉宾: 如柏(毛茂德),阿里巴巴高级技术专家,Apache顶级项目CXF初创成员之一,阿里集团基础架构事业群运维中台负责人,亲历者.
运营商掀起WiFi建设狂潮
■本报记者 钟顺钦 5月10日,中国电信宣布启动"无线中国"战略,计划到2012年在全国布置100万个WiFi热点.中国移动同样放出豪言,计划三年内将全国范围内的WiFi热点数量增加至100万个.继去年启动20万WLAN设备招标,中国联通近日启动了新一轮WLAN设备招标工作.三大运营商加快WiFi热点建设和WiFi设备生产的背后,折射出中国运营商速度厮杀的惨烈性, 流量经营也已经成为国内运营商3G业务发展的共识. 运营商掀起WiFi建设狂潮 当下是个速度比拼的时代.随着3G智能手机的普