优云CMDB专家实践谈:自动化运维的基石CMDB

CMDB是什么?

运维百花齐放繁荣景象的同时,也让碎片化问题产生;每个人都想整合运维平台,但是往往事与愿违。

CMDB就像一个人的大脑核心,是一个信息协调库,其存储的资料是协调身体完成各种复杂运动的信息来源。

 我心中的CMDB

. 碎片整合

面向运维工具的碎片化场景,是盘活整个运维管理的数据核心

. 元数据库

提供运维活动的基础元数据,是唯一可信的运维配置数据服务

. 场景驱动

为运维联动提供数据驱动,可协调工具来完成各类自动化场景

 

 ​自动扩容+自动监控

CMDB如何建设?

痛点现象与对策 I 模型建不好

存在的问题:

. 建模粒度失去控制

粒度若建得太细,连网线、内存条都变成配置项,最后CMDB中存储的70%数据没有作用,只是做了大量无用功。

. 缺少行业实践参考

国内很多时候都是根据BMC、HP等模型来建立一个模型库,但实际上老外的思路与国人迥异,往往会做出过于复杂的模型体系。

. 模型调整太笨重

使用关系型数据库,模型中每一个类型的属性都是一个列,最后调整总是要动用研发,完成一次调整需要2天的时间,而这种调整在数据补充阶段,往往要经常进行,耗时耗力。

 

我们怎么干的– 管理

. 目标驱动

持续迭代的方式推进,只实现当前目标需要的最小模型集合。建议不要使用传统软件研发大瀑布模式来建设模型,而是使用持续迭代的方式,每次都设定一下较小的目标,按这个目标去建立刚好满足要求的模型库。

. 行业参考

寻找和借鉴行业最佳实践。寻找行业内的最佳实践,去学习他们的模型,尤其也是学习其演进路线,切不可一口吃成一个胖子。

 我们怎么干的– 技术

第一步,数据类型标签化 ,支持多重身份

传统的CMDB系统,往往使用科学分类法的思路,按界、门、纲、目等树型结构去严格划分,但这样给建模带来了非常巨大的挑战,因为一定有一些数据四不像。比如虚拟机,到底是划到传统的计算设备资源下,还是划到虚拟资源下?所以我们提议使用数据类型标签化的方式来进行分类。比如虚拟机,我可以同时打上计算设备与虚拟资源这样两个标签。

第二步,使用关系建立联系 ,分清关系与属性

使用弱类型约束的关系,而不是属性。因为属性往往要提前建模,但实际上很多配置项在建立时,是想不清楚它可能与哪些配置项产生联系的,所以使用关系可以更轻量化。

第三步,易于调整模型 ,支持动态属性

在CMDB系统的技术设计过种中,要注重使用能快速调整的存储模型,比如使用支持scheme调整友好的数据库,或postgresql这样支持json扩展字段的数据库,可以实现动态属性。

 

痛点现象与对策 II数据不准确

存在的问题:

. 人工录入数据、准确率低

. 没有及时维护、数据过期

. 数据来源多、存在冲突

 

我们怎么干的– 管理

. 确定地位

确定CMDB作为唯一数据源,若上下数据流不准确,应从CMDB开始修正

. 职权划定

自定原则,例如谁提供,谁维护

. 定期审查

从制度上需要确定团队能定期对CMDB中的数据进行审计,寻找错误数据并改进问题。如同一些仓储管理,需要定期核查帐面与实际库存,CMDB也需要定期审查数据与生产环境的实际符合度。

 我们怎么干的– 技术

. 支持协同

配置变更热点,订阅我关注的配置项变更。每个人都可以查看他人的数据足迹,配置项也允许按变更次数或者被使用次数,作成热点图,最后也应允许订阅我关心的配置项,这样可以在配置项变更时,相关负责人可以及时收到通知。

. 记录历史

允许随时查询数据的变迁历史,并可回溯基线。在每一次数据入库后,都能记录数据的变更历史,以便可以随时对比版本变更的内容,以及在纠错时回溯基线。

. 支持调和

利用策略、规则实现多数据源的调和。数据来源过多,也会导致出现数据冲突。在数据出现冲突时,能显示不同数据来源的冲突,并支持人为调和,同时CMDB系统也应学习这些人为的调和依据,可以形成自动化调和。

. 依赖工具

在数据的采集和补充上,以使用监控与自动化工具为主,它们可以减少大量的录入工作,并且避免人为的错误。

 

痛点现象与对策 III数据不好用

存在的问题:

. 不清楚有哪些使用场景

经常有这样的情形:为了CMDB而CMDB,导致最后CMDB只是当资源台帐使用,最常使用的功能也仅仅变成了EXCEL导入与导出。而实际上,我们需要建设的是一个服务型的CMDB。

. 系统开放性差

CMDB开放性差,往往只是提供了读写API,把CMDB当成一个普通的数据库来使用。

 

我们怎么干的– 管理

1.   积极寻找场景,消费数据,让数据产生价值。

2.   影响分析:使用消息盘,做配置变更演练,做故障演练。

3.   自动监控:当新增一些配置项时,可以通知到监控系统,自动产生监测策略。

4.   自动排障:在监测到故障时,可以自动排障。

5.   容量管理:在配置库中为应用记录扩容收容阈值,以便自动伸缩扩容。

6.   物联运维:CMDB中的数据,在现在的移动终端场景下,有特别好的消费场景,就是做二维码、RFID,并与手机结合,能在机房巡检与排障中产生很大的便利。

我们怎么干的– 技术

1.   关系推导:提供从一个配置项按关系提炼其它配置项的能力。

2.   全文检索:能便捷的使用关键字,搜索符合的配置项。

3.   变更通知:配置项变更不但提供对人的通知,更要利用MQ,提供对运维工具的通知,以触发一些自动化场景。

4.   事务控制:允许通过API建立沙箱,整个沙箱中的配置项是一起提交与一起回滚,这特别适用于应用的上线。

5.   版本对比:允许查询一个配置项的历史数据与变更情况。

6.   WEB集成:除了API,还应该提供应用间的界面集成还应该提供应用间的界面集成还应该提供应用间的界面集成。

 CMDB成功要素

能消费起来的CMDB才是好CMDB

模型:定义了最小可用的CMDB模型结构与规则

数据:正确地维护了CMDB各类数据及其关系

API:提供了开放友好的API服务

场景:利用CMDB的数据玩转各种运维场景

 

CMDB = 模型 + 数据 + API +场景

​作者:蒋君伟,任职广通软件新一代敏捷运维品牌优云,旗下包含CMDB、监控中心、操作中心、流程中心、度量中心一体化的“一库四中心”敏捷运维产品线,同时支持在线服务与私有部署。官网:https://uyun.cn

时间: 2025-01-20 12:53:22

优云CMDB专家实践谈:自动化运维的基石CMDB的相关文章

优云蒋君伟:自动化运维成本仍然很高

9月10日-11日,上海光大国际会展中心隆重举办了"2017上海站CNUTCon全球运维技术大会".本次大会的主题是"智能时代的新运维",各个公司为观众带来了他们关于该主题的思考,并分享了他们的实践经历.InfoQ有幸邀请了杭州优云软件有限公司的产品副总裁蒋君伟老师接受我们的采访.谈到对自动化运维未来的展望,蒋老师表示自动化运维必然是大势所趋,但是因为相关技术债务的存在,自动化运维的成本还很高.那优云自己的技术与产品是如何去做高效运维的呢?本次采访带你了解一二. I

优云软件助阵GOPS·2017全球运维大会北京站

GOPS· 2017全球运维大会北京站于2017年7月28日-29日在北京隆重举办,汇聚国内一线运维专家和诸多运维同仁达800余名.作为长期致力于企业级高端运维市场软件开发和咨询服务的优云软件受邀参与本次运维界的盛会. ▲全球运维大会北京站现场情况 ▲优云软件展台 ▲优云软件技术专家向参会者介绍全栈双态运维管理平台 在云计算.大数据和物联网的时代,企业同时面临着数字化和"互联网+"转型的双重挑战,而企业IT架构随着业务转型而急需变革,运维也面临着迭代升级.在此背景下,2016年广通软件

游戏云间之浅谈游戏运维

浅谈游戏运维--游戏云间系列三 一款游戏产品上线,仅仅从技术角度来讲,分为软件层次的游戏代码研发,及硬件层次的代码部署上线.劈开代码研发方面不讲,游戏的部署上线,成为我们一个很头疼的问题.为什么头疼?从一些报告显示,大部分的游戏生命周期仅有3个月.按照正规的上线流程,从买服务器,装环境,进IDC机房这么下来,刚把游戏上线,可是游戏却不给力.这样折腾下来,浪费了多少我们的青春?浪费了多少我们的血汗钱? 一般游戏的部署有以下几种方式: 1.托管IDC机房部署. 2.代理商部署. 3.租用vps环境部

优云·小课堂 第八期:运维自动化的魅力

本期主题:如何通过自动化运维平台来缩短软件部署和应用发布时间,减少运维过程中的人工操作从而提高企业应用的可靠性和质量,降低IT运维成本. 嘉宾:柯连春 嘉宾介绍:优云资深技术研发 直播时间:2017年8月24日(周4,晚19:30) 直播地址:https://m.qlchat.com/live/320000072565279.htm

优云mobile专家实践:Android应用HTTP框架选型

我们知道,Android应用主要是通过客户端-服务器的方式进行数据交互,一般在APP开发时可能是一个接口对应一个显示模块,这样的设计会让客户端更新时很麻烦.为了解决这个问题,通常的做法是和服务端之间定义协议,设计显示模式,进而达到实时更新UI界面的目的,增加或删除显示模块时不需要让用户手动更新apk,这种方法最常见的就是在做活动或者广告的时候用到.以我们的优云Mobile 移动端为例,Android和iOS应当使用一个统一的接口定义我们的导航栏,针对每个导航栏下的子页面数据对图形进行规划分类,U

数据中心新的自动化运维技术

自从数据中心引入了云计算.虚拟化等大咖技术,立刻变了模样,这些技术大幅提升了数据中心的运行效率,给数据中心带来了诸多好处.不过,任何事情都有两面性,我们在享受新技术带来的益处时,也给数据中心运维的管理带来了不便,需要管理对象的数量.规模及复杂度均呈现指数级增长,传统人工干预.保姆式管理监控与故障处理的方式肯定无法满足要求了.比如对于公有云及大型私有云,服务器数量往往可以达到数万到数十万.百万规模,各类系统云服务及租户的业务应用负载数量,也达到了数以百万乃至千万级的程度,这样全靠人工维护不现实,必

中小企业基于云的自动化运维实践二则

案例1:基于云的运维自动化 我们是小规模的公司,搭建在 AWS 上的服务,主要使用 Ruby on Rails,并实现了应用的水平扩容. 在专案一开始的时候只有一台 EC2 就可以跑了,后来因为专案越做越大,开始做平行扩充以及 SOA,因此我们导入了 Chef 做自动化运营,主要使用 Chef 做机器的安装及部署,使用 Cloud Watch 做机器与 Application 的效能监控,在每次 deploy 的时候做AMI,当资源负担到达设定值时,Chef 会使用最新的 AMI 开一台新的机器

如何搞定云运维——云计算IT基础设施与自动化运维论坛掠影

5月18日~20日,第八届云计算大会在京召开,工业和信息化部副部长怀进鹏出席会议并讲话,云计算大数据领域的9位院士和200多位专家在全体大会和专题论坛上作报告,三天共有超过15000人次听众参会.这个数字远远超过了往届会议,从侧面也足以说明,云计算在国内已经取得了足够的认可和关注. 事实上,有一种趋势无法忽视.企业对云计算的主要诉求从"经济"转变为"业务",也就是说,云计算推广初期所高举的"省钱"大旗不再是企业关注的主要方向,企业更关注云对其业务

博云PaaS:容器应用老司机 自动化运维践行者

近日,向来保持低调的PaaS市场有了新消息--企业级PaaS云平台解决方案提供商BoCloud博云,刚刚宣布完成近亿元人民币的B轮融资.一直以来,由于巨头入局,IaaS/SaaS市场炙手可热,此次博云融资成功,一定程度上提振了PaaS市场信心. 里程碑:容器与混合云管理平台 博云成立于2012年,一直专注于PaaS层云计算市场.5年来,容器技术在PaaS层的应用以及BoCloud混合云管理平台的推出,对博云来说可谓是里程碑式的事件,在业界也引起了较大反响. 2014年之前,博云的主要产品是虚拟化