运维架构师-并不遥远的彼岸

 在百度里搜索运维架构师,你会发现招聘的职位还不少并且月薪、年薪都很可观。提到架构师,大家都觉得挺神秘的,而作为运维领域的架构师,站在系统稳定和高可用、高扩展的角度,其承载着太多的责任和挑战。对于运维工程师来说,运维架构师就像是一个目标抑或是一座山峰。如何成为一名优秀的运维架构师?运维架构师应该具备何种职业素质?需要什么样的知识体系呢?

 

一、职业素质
    运维架构师一词应该是与系统架构师、软件架构师、网络架构师、业务架构师不同的,虽然都是架构师,但侧重不同。在一个企业的IT系统中,运维架构师更需要具备开放的眼光,各种平台、系统、数据库、网络架构及后端存储设计都能随手拈来皆可组合,唯一的目标则是针对合适的环境和业务应用,选择合适的部署和组合,而且在真正的生产环境中,很少会遇见与过去一模一样的情况,因此也需要运维架构师能够大胆尝试,灵活应对,使用踏实而严谨的做法来推进整个架构的变革和调整。一个运维架构师也必须拥有良好的沟通和交流能力,把自己的想法使用合适的方式告诉别人,并且根据别人的反馈进行不断调整自己的观点。

没有东西是永远正确的,一切都在发展中变化,而作为一个合格的运维架构师,需要在发展中加深自己对整个架构的认识和把握,并能分析出架构存在的真正缺陷,使用各种方式进行弥补和完善。另外架构师应该熟悉本公司的业务体系和应用,能够准确地把握需求。同时要有较强的学习能力,对于新出现的技术、开源工具、集群框架,能够快速掌握。同时作为一名架构师要有前瞻的思考,在系统的性能和高可用、可扩展性上,要有足够的敏感性,既要充分利用现有资源,又要为长远做好打算。

二、知识体系
    运维架构师需要掌握的知识比较杂,结合其职责来说说重点吧。首先需要全面负责网络架构,服务器部署、数据库和应用程序的部署和管理架构、运维平台等技术架构的方案和实施;其二需要把握网站系统整体设计和技术决策,审核解决方案合理性,指导系统实施和部署;再次需要对技术发展趋势有很高的敏感性和预测能力,能不断推进运维管理水平的进步并制定和优化管理制度、工作流程、应急预案,提高服务运行质量。

   首先熟悉网络,对网络常用的负载均衡技术和分层架构要熟悉,结合网站的内容发布、管理及静态化技术、动静分离方案,对主流网络设备的配置和冗余应用比较熟悉,并熟悉高并发下的网络压力管理和流量控制。

   其次熟悉服务器的批量部署。相信许多企业里都有自动化运维的需求,如批量安装服务器、批量装应用、批量传文件、批量监控等等,网上也有N多相关的管理软件,开源的如Nagios、Cacti、zabbix、zenoss监控,Cfengine、cobbler、Puppet统一部署管理软件,商业的就更多。它们都很强大,当然也各有利弊,需要结合自己企业的业务应用去具体调整和配置。
  
   再次就是熟悉数据库的集群和后端存储架构。通常数据库和存储都是整个IT架构中比较核心的东西,数据库的性能和高并发下的稳定对企业来讲是非常重要的,它直接关系到用户的体验和价值转化。还是存储的性能将直接影响IO,影响读写的速度。作为一个运维架构师尤其需要对系统的性能、容错、并发等有独到的认识与解决办法。

   运维架构师需要懂技术也更需要懂管理,现在流行的ITIL是一个业界普遍认可的服务管理方案。当一个企业从发展初期的粗放型管理走向精细化管理时,ITIL提供了一个很好的标准流程指导思想。建立流程规范IT服务和支持,并实现行之有效的持续改善和对机制进行监控。好的管理制度和方法需要贯彻和坚持,如果管理和监督不到位,很难保证好的运维体系能运作下去,这也是非常重要的。当然运维架构师也需要具有领导能力与团队协作技能,能在关键时候对技术的选择作出及时、有效的决定,来把握问题解决的方向。

三、安全与创新能力

    好的运维架构师,必须具备敏锐的风险意识和良好的风险识别能力,当然关注安全也是架构师的一个重要职责。不安全不稳定的系统,对于企业来说就是一场灾难。运维安全着眼于解决企业里关键IT基础设施的安全问题,运维架构师需要能够对Linux和Windows主机、服务器以及网络、安全设备上的数据访问进行安全、有效的操作审计,并能对运维的操作进行审计,减少误操作、防止信息泄露,实现事前预防、事中控制和事后审计的运维安全管理体系。

    运维永远没有一劳永逸的时候,不管是运维体系多么完善,也不管是自动化运维做的多么漂亮,我们面临的新问题仍然不少。随着业务的发展,从基础架构到高层应用,从系统扩展、架构调整、数据安全,需要架构师去思考的问题会越来越复杂,不断的创新和学习,将是一个运维架构师的重要任务。

四、架构师职业规划
    从以上的分析来看,成为一个优秀的运维架构师,需要自我有一个良好的职业规划。首先你可以选择先做2-3年的系统集成,全面了解各种服务器、系统部署、网络架构、数据库、存储等,从具体的实施中去学习和了解系统、网络、数据库的特点和应用;接着你可以选择去知名的公司和企业做一个专业的运维,工作2-3年,并在工作中从运维工程师提升到运维经理,精深技术的同时积累自己的管理经验;再接下来你可以尝试去能接到很多运维项目并做IT解决方案的专业的IT服务公司,做一名架构师,利用已有的工作经验和积累,来具体解决各行业的IT系统架构和拓展的问题,如此发展和成长你就真正的成长为一名运维架构师了。

    运维架构师是一个“全才”,不但在技术上和业务上要做到“两手抓,两手都要硬”,更需要持续不断的修炼和学习,才能成为一名合格的架构师。这是一条充满挑战的道路,但也同样充满了乐趣与收获,正所谓“无限风光在险峰”,相信每一个有目标有梦想并敢于坚持的人一定会达到那个并不遥远的彼岸。
 

时间: 2024-12-27 22:31:01

运维架构师-并不遥远的彼岸的相关文章

从临危授命到扭转乾坤,天天拍车运维架构演进及实践

从临危授命到扭转乾坤,天天拍车运维架构演进及实践 李强 2017-04-24 11:52:24 本文根据李强老师在[4月8日DBAplus社群上海数据库技术沙龙]现场演讲内容整理而成.点击文末链接还能下载PPT哦~   讲师介绍  李强 天天拍车运维总监   网名:撒加,先后在AdMaster.饿了么担任运维经理,现任天天拍车运维总监,主要负责天天拍车运维架构的管理.持续优化以及运维团队的建设.培养. 9年以上运维及管理经验.作为国内最早一批思科网络模拟器的推广者.虚拟化先锋论坛的创始人,一直致

运维架构服务监控Open-Falcon

一. 介绍 监控系统是整个运维环节,乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供翔实的数据用于追查定位问题.监控系统作为一个成熟的运维产品,业界有很多开源的实现可供选择.当公司刚刚起步,业务规模较小,运维团队也刚刚建立的初期,选择一款开源的监控系统,是一个省时省力,效率最高的方案.之后,随着业务规模的持续快速增长,监控的对象也越来越多,越来越复杂,监控系统的使用对象也从最初少数的几个SRE,扩大为更多的DEVS,SRE.这时候,监控系统的容量和用户的"使用效率"成

超大型网络的运维架构该往何处去?

游龙科技支持中国地质调查局实现"统一化"网络管理案例 中国地质调查局是负责地质调查.科学研究和信息服务的政府公益机构,下设27个二级单位,包括区域地调.专业地调.公共服务.科技创新与技术支撑等四个分支机构.其中500多台服务器.上千台网络设备和万余台PC机分布在这些分支机构中,在构建了大规模网络和服务器集群系统的同时,由于下属机构过多,进而还形成了网络运维分散的"并发症". 地址调查局作为超大型网络的典型代表,具有复杂 IT 体系结构且具有地域分散的特征.随着各种业

14年的蜕变:从菜鸟到卡厂运维总架构师

 前言   大家好,我是任明. 很高兴和大家做这次在线的分享交流.今天我要讲的题目包括以下四个部分: 运维历程 运维体系 运维思想 从运维到放弃 希望能对运维的小伙伴有所启发和收获.     先放一张图说明几个数字: 交易量1亿/日 核心系统10年无故障 核心系统五个9 异地切换100秒 10000个节点管理 3000交易TPS   运维历程   阶段1:菜鸟呱呱叫(before 2006) 阶段特点: 用啥学啥  需求:协议分析  图形展现 组网 学习:使用fluke协议分析  tcp经典三卷

Linux集群和自动化运维

Linux/Unix技术丛书 Linux集群和自动化运维 余洪春 著 图书在版编目(CIP)数据 Linux集群和自动化运维/余洪春著. -北京:机械工业出版社,2016.8 (Linux/Unix技术丛书) ISBN 978-7-111-54438-8 I. L- II.余- III. Linux操作系统 IV. TP316.89 中国版本图书馆CIP数据核字(2016)第176055号 Linux集群和自动化运维 出版发行:机械工业出版社(北京市西城区百万庄大街22号 邮政编码:100037

如何打造一个高逼格的云运维平台?

作者简介 鲁逸丁  中国银行卡组织运维架构师 长期从事金融信息系统运维工作,专注于运维体系建设,对金融企业云计算运维具有深刻理解,银行卡组织云运维平台负责人. 前言 大家做运维普遍经历这样的过程: 首先我们会把操作做一个标准化,这个阶段是运维质量的提升的阶段. 在标准化实施完以后,由于数目的增加,或者是一些运维场景的增多,我们会逐步的进行一些工具化和自动化,这个阶段我们的运维的效率得到提升. 但是众多的工具以及自动化脚本,会让我们的管理过程中比较困难,随着人员的变动或者是一些工具维护过程中的差错

DockOne微信分享(一一七):沪江容器化运维实践

本文讲的是DockOne微信分享(一一七):沪江容器化运维实践[编者的话]沪江目前容器技术主要应用场景:OCS课件业务无状态应用:基于Apache Mesos+Marathon实现沪江容器系统调度管理:Consul + Consul Template + Nginx实现服务自动发现和注册:Prometheus + Grafana + Alertmanager报警实现容器监控报警.本次分享将从以下几方面来讲解: 选择容器技术缘由 容器技术选型 容器存储 容器网络 监控报警 镜像管理 调度管理 服务

Gdevops精彩不落幕,敏捷运维盛会圆满收官!(附PPT)

继杭州首站的盛大起航,北京.广州两站的持续升温,贯穿全年的"2016年全球敏捷运维峰会"于11月18日在上海圆满收官!这场意义非凡的收官盛会,特别设置了一个主会场和两个分会场,在总结目前IT运维转型困局与突破的同时,对未来敏捷.运维.云等技术领域的发展与革新指明了方向.   与此同时,万众瞩目的十大MVP评选也在峰会现场举行了隆重的颁奖仪式,本年度为技术圈作出非凡贡献的专家及团队悉数登台,星光璀璨,为2016年的Gdevops峰会画上圆满句点.   无论你错没错过这场收官盛会,这些现场

新浪微博平台自动化运维演进之路

内容来源:2016年12月16日,微博产品资深运维架构师王关胜在"GIAC全球互联网架构大会"进行<新浪微博平台自动化运维演进之路>演讲分享.IT大咖说作为独家视频合作方,经主办方和讲者审阅授权发布. 阅读字数: 2557 用时: 4分钟 点击嘉宾演讲视频观看 Sina Weibo业务介绍 微博业务简介 微博平台是属于偏后端的一个产品,它所提供的服务就是固定量的接口,比如信息流里的接口.用户接口.关系接口等等. 微博核心业务 微博最核心的产品就是信息流,以信息流为中心出发,