超大型网络的运维架构该往何处去?

  游龙科技支持中国地质调查局实现“统一化”网络管理案例

  中国地质调查局是负责地质调查、科学研究和信息服务的政府公益机构,下设27个二级单位,包括区域地调、专业地调、公共服务、科技创新与技术支撑等四个分支机构。其中500多台服务器、上千台网络设备和万余台PC机分布在这些分支机构中,在构建了大规模网络和服务器集群系统的同时,由于下属机构过多,进而还形成了网络运维分散的“并发症”。

  地址调查局作为超大型网络的典型代表,具有复杂 IT 体系结构且具有地域分散的特征。随着各种业务系统对于可靠性要求的提高,逐步走向规范化、统一化,实现数据大集中和运维统一管理的需求日益明显。游龙科技结合地质调查局“集中监控和分散维护”的需求,利用SiteView一体化解决方案为大型网络运维的“并发症”开出了良方。

  运维系统分散并不利于数据统一

  政府、教育、金融行业中存在着不少大型网络或超大型网络,上千台服务器与动辄上万台的客户端构成了并不清晰的网状拓扑结构,而每种业务系统的千差万别又使得网络管理者无从下手。信息化主管需要实时了解分支机构环境中的各项网络、系统服务器、数据库、业务应用以及他们之间的关联关系,这是保障业务正常运转的关键,也是提高整体IT运维效率的关键所在。但由于物理位置分散和分支机构众多的情况,即使水平再高的IT工程师,频繁奔波于各个二级单位之间,工作效率也无法有效提高。

  游龙科技于2008年11月开始与中国地质调查局开始合作,在调查阶段,双方针对分支机构和二级单位众多的情况进行了详细的数据采集和分析。一部分分支机构和二级单位已经部署了早期形态的网管系统,并对设备监控设置了不同的监控方案,但这些网管系统相互之间存在着很多不兼容的情况。由于提取的数据无法统一到总局的信息中心,因此无法对整个网络的情况进行动态的汇总。而在分支机构中,新的设备、用户、业务的加入,使得网络中IT资源比以前更加分散、复杂,这就要求IT运维管理系统能够针对系统运行环境随需应变,将以往针对各种基础资源监测的各个管理子系统有机地联系在一起,通过提供开放接口,汇总各个子系统的故障和事件,进行过滤、转发、自动响应、报警等处理,实现基础平台与服务管理平台高效协同。

  集中化管理与一体化平台的实现

  根据游龙科技将近一个月的实际调研,在众多投标的企业中,SiteView一体化解决方案由于最符合大型网络运维的需求,并以游龙科技对大型网络实施产品和服务的良好口碑脱颖而出。产品的成熟性和安全性经过严格的测试得到中国地质调查局的信任。中标之后,游龙科技与地质调查局的信息中心工程师共同对分支机构的业务进行了重新评估,并提出了针对业务的重要性分级的运维监控方案,最终的目的是将看到的、接触和体验的业务都进行汇总和监控起来。虽然分支机构在地点上远离总部的控制,但是IT运维并非如此,所有的分支机构需要得到总部同等级的运维服务,各个二级单位的客户和员工实际上也都越来越多地期待在分支机构获得先进并且强大的技术支持。如何能够为他们提供所需要的高质量、自主性和灵活性,同时又降低IT系统复杂性使之更易于管理呢?

  针对大型网络中的分支机构无法进行统一管理的缺陷,SiteView一体化解决方案不但保障了各个地区和二级单位之间服务器、网络链接的可靠性,还可针对上万台的客户端进行统一的管理维护,形成了“运维中心辐射型”和“管理树形分组”的全新管理平台。 SiteView系列产品被安装在位于核心服务器区的网管工作站上,网管系统通过网络对设备和桌面进行管理,实现了大型网络中最为典型的“中心辐射型”运维架构。此次部署实施的产品包括SiteView ECC(综合系统管理), SiteView NNM(网络设备管理), SiteView DM(桌面管理)。另外,由于地质调查局网络应用平台的结构非常庞大,被监控的设备种类多种多样,有必要协调整理一套分组策略来保证整个被监控系统的层次明晰,这样有利于对设备的查找、管理、监控。而“树形分组管理”的实施可以方便地质调查局的运维工程师在对系统进行管理时可以一目了然的看到逻辑和管理的层次。

  在实施了运维系统分组管理之后,如果一个部门在某一段时间进行系统升级调整,此时系统可能会停止服务,运维工程师就可在SiteView上禁止整个部门的所有服务器监测,以避免没有必要的报警信息传导。另外,如果将同一部门的服务器置放在同一个组内后,就可以对整个组进行配置,启动或者停止监控服务。分组管理的特性,不但满足了地质调查局网络工程师根据需求制定灵活的分组策略,提升管理效率,也能使 SiteView的实施工作变得轻松。

  双方携手对大型网络运维进行深层次研究

  地质调查局网络运维部门的负责人表示:“在经历了此次网络运维整合之后,‘中心辐射型’的运维架构不但找到了在这些不同系统之间集成和交换监控数据的方法,其进一步的价值还在于促进了整个调查局下辖不同地方、不同业务系统的整合,这对国家地质基础信息资料的采集与分析是最大的保障。”

  针对此次的成功案例,游龙科技认为:“无论是现在集中的还是之前分散的IT管理,地质局分支机构的网络运维人员都为此次架构优化模型提供了大量协助工作。通过一体化的集中运维管理模式,分支机构与总部之间在技术和管理等诸多方面都形成了默契,这有助于控制成本、增加安全性,并增进业务的灵活性。” 从新的技术来说,虚拟化、自动化、智能化等,很多方面的元素都是大型网络运维当中必不可少的,游龙科技在研究大型网络运维特点的同时,还将与中国地质调查局及其他行业的用户一同IT运维领域中全新技术进行研发,继续保持游龙科技在国内运维领域的领航地位。

时间: 2024-10-01 04:32:51

超大型网络的运维架构该往何处去?的相关文章

运维架构师-并不遥远的彼岸

 在百度里搜索运维架构师,你会发现招聘的职位还不少并且月薪.年薪都很可观.提到架构师,大家都觉得挺神秘的,而作为运维领域的架构师,站在系统稳定和高可用.高扩展的角度,其承载着太多的责任和挑战.对于运维工程师来说,运维架构师就像是一个目标抑或是一座山峰.如何成为一名优秀的运维架构师?运维架构师应该具备何种职业素质?需要什么样的知识体系呢?   一.职业素质     运维架构师一词应该是与系统架构师.软件架构师.网络架构师.业务架构师不同的,虽然都是架构师,但侧重不同.在一个企业的IT系统中,运维架

从临危授命到扭转乾坤,天天拍车运维架构演进及实践

从临危授命到扭转乾坤,天天拍车运维架构演进及实践 李强 2017-04-24 11:52:24 本文根据李强老师在[4月8日DBAplus社群上海数据库技术沙龙]现场演讲内容整理而成.点击文末链接还能下载PPT哦~   讲师介绍  李强 天天拍车运维总监   网名:撒加,先后在AdMaster.饿了么担任运维经理,现任天天拍车运维总监,主要负责天天拍车运维架构的管理.持续优化以及运维团队的建设.培养. 9年以上运维及管理经验.作为国内最早一批思科网络模拟器的推广者.虚拟化先锋论坛的创始人,一直致

运维架构服务监控Open-Falcon

一. 介绍 监控系统是整个运维环节,乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供翔实的数据用于追查定位问题.监控系统作为一个成熟的运维产品,业界有很多开源的实现可供选择.当公司刚刚起步,业务规模较小,运维团队也刚刚建立的初期,选择一款开源的监控系统,是一个省时省力,效率最高的方案.之后,随着业务规模的持续快速增长,监控的对象也越来越多,越来越复杂,监控系统的使用对象也从最初少数的几个SRE,扩大为更多的DEVS,SRE.这时候,监控系统的容量和用户的"使用效率"成

瞻博网络推出新型EX系列交换机,扩展联合架构并改进网络运维

提供自动的.可扩展的.安全的网络产品行业领导厂商瞻博网络(纽约证交所:JNPR)近日发布两款新型的瞻博网络 · EX系列接入交换机,希望能够帮助客户针对不同规模和复杂度的园区及分支机构网络进行安全且便捷的管理.本次发布的入门级交换机EX2300和中端交换机EX3400能够为企业云技术转型提供全新的解决方案,帮助他们利用JuniperUnite解决方案中的Junos · 企业网融合技术和瞻博网络虚拟机箱等多重领先技术,通过单一管理方式来优化网络配置.这些新的解决方案同时为瞻博网络软件定义安全网络(

14年的蜕变:从菜鸟到卡厂运维总架构师

 前言   大家好,我是任明. 很高兴和大家做这次在线的分享交流.今天我要讲的题目包括以下四个部分: 运维历程 运维体系 运维思想 从运维到放弃 希望能对运维的小伙伴有所启发和收获.     先放一张图说明几个数字: 交易量1亿/日 核心系统10年无故障 核心系统五个9 异地切换100秒 10000个节点管理 3000交易TPS   运维历程   阶段1:菜鸟呱呱叫(before 2006) 阶段特点: 用啥学啥  需求:协议分析  图形展现 组网 学习:使用fluke协议分析  tcp经典三卷

云时代如何简化数据中心网络运维?

SDN,在经历了犹豫彷徨.百家争鸣之后,目前已成为企业CTO的坚定选择. SDN时代的网络展现出两面性:一方面让客户使用更加简单,另一方面却让运维更加复杂.而当前,整个行业的目光多聚焦在前者而忽略了后者. 随着SDN的部署如火如荼,一丝忧患也隐隐浮现.2015年12月,管理行业研究机构EMA(Enterprise Management Associates)针对100多家企业的调查结果显示:70%左右的客户对于现有管理运维体系是否适用于SDN场景表示担忧.Gartner于 2015年7月发布的通

让大型网络运维像SOHO一样简单

随着网络规模的扩大,企业中拥有越来越多的业务系统和成千上万的终端, IT运维管理部门的压力也越来越大. 那么,这些压力源自哪些方面,哪些人会对运维方法的变革上非常敏感,而管理员又当如何化解这些压力,将大型网络的运维也能像SOHO一样进行配合和管理呢?压力源自"失控"大型网络中的系统一般是由历史建设的几个阶段累积而成,时至今日在一些大型网络中可能还存在着Windows NT RAS 服务器(NT环境下的拨号系统),这点可能对于新一代的IT 管理人员都很陌生.当然在大型网络建设的起始阶段,

【先锋】万国数据高可用云服务背后是强大的服务运维+开放平台

在9月份的"2014全球云计算大会"上,万国数据正式发布了GDS云灾备解决方案,这一举措进一步巩固了其作为中国灾难恢复行业领军企业的地位,成立于2000年的万国数据,开始阶段主要以灾备业务为主,从2007年开始拓展整个数据中心业务,目前在上海.深圳.昆山.成都都拥有自建的高等级数据中心,全国范围内有17个数据中心在运营.在和万国数据高级副总裁陈怡琳的采访中,提及以后有无向北美.欧洲等地区扩展时,她表示,客户到哪里,我们便响应到哪里. 万国数据高级副总裁 陈怡琳 凭借世界级新一代数据中心

运维改革探索(二):构建可视化分布式运维手段

作者介绍 朱祥磊,山东移动BOSS系统架构师,负责业务支撑系统架构规划和建设.获国家级创新奖1项.通信行业级科技进步奖2项.移动集团级业务服务创新奖3项,申请发明专利13项. 工具篇:构建可视化分布式运维手段 工欲善其事,必先利其器.上篇我们已经详细分享了监控相关的知识,然而运维可视化,除了构造可视化监控外,还要建立相应的运维手段,云化下的运维工具和传统架构的有较大不同,对集群式.分布式提出了更高的要求. 1.自动化巡检 从2011年开始推行巡检,最初,我们的武器仅仅是一个word文档.一些ex