方案概述
企业IT系统互相之间高度的关联性。在企业中,一个应用系统一般是由多个硬件和软件组成,而不用的系统之间可以互相之间关联、共用服务器、共用网络设备、共用一个数据库,这些都让不同系统之间有着高度的关联性。当一个设备出现问题时,管理员往往无法准确的判定出这台设备的影响范围,当多台设备出现问题时,管理员无法定位这些设备的重要性关系,无法保证优先恢复影响范围广的设备。
企业当前的监控系统一般采用的是事件监控及自底向上监控的模式,这样的模式会产生大量的监控事件,同时这些事件都是针对单个系统的监控事件,而不是针对企业的应用服务的监控。当系统报警后,管理人员只能获知是什么样的设备出了问题,但这个设备对哪些系统产生了影响却无法得知。
现在很多企业都上了监控系统,但是客户(内部或者外部)的满意度并没有明显地提高。为什么?80%的IT投诉是系统慢,而不是宕机。用户在乎的是系统的响应速度,希望在最短的时间内把事情处理。
监控系统提供了大量的可用性和性能指标,但是并没有对客户最关注的响应时间起到任何的作用。管理员无法定位性能瓶颈的所在。
市面上很多监控软件只提供了个别主机、网络设备或者应用的性能和可用性指标监控,不提供一个“服务流”(从一个业务服务系统的首端至末端),所以一旦系统出现性能慢的情况,就很难定位到底是哪里慢,由哪一个子系统导致。Mocha E2E根据端到端的响应时间流程过程中定位难的问题提供精准定位的功能,通过分析从一端到某一端的的响应时间,从整体展示每一端的响应时间,用户可以很容易找到系统的瓶颈所在。
方案构成
事务服务流监控
事务服务流所监控的是一个完整的、连续的、有时序的业务过程。用户要实现某个业务目标,就必须要经过某些环节,过程中所发生的每一个环节,都是有先后次序,并不可或缺的。
Mocha E2E中,一个事务服务流由子服务流(Sub-Service Flow)、活动(Activity)、Action 3种元素组成。元素之间的关系及约束如下:
·一个服务流可以由一个或多个子服务流组成,最多5个;
·一个子服务流可以由一个或多个活动组成,最多5个;
·一个活动可以由一个或多个Action组成;
常见的服务流监控有IPSec VPN监控、SSL VPN监控、打开OA待办监控、Portal登录等。
Mocha E2E中所定义的IPSec VPN服务流中的“生成动态密码”活动中,通过有序的事务服务流的监控,可以清晰的定位动态密码生成失败是在哪个环节,以及动态密码生成时间换慢慢的瓶颈是什么。
无序服务流监控
无序服务流是一种特殊的服务流,主要用来记录用户的随机操作,以及用户发生这些操作的时间点、响应时间等。
用户在企业的应用系统中所进行的是无意识的随机的操作,通过定义无序服务流,Mocha E2E可跟踪到用户在应用系统中所进行过的操作,以及进行各个操作的具体时间点、响应时间等详细的信息,便于信息管理部门跟踪企业中VIP用户的使用习惯,对系统为该用户的服务情况进行评估。
常见的无序行为流监控包括登陆OA系统后的,打开OA已办、打开OA待办等动作响应时间监控。
实时VIP监控
实时的VIP监控可以让VIP服务流的监控实时可见,当前状态一目了然,最近12小时的状态可以及时查询,从监控角度充分体现了VIP用户的特殊性和重要性。雷达式的扫描状态。让可视化的监控简单易用。
Actor,服务流所面向的对象,抽象出来的一个实体。
- 字段:服务流执行过程中所使用到的字段,通过字段,可以把一个个已定义的点串联为一个可执行的流;
- 特征字段:字段中比较特殊的字段,用户在搜索数据时必须具备的字段;
- ActionEvent: Action能够分解为的最小的粒度,监控模型中,把每个Action都分解为三种ActionEvent,并将每个ActionEvent和相应的数据源中所能够获取到的操作的点对应起来,来实现监控。ActionEvent分为:开始,结束,异常。其中,异常包括错误和超时;
- 应用事件:在Adapter中,定义了能够从数据源中捕获到的,有价值的用户操作,并给这些操作定义了名称,就是应用事件;
- 数据源字段:数据源中能够捕获到的,有价值的字段,这些字段和角色属性字段需要设置映射关系,这样才能把已定义好的服务流和真实的数据一一对应起来。
端到端响应时间管理报表功能
- 快照显示:快照分为三层,管理员可以很明晰的看到该服务流各个层次的可用性和性能状态。性能状态主要是指各个节点及连接线的响应时间;
- 图表显示:管理员可以根据自己的需要,自定义显示服务流的响应时间图表中的哪几个,最多显示八个;
- 服务流监控查询:管理员可以根据自己的需求定制搜索条件,进行搜索;搜索条件也可按视图定制,也可按查询字段定制。视图是由用户自定义的,通过用户所定义的规则来表达业务上的含义。
客户收益
Mocha E2E产品高可配置性,有利于企业用户操作简单
- 定位问题,可以清晰的定位业务系统各个环节的问题,不再有相互推诿现象出现。
- 产品化通用模型,无须改造现有系统
- 支持ARM和日志等多种监控模式
- 从业务角度出发自顶向下的监控
有效的端到端监控,有利于提高企业客户满意度
如果一个企业能够从客户角度出发,实时关注客户对其提供的服务网站质量的感受,而不是被动的等待客户投诉,或干脆对客户的意见置之不理,主动地发现并解决问题,自然就会吸引更多的客户,减少无谓的客户流失,增强企业在同行业间的竞争能力。
提高IT部门服务质量的满意度
IT部门通过对企业内部办公网站的响应情况的监控,提高内部网站的服务水平,从而提高企业领导和内部员工对IT部门服务质量的满意度,加强企业的管理能力和凝聚力。
快速响应定位问题,提高工作效率
IT部门接到响应时间报警后,能够及时处理问题,而不是等接到投诉后才去响应,变被动的响应式服务为IT部门主动服务。通过模拟用户使用过程重放,分析监控系统产生的事件,能够快速的定位系统响应时间瓶颈,缩短解决问题的周期,提高工作效率。
方便IT部门对系统进行性能优化
IT支持和管理部门通过对监控系统提供的响应时间报表分析,能够找出系统经常出现问题的时间段,方便用户在问题时间段采取应对措施,优化系统性能。