如何使用ARMS配置tengine的日志监控

来自 深圳市小亿网络有限公司 王昕岩

最近公司通过业务实时监控服务 ARMS 成功搭建了基于tengine的日志监控系统。这里简单分享一下使用ARMS用于监控tengine日志的经验。

公司发展至今,现阶段所有接口都使用阿里的tengine作为web容器,类似nginx,在日志中也记录了包括host, url, ip, 包体大小,响应时长等信息。目前的业务需求场景是希望有一套系统来监控接口的异常,来及时发现系统的异常,并能具体到哪些项目、哪些服务器、甚至哪些URL出现异常,提高分析问题和解决问题的速度。

tengine日志分布到不同服务器上,首先使用日志服务来分别收集这些日志。再以logHub作为日志源,来进行监控。想到使用ARMS的其中一个最重要原因是因为我们系统tengine的日志格式有一定的定制,需要有一个端到端监控产品提供的定制化特别强的数据清洗功能,以及聚合计算+报警功能。

这里详细介绍一下ARMS吊炸天的日志切分功能。

第一步,一个开始节点;
第二步,LogHub数据源过来默认是JSON格式,进行JSON解析,如下图:

注意日期类型的时间格式,尤其是“小时”部分,默认格式是hh(12小时),需要改为HH(24小时)。
第三步,清洗,过滤掉这里不需要监控的host,如下图:

通过函数,过滤掉不以指定域名结尾的host。
第四步,解析URL。使用“单分隔符切分器”,将request字段按照空格切分,分别获取调用方式(GET/POST)、完整URL、协议版本。

第五步,区分错误码。这里主要是为了区分,返回码是代表正常、还是错误。这里只对错误的返回码进行监控。下图的例子是,返回码是4xx或5xx的表示错误,其他表示正常。新增字段is_error表示是否是“错误码”,赋值1或0表示是或否。

第六步,配置服务器IP和服务器名称的对应关系。配置了一个映射表如下:

注意,这里一定要配置一个127.0.0.1的k-v关系,否则日志切分预览的时候会看不到这个“服务器名称”字段。

最后,再简化一下host,把域名的后缀去掉,只保留前缀。

至此,日志切分全部结束。点击“日志切分预览”,即可查看切分效果。点击保存,下一步。

配置数据集,例如要监控接口的访问次数,使用count(_line);要监控平均包体大小,使用sum(包体大小)÷count(_line);要监控平均响应时长,使用sum(响应时长)÷count(_line)。维度根据需要配置,此处配置为先服务器,后接口域名。

至此配置全部结束,点击保存,完成配置。即可启动任务了。以上为简单示例。

这边展示我制作的其中几项监控的大盘。

请求数效果图:

响应时长效果图:

包体大小效果图:

错误码个数效果图:

运维人员通过对几个图表的观察分析,可以很快得出一些异常情况发生的原因,并及时处理掉。

一个年轻的互联网公司,需要不断的成长。系统也一样,需要不断的提升、优化。业务实时监控服务 ARMS 很好的提供了这么一个入口,为公司提供了一个实时查询Tengine运行情况的解决方案。在未来,ARMS将很好的和ODPS为公司监控形成互补方案,tengine日志日后可同时投递到ARMS和MaxCompute中: ARMS响应第一时间的多维度报警; MaxCompute来做深层次分析,例如接口的请求数、响应时长等,并有针对性地进行调优。

业务实时监控ARMS正在公测
了解全部阿里云互联网中间件产品和使用场景

时间: 2025-01-31 02:07:44

如何使用ARMS配置tengine的日志监控的相关文章

四年打磨,全新公测ARMS终极进化:业务监控实时无边界

作为和企业互联网架构平台 Apsara Aliware"三驾马车"(EDAS/DRDS/MQ)并驾齐驱的又一重磅产品.本文主要从ARMS的诞生背景开始,介绍了ARMS的雏形,着重说明了全新公测的ARMS业务实时监控服务,最后和大家分享了ARMS的五个应用场景并做了ARMS的特点总结. 以下为精彩内容整理:   ARMS助力企业应用实时监控 ARMS特点可以用三个词来形容: 业务:方便快捷的定制能力.与其它平台监控产品不同的是,ARMS直接从业务的元数据开始入手,形成一个监控体系,为了让

EDAS伴侣ARMS终极进化:业务监控实时无边界

作为和企业互联网架构平台 Apsara Aliware"三驾马车"(EDAS/DRDS/MQ)并驾齐驱的又一重磅产品.本文主要从ARMS的诞生背景开始,介绍了ARMS的雏形,着重说明了全新公测的ARMS业务实时监控服务,最后和大家分享了ARMS的五个应用场景并做了ARMS的特点总结.  以下为精彩内容整理:   ARMS助力企业应用实时监控 ARMS特点可以用三个词来形容: 业务:方便快捷的定制能力.与其它平台监控产品不同的是,ARMS直接从业务的元数据开始入手,形成一个监控体系,为了

日志监控告警系统的设计与实现

日志监控告警系统 基于的日志进行监控,监控需要一定规则,对触发监控规则的日志信息进行告警,告警的方式,是短信和邮件. log4j---->error,info,debug 应用程序程序的日志  error级别 TimeOutException 角标越界IndexXXXException ......Error   com.alibaba.jstorm.daemon.worker.WorkerData]-[INFO] Current worker taskList:[1, 2, 3, 4, 5,

Entity Framework 缓存处理与日志监控

在Kooboo中使用了Entity Framework作为持久化框架,但由于EF1.0并没有提供完整缓存解决方案,一直以来都在为数据缓存而烦脑,在没有找到合适解决方案的情况下,采取了临时的解决办法:直接缓存实体.但是由于Entity实体都是带状态的,并且都与ObjectContext有间接的反向引用,缓存带状态的实体,会造成对象上下文混乱和连接资源的无法被正确释放.因此缓存的Entity实体,首先必须被分离或者重新定义POCO实体来代替Entity实体作为缓存对象.这样一来,所有的缓存实体的关联

ElasticSearch实战-日志监控平台

1.概述 在项目业务倍增的情况下,查询效率受到影响,这里我们经过讨论,引进了分布式搜索套件--ElasticSearch,通过分布式搜索来解决当下业务上存在的问题.下面给大家列出今天分析的目录: ElasticSearch 套件介绍 ElasticSearch 应用场景和案例 平台架构 下面开始今天的内容分享. 2.ElasticSearch 套件 2.1LogStash LogStash是一个开源的.免费的日志收集工具,属于Elastic家族的一员,负责将收集的日志信息输送到ElasticSe

一起谈.NET技术,Entity Framework 缓存处理与日志监控

在Kooboo中使用了Entity Framework作为持久化框架,但由于EF1.0并没有提供完整缓存解决方案,一直以来都在为数据缓存而烦脑,在没有找到合适解决方案的情况下,采取了临时的解决办法:直接缓存实体.但是由于Entity实体都是带状态的,并且都与ObjectContext有间接的反向引用,缓存带状态的实体,会造成对象上下文混乱和连接资源的无法被正确释放.因此缓存的Entity实体,首先必须被分离或者重新定义POCO实体来代替Entity实体作为缓存对象.这样一来,所有的缓存实体的关联

CentOS6.4 配置Tengine

1.安装Nginx所需的pcre-devel库 yum install -y gcc gcc-c++ wget ftp://ftp.csx.cam.ac.uk/pub/software/programming/pcre/pcre-8.33.tar.gz tar zxvf pcre-8.33.tar.gz cd pcre-8.33./configure --prefix=/usr/local/pcre makemake install  2.安装Tengine yum install openss

PHP配置把错误日志以邮件方式发送方法

  这篇文章主要介绍了PHP配置把错误日志以邮件方式发送方法(Windows系统),本文给出了配置示例和使用例子,需要的朋友可以参考下 当系统发生了很严重的问题,需要立刻发送给管理员.可以通过 error_log() 将错误以邮件形式发送到邮箱. 在 php.ini 中设置: 代码如下: sendmail_from = 472323087@qq.com 然后设置: 代码如下: sendmail_path = "G:sendmailsendmail.exe -t" 其中:G:sendma

利用API NtQueryInformationThread和I_QueryTagInformation实现对Windows日志监控的绕过

本文讲的是利用API NtQueryInformationThread和I_QueryTagInformation实现对Windows日志监控的绕过, 0x00 前言 在上篇文章<渗透技巧--Windows日志的删除与绕过>中提到一个绕过Windows日志监控的思路:使用API NtQueryInformationThread和I_QueryTagInformation获取线程对应的服务,关闭对应日志记录功能的线程,能够破坏日志功能,并且Windows Event Log服务没有被破坏,状态仍