还在用命令行查问题吗?云监控提供30余种服务器监控指标,等你来用!

主机监控功能上线啦

排查这些问题,你还在用命令行查询服务器各项指标吗?历史快照怎么拿?想要预警怎么办?烦死宝宝啦。

云监控为阿里云用户提供主机监控功能,一键安装插件后,即可查看30余个监控项的监控图表,设置报警更是天然支持~~也可以安装在非 ECS 的服务器上,有没有很开心~

立刻使用主机监控


进程监控介绍

进程监控默认为您采集最近一段时间内活跃进程消耗的CPU使用率、内存使用率,以及进程的文件打开数。如果您添加了进程关键字,还会采集包含关键字的进程个数。

  • 如果您查询的时间范围内,Top5的进程不固定,进程列表中会展示这段时间内全部进入过Top5的进程,列表中的时间表示该进程最后一次进入Top5的时间。
  • 只有进入Top5 的进程才会采集进程的CPU使用率、内存使用率和打开文件数,所以如果该进程在查询的时间范围内未持续进入Top5,会出现监控图中数据点不连续的情况,数据点的密集程度则表明了该进程在服务器上的活跃程度。

监控项说明

CPU 相关监控项

以下为CPU使用率相关监控指标,可参考Linux的top命令来理解各项指标含义。

监控项名称 监控项含义 单位 说明
Host.cpu.idle 当前空闲CPU百分比  %
Host.cpu.system 当前内核空间占用CPU百分比 % 指系统上下文切换的消耗,该监控项数值比较高,说明服务器开了太多的进程或者线程
Host.cpu.user 当前用户空间占用CPU百分比 % 用户进程对CPU的消耗
Host.cpu.iowait 当前等待IO操作的CPU百分比 % 该项数值比较高说明有很频繁的IO操作
Host.cpu.other 其他占用CUP百分比 % 其他消耗,计算方式为(Nice + SoftIrq + Irq + Stolen)的消耗
Host.cpu.total 当前消耗的总CPU百分比 % 指以上各项CPU消耗的总和,通常用于报警

内存相关监控项

以下为内存相关监控项,可参考free命令来理解各项指标含义。

监控项名称 监控项含义 单位 说明
Host.mem.total 内存总量 bytes 服务器的内存总量
Host.mem.used 已用内存量 bytes 用户程序使用的内存 + buffers + cached,buffers为缓冲区占用的内存空间,cached为系统缓存占用的内存空间
Host.mem.actualused 用户实际使用的内存 bytes 计算方法为(used - buffers - cached)
Host.mem.free 剩余内存量 bytes 计算方法为(内存总量-已用内存量)
Host.mem.freeutilization 剩余内存百分比 % 计算方法为(剩余内存量/内存总量*100%)
Host.mem.usedutilization 内存使用率 % 计算方法为( Actual used/total*100%)

系统平均负载监控项

以下为系统平均负载相关监控项,可参考Linux top命令来理解各项指标含义。监控项数值越高代表系统越繁忙。

监控项名称 监控项含义 单位
Host.load1 过去1分钟的系统平均负载,Windows操作系统没有此指标
Host.load5 过去5分钟的系统平均负载,Windows操作系统没有此指标
Host.load15 过去15分钟的系统平均负载,Windows操作系统没有此指标

磁盘相关监控项

  • 磁盘使用率与inode使用率可参考Linux df命令。
  • 磁盘读写指标可参考Linux iostat命令。
监控项名称 监控项含义 单位
Host.diskusage.used 磁盘的已用存储空间 bytes
Host.disk.utilization 磁盘使用率 %
Host.diskusage.free 磁盘的剩余存储空间 bytes/s
Host.diskussage.total 磁盘存储总量 bytes
Host.disk.readbytes 磁盘每秒读取的字节数 bytes/s
Host.disk.writebytes 磁盘每秒写入的字节数 bytes/s
Host.disk.readiops 磁盘每秒的读请求数量 次/秒
Host.disk.writeiops 磁盘每秒的写请求数量 次/秒

文件系统监控项

监控项名称 监控项含义 单位 说明
Host.fs.inode inode使用率,UNIX/Linux系统内部使用inode号码来识别文件,磁盘还未存满,但inode已经分配完时会出现无法在磁盘新建文件的情况,Windows操作系统没有此指标 % inode数量代表文件系统文件数量,大量小文件会导致inode使用率过高

网络相关监控项

  • 以下为网络相关指标,可参考Linux iftop。TCP连接数的采集,可参考Linux ss命令。
  • TCP连接数会默认采集 TCP_TOTAL(总连接数)、ESTABLISHED(正常连接状态),NON_ESTABLISHED(非连接的状态连接数,ESTABLISHED以外的所有状态),如果您需要获取各个状态连接数的数量,请按如下说明操作:
Linux操作系统
    您可以将cloudmonitor/config/conf.properties配置文件的netstat.tcp.disable改为false来开启采集。修改配置后请重启Agent。

Windows操作系统
    您可以在C:\”Program Files”\Alibaba\cloudmonitor\config的配置文件中,将netstat.tcp.disable改为false来开启采集。修改配置后请重启Agent。
监控项名称 监控项含义 单位
Host.netin.rate 网卡每秒接收的比特数,即网卡的上行带宽 bits/s
Host.netout.rate 网卡每秒发送的比特数,即网卡的下行带宽 bits/s
Host.netin.packages 网卡每秒接收的数据包数 个/秒
Host.netout.packages 网卡每秒发送的数据包数 个/秒
Host.netin.errorpackage 设备驱动器检测到的接收错误包的数量 个/秒
Host.netout.errorpackages 设备驱动器检测到的发送错误包的数量 个/秒
Host.tcpconnection 各种状态下的TCP连接数包括LISTEN、SYN_SENT、ESTABLISHED、SYN_RECV、FIN_WAIT1、CLOSE_WAIT、FIN_WAIT2、LAST_ACK、TIME_WAIT、CLOSING、CLOSED

进程相关监控项

  • 进程的CPU使用率、内存使用率可参考Linux top命令,CPU使用率为多核使用情况。
  • Host.process.openfile 可参考Linux lsof命令。
  • Host.process.number 可参考Linux ps aux |grep '关键字' 命令。
监控项名称 监控项含义 单位
Host.process.cpu 某个进程消耗的CPU百分比 %
Host.process.memory 某个进程消耗的内存百分比 %
Host.process.openfile 当前进程打开文件数
Host.process.number 指定关键字的进程数

立刻使用主机监控

更多了解欢迎阅读文档:使用文档

时间: 2024-10-16 04:13:13

还在用命令行查问题吗?云监控提供30余种服务器监控指标,等你来用!的相关文章

通过命令行工具使用阿里云资源编排服务

资源编排ROS 是一种简单易用的云计算资源管理和自动化运维服务.用户通过模板描述多个云计算资源的依赖关系.配置等,并自动完成所有资源的创建和配置,以达到自动化部署.运维等目的. 了解更多 通过命令行工具使用阿里云资源编排服务 资源编排服务(ROS)支持用户通过模板文件定义所需的云资源,描述资源间的依赖关系和配置详情,并自动完成资源的创建和配置,以达到自动化部署.运维等目的. 作为一种自动化运维工具,阿里云ROS屏蔽了底层资源操作的复杂性,使得对基础设施资源的管理通过简单的代码就可以实现. 命令行

通过命令行方式批量设置保留IP地址的代码_win服务器

前段时间看到一个提问关于如何批量设置DHCP保留地址的贴子,后来经作实验测试,现将解决方法分享给大家,供互相学习讨论. 首先我们知道DHCP添加保留地址的方法有两种.一种在作用域的保留地址添加:另一种方法通过命令行批量添加. 下面介绍的是如何通过命令行添加保留地址的方法:(此方法在2003R2及2008R2上测试可用) 复制代码 代码如下: dhcp server 172.16.2.10 scope 172.16.2.0 add reservedip172.16.2.100 00055de2e5

openstack 命令行管理二十一 - 云盘管理 (备忘)

Openstack 中, 创建云主机时, 需要定义 flavor 类型, flavor 定义了每个云主机的硬件类型, 包括 cpu 个数, 内存大小, 硬盘大小(根盘), 作为通用类型, 我们不会把硬盘容量设定过大, 那么对于数据库用户或其他需要使用大容量磁盘的用户是不合适的. 特点: 云主机与云硬盘, 需要独立地创建, 独立管理 云硬盘需要通过命令指定云主机进行连接方可使用 云主机被删除, 云硬盘数据依旧存在 每个云硬盘只可以与一个云主机进行连接, 不可并发同时访问 云硬盘数据永久保存(除非手

Android中使用am命令实现在命令行启动程序详解_Android

在Android中,除了从界面上启动程序之外,还可以从命令行启动程序,使用的是命令行工具am. 复制代码 代码如下: usage: am [subcommand] [options]     start an Activity: am start [-D]         -D: enable debugging     send a broadcast Intent: am broadcast     start an Instrumentation: am instrument [flags

Android中使用am命令实现在命令行启动程序详解

在Android中,除了从界面上启动程序之外,还可以从命令行启动程序,使用的是命令行工具am. 复制代码 代码如下: usage: am [subcommand] [options] start an Activity: am start [-D]         -D: enable debugging send a broadcast Intent: am broadcast start an Instrumentation: am instrument [flags]         -r

php 命令行参数详解及应用

命令行|详解 大家知道,php是一种PHP是一个基于服务端来创建动态网站的脚本语言,您可以用PHP和HTML生成网站主页.当用户打开php页面时,服务端便执行PHP的命令并将执行结果发送至用户的浏览器中,这类似于ASP和CoildFusion,PHP可以运行在WINDOWS和多种版本的UNIX上.除了能够操作您的页面外,PHP还能发送HTTP的标题.您可以设置cookie,管理数字签名和重定向用户,而且它提供了极好的连通性到其它数据库(还有ODBC),集成各种外部库来做用PDF文档解析XML的任

关于JVM命令行标志您不知道的5件事:调优JVM性能和Java运行时

JVM 是多数开发人员视为理所当然的 Java 功能和性能背后的重负荷机器.然而,我们很少有人能理解 JVM 是如何进行工作的 - 像任务分配和垃圾收集.转动线程.打开和关闭文件.中断和/或 JIT 编译 Java 字节码,等等. 不熟悉 JVM 将不仅会影响应用程序性能,而且当 JVM 出问题时,尝试修复也会很困难. 本期 5 件事 系列 将介绍一些命令行标志,您可以使用它们来诊断和调优您的 Java 虚拟机性能. 1. DisableExplicitGC 我已记不清有多少次用户要求我就应用程

监控 Linux 容器性能的命令行神器

监控 Linux 容器性能的命令行神器 ctop是一个新的基于命令行的工具,它可用于在容器层级监控进程.容器通过利用控制器组(cgroup)的资源管理功能,提供了操作系统层级的虚拟化环境.该工具从cgroup收集与内存.CPU.块输入输出的相关数据,以及拥有者.开机时间等元数据,并以人性化的格式呈现给用户,这样就可以快速对系统健康状况进行评估.基于所获得的数据,它可以尝试推测下层的容器技术.ctop也有助于在低内存环境中检测出谁在消耗大量的内存. 功能 ctop的一些功能如下: 收集CPU.内存

.NET Core采用的全新配置系统[5]: 聊聊默认支持的各种配置源[内存变量,环境变量和命令行参数]

较之传统通过App.config和Web.config这两个XML文件承载的配置系统,.NET Core采用的这个全新的配置模型的最大一个优势就是针对多种不同配置源的支持.我们可以将内存变量.命令行参数.环境变量和物理文件作为原始配置数据的来源,如果采用物理文件作为配置源,我们可以选择不同的格式(比如XML.JSON和INI等) .如果这些默认支持的配置源形式还不能满足你的需求,我们还可以通过注册自定义ConfigurationSource的方式将其他形式数据作为我们的配置来源. [ 本文已经同