对于系统管理员/运维工程师而言,一个好的监控与告警系统,已经成为日常工作中必不可少的手段。但建立这样一个系统,却并非易事。传统的做法往往存在以下弊端:
1. 为获取监控数据,通常需要在主机中安装Agent进行监控数据的采集,那么,Agent是否可信,其对系统的影响有多大,往往是我们不得不考虑的问题;
2. 告警的手段比较单一。通过手机短信告警,满足了及时性,但能够展示的信息较为贫乏,且交互手段过为单一;通过email告警,信息丰富性得到了满足,但及时性却又有所欠缺。
因此,如果能够通过微信获得告警通知,则可以同时满足:消息通知的及时性、信息展示的丰富性,以及可交互性。
只需三步,获得基于微信的监控与告警通知
在云管家中,您只需通过三步,即可获得基于微信的监控与告警通知。
Step1. 微信扫码登录
访问“https://yun.cloudbility.com”,通过微信扫码登录。
注:如果您已经使用其它身份登录云管家,只需在个人资料中绑定微信即可。
Step2. 创建团队
用户首次登录后,会被引导至创建团队的页面,您只需输入希望的团队名称即可成功创建。这里需要指出的是,云管家是基于团队协同的工作模式。您即可以创建一个新的团队,也可以加入一个已经存在的团队(前提是对方邀请您加入)。这意味着一旦有微信的告警通知,团队成员都可以获得消息推送。
Step3. 导入云主机
您现在可以选择新增云账户,输入您名下云厂商的API凭证,将云主机导入至云管家中。以阿里云为例,您只需在云管家中输入Access Key,即可将云主机导入到云管家中进行管理。
延伸阅读:进一步了解 云管家快速入门
监控与微信告警使用效果
至此,您便已经获得了基于微信的监控与告警通知功能,以下是几张效果图。
<图一 CPU监控视图>
<图二 微信通知消息>
其它问题
1. 监控数据是怎么来的?
我们并没有在您的云主机中安装任何Agent软件,那么,监控数据是从哪里来的?事实上,我们是通过您的云计算厂商那里查询获取到的。不同的云厂商有不同的监控实现。以阿里云为例, 默认情况下,即便您在阿里云主机中不安装任何Agent软件,那么,它依然可以获取主机的CPU、网络流量、系统盘IO等数据,如果您要进一步获取诸如内存、磁盘分区使用率等信息,则需要安装阿里云的Agent。
2. 告警条件如何设置?
在您将云主机导到至云管家的那一刻,云管家会按照业界最佳实践,帮您默认开启了告警设置,以下是默认设置项:
监控项 | 监控指标 | 默认规则 | 阈值范围 | 默认周期 | 默认开启 |
---|---|---|---|---|---|
CPU | 使用率 | 大于80% | 10%-99% | 10分钟 | 是 |
内存 | 使用率 | 大于90% | 10%-99% | 15分钟 | 是 |
内网 | 入站速率 | 大于50Mbps | 10Kbps-500Mbps | 10分钟 | 否 |
出站速率 | 大于50Mbps | 10Kbps-500Mbps | 10分钟 | 否 | |
入站流量 | 大于7500MB | 1MB-75000MB | 20分钟(不可修改) | 否 | |
出站流量 | 大于7500MB | 1MB-75000MB | 20分钟(不可修改) | 否 | |
公网 | 入站速率 | 大于20Mbps | 10Kbps-500Mbps | 10分钟 | 是(经典云) |
出站速率(包年包月) | 大于固定带宽的95% | 10Kbps-500Mbps | 10分钟 | 是(经典云) | |
出站速率(按量付费) | 大于固定带宽的80% | 10Kbps-500Mbps | 10分钟 | 是(经典云) | |
入站流量 | 大于3000MB | 1MB-75000MB | 20分钟(不可修改) | 是(EIP) | |
出站流量(包年包月) | 大于(固定带宽*95%/8)*60*20 MB | 1MB-75000MB | 20分钟(不可修改) | 是(EIP) | |
出站流量(按量付费) | 大于(峰值带宽*80%/8)*60*20 MB | 1MB-75000MB | 20分钟(不可修改) | 是(EIP) | |
磁盘分区 | 使用量 | 分区使用量大于90% | 10%-99% | 5分钟 | 是 |
如有需要,你可以随时修订告警条件,或者启用/禁用告警设置。
总结
监控服务只是行云服务•云管家的特性之一,现阶段的云管家只是把云厂商已经拥有的监控数据,用最简单、最方便的手段,展现给您,并通过微信这一手段将各种异常信息实时的推送给用户。 目前云管家能够提供的监控项有CPU、内存、平均负载、网络流量、TCP连接数、进程数、磁盘使用率等指标,对于绝大部分的用户来说这已经足够了,未来的云管家还将提供站点监控、服务监控等更丰富的监控功能。