DigitalOcean添加监控和告警特性

 云基础设施提供商DigitalOcean最近释放了监控服务器和发送告警的功能。尽管这不是什么新奇的功能,但是这个免费的特性带有一定的象征性,代表了行业越来越关注服务器和应用内部的运行情况。
DigitalOcean的监控服务是基于agent的。它能用于新的和已有的虚拟机(被称为“droplets”)。开发人员可以在供应基于Linux的droplets时安装这个agent,也可以在事后运行一个构建脚本。agent会捕获各种指标,包括:CPU、内存使用、磁盘I/O、磁盘使用率、输入带宽和输出带宽。这些指标只能通过仪表盘来查看,无法通过API访问。因为这些指标是通过内置(on-box)的agent来收集的,像“top进程”这样的信息也是可以获取到的。开发人员能够创建告警策略,当达到一定的性能阈值就会产生警报。这些策略可以用于单个droplet,也可以用于一组droplet。报警能够通过Email地址或Slack channel来进行发送。DigitalOcean最多会将指标信息存储30天。但是,如果用户销毁某个droplet的话,指标信息也会立即消除。

在提供监控服务之前,DigitalOcean依赖于合作伙伴来弥补这块缺失的功能。DigitalOcean的联合创始人Mitch Wainer对记者Ben Kepes说,他们的核心合作伙伴并没有对这些功能感到惊讶。

当然,对于Wainer来说,一个明显的问题在于如何处理与DigitalOcean已有的合作伙伴的关系。Wainer非常开放和坦诚,他承认这会影响到合作伙伴。但是他很快补充说,DigitalOcean一直对它的发展意图非常开放,给了这些供应商很长的时间来准备这种变更。

其他主要的IaaS厂商也支持范围广泛的合作伙伴,但是多年来一直都会提供内置的监控功能。Amazon CloudWatch有一个用于服务器监控的免费层级(free tier),能够存储性能数据超过一年的时间。另外,AWS还提供了可视化、告警、API访问、更高级的层级(需要收取一定费用)、自定义指标和日志监控的功能。微软为Azure虚拟机也提供了综合的监控功能。用户可以创建告警,将指标归档到长期存储中,然后通过API来消费和查询数据。Google Stackdriver监控支持Google Compute Engine和AWS服务器。它有一个免费层级,同时还有一个更高层级的服务。与其他的IaaS供应商类似,Google提供了自定义指标、告警策略、丰富的提醒方案、API访问等功能。

用户对服务器和应用监控的期望在发生着变化。The New Stack的一份报告指出了容器化对监控需求会带来什么样的影响。临时性服务(Ephemeral service)、要跟踪的“东西”呈现多样化、关注“服务”而不是“服务器”以及新类型的终端用户,上述的这些变化都导致传统的监控方式力不从心。临时性服务意味着厂商需要有新的方式来定价,因为服务实例会随时加入或销毁。为了应对更复杂的应用拓扑架构所带来的挑战,AWS在2016年引入了X-Ray。在帮助现代团队监控服务和解决问题方面,工具和服务出现了爆炸性地增长。已有的厂商,比如New Relic、Dynatrace和Datadog在不断演化其产品,以满足新的需求。新出现的解决方案也都引起了业界的关注,比如Prometheus、Pivotal Cloud Foundry Metrics、Honeycomb和Zipkin。

DigitalOcean的监控是免费使用的,在全球范围内的八个机房都可以访问。在宣布该项服务的博客文章的结尾,DigitalOcean给出了这项服务的未来规划。

监控服务的第一个迭代成果已经和大家见面了,我们已经致力于下一个迭代的工作。很快将会推出的特性包括:

对告警策略的API支持

告警的可视化增强

监控块存储(Block Storage)

将告警通知外部服务的Webhooks

本文转自d1net(转载)

时间: 2024-09-15 17:54:46

DigitalOcean添加监控和告警特性的相关文章

Zabbix添加监控项及配置邮件报警的过程

Zabbix邮件报警的大致流程如下: 监控主机---->监控项---->触发器---->告警动作---->告警方式---->告警用户 首先添加监控项 1.选择要添加监控项的主机 2.点击右上角的Create item 添加并配置监控项 上面说到的key值,这里给大家说明下: Example: /usr/local/zabbix/bin/zabbix_get -s192.168.4.10 -kproc.num[httpd] -s   指定要检测的主机IP -k   指定检测使用

6. SQL Server数据库监控 - 如何告警

原文:6. SQL Server数据库监控 - 如何告警 常用的告警方式大致有:短信.邮件.应用程序 (beep提示,图标提示,升窗提示等),可是不能一直坐在电脑前看着应用程序,或者用脚本部署监控,根本没有程序界面,所以通常用短信.邮件两种方式告警. 一. 告警方式 1. 短信 用程序发短信的方式一般有这两种: (1) 硬件 需要1张SIM卡,1个SIM卡读卡设备 (比如:短信猫),然后把设备连接到电脑,应用程序根据设备的软件接口,传参并发送短信.记得把SIM卡设备放在信号好,无干扰的地方: 如

如何实现公有云主机基于微信的监控与告警通知?

对于系统管理员/运维工程师而言,一个好的监控与告警系统,已经成为日常工作中必不可少的手段.但建立这样一个系统,却并非易事.传统的做法往往存在以下弊端: 1. 为获取监控数据,通常需要在主机中安装Agent进行监控数据的采集,那么,Agent是否可信,其对系统的影响有多大,往往是我们不得不考虑的问题: 2. 告警的手段比较单一.通过手机短信告警,满足了及时性,但能够展示的信息较为贫乏,且交互手段过为单一:通过email告警,信息丰富性得到了满足,但及时性却又有所欠缺. 因此,如果能够通过微信获得告

Linux/Unix shell 监控Oracle告警日志(monitor alter log file)

    使用shell脚本实现对Oracle数据库的监控与管理将大大简化DBA的工作负担,如常见的对实例的监控,监听的监控,告警日志的监控,以及数据库的备份,AWR report的自动邮件等.本文给出Linux 下使用 shell 脚本来监控 Oracle 告警日志(monitor alter log file).     Linux Shell的相关参考:        Linux/Unix shell 脚本中调用SQL,RMAN脚本        Linux/Unix shell sql 之

SQL Server数据库监控 - 如何告警

常用的告警方式大致有:短信.邮件.应用程序 (beep提示,图标提示,升窗提示等),可是不能一直坐在电脑前看着应用程序,或者用脚本部署监控,根本没有程序界面,所以通常用短信.邮件两种方式告警. 一. 告警方式 1. 短信 用程序发短信的方式一般有这两种: (1) 硬件 需要1张SIM卡,1个SIM卡读卡设备 (比如:短信猫),然后把设备连接到电脑,应用程序根据设备的软件接口,传参并发送短信.记得把SIM卡设备放在信号好,无干扰的地方: 如果有大量短信要发,1张SIM卡是不够用的,而且发送过度频繁

阿里云-进程监控与告警

1.背景 我在阿里云ECS上部署了个人网站,用到了mysql与tomcat,所以想要分钟级监控这两个进程是否alive. 2.安装监控agent 安装说明:https://help.aliyun.com/knowledge_detail/38859.html 进入阿里云控制台,产品与服务|监控与管理|云监控|云服务监控|云服务器ECS|单击实例ID,即可见到图2-1. 图2-1 如果图表有缺失,按照提示安装监控agent.它会定时收集系统信息并上报给阿里云后台. 3.添加进程监控 见图3-1.

微软为Office 365管理员添加Message Center新特性

微软Office 365目前的销售情况以及在全球各地上市的情况都一片大好,越来越多的人开始关注Office 365在产品服务方面将有怎样的改进.本周,微软提供了与Office 365管理员更好的沟通方式:Message Center(信息中心). 在Office官方博客中,微软表示Message Center现在已于管理入口的左侧区域设有链接,专门设计用于管理员接收到的现有邮件提醒的功能完善,添加如提醒等新通知特性至Office 365中.微软表示:"你会看到一系列重要的内容,链接至要求管理员动

Firefox4beta4添加图形硬件加速特性

北京时间8月20日,据国外媒体报道,Mozilla计划在下周一发布它的第四个测试版Firefox 4,目前该版本的代码还没有完全完成.该版本对一些Windows用户添加了图形硬件加速功能,但该功能默认是关闭的.同时跟随该更新变化的还有被称作标签集的用户接口. 硬件加速被设计用来将一些任务从计算机的主处理器切换到图形处理器.一种方式是使用Windows Direct2D接口,该接口可以加速文档和图片在新版Windows系统下的显示速度. Firefox 4的设计理念是更快,更好,为的是让Mozil

归档—监控ORACLE数据库告警日志

ORACLE的告警日志里面包含许多有用的信息,尤其是一些ORACLE的ORA错误信息,所以有必要及时归档.监控数据库告警日志的ORA错误,及时提醒数据库管理员DBA处理这些错误信息,那么我们首先来看看告警日志的内容片断: Thread 1 advanced to log sequence 37749 (LGWR switch) Current log# 6 seq# 37749 mem# 0: /u01/oradata/SCM2/redo06.log Thu Jun 27 15:02:30 20