零代码如何打造自己的实时监控预警系统

概要

为什么要做监控

线上发布了服务，怎么知道它一切正常，比如发布5台服务器，如何直观了解是否有请求进来，访问一切正常。
当年有一次将线上的库配置到了Beta，这么低级的错误，排错花了一个通宵，十几个人。
某个核心服务挂了，导致大量报错，如何确定到底是哪里出了问题。
SOA带来的问题，调用XX服务出问题，很慢，是否可以衡量？

由于业务系统数量大，每天都会产生大量的系统日志和业务日志，单流式业务的一台服务器产生的日志达400M 想直接查看内容打开可能几分钟，而且内容之多根本无法查看，给开发和运维带来诸多不便，现业务都是分布式的，日志也是分布在每台服务器上，所以查看日志和统计更是效率低下。实时收集分布在不同节点或机器上的日志，供离线或在线查阅及分析来提升工作效率的需求异常迫切，在此背景下，特对公司统一日志平台进行初步架构设计。

在信息化时代，日志的价值是无穷的。为了对系统进行有效的监控、维护、优化、改进，都离不开对日志的收集和分析，接下来我们来看看秉着“短平快”的互联网精神，构建的这套适合现有业务系统的统一日志平台，总体分为业务日志监控平台和软硬件服务监控平台。

业务日志平台总体设计

以上是最终的一个最终的一个架构规划，统一日志监控系统负责将所有系统日志和业务日志集中，再通过flume或logstash上传到日志中心(kafka集群)，然后供Storm、Spark及其它系统实时分析处理日志，或直接将日志持久化存储到HDFS供离线数据分析处理，或写入ElasticSearch提供数据查询，或直接发起异常报警或提供指标监控查询。

根据现有业务量来看，以上架构有点“重”，可以作为以后的目标，现阶段来说可以参考以下架构：

以上内容皆以配置为主，对现有业务没有影响，针对于Windows环境可以用FileBeat监控本地日志全量、增量的上传日志，对于一些稳定的日志，比如系统日志或框架日志(如HAproxy访问日志、系统异常日志等)，通过rsyslog写到本地目录local0，然后logstash根据其配置，会将local0中的增量日志上传到日志中心。Java环境下可以采用log4j直接发送到Logstash。

日志处理层

可以在Logstash中对日志作简单的分类加工处理再发送出去。

我们可以将日志聚合，根据业务不同，建立不同的索引，存入ElasticSearch提供查询。发现异常日志时，发往监控中心，向对应的业务方发起报警，发现和预发问题的实时性提高了。统计一些访问日志或调用日志等指标信息，发往监控中心来掌握相关调用趋势。调用链开始做起来了，系统性能瓶颈一目了然了。

日志存储层

ElosticSearch中按照不同业务建索引主题（数据库），业务里面再按照需求建类型（表），不需要的历史数据可按需要持久化到HDFS，以减少ES的压力。

展示层Kibana

Kibana是ELK中的组件，是一个针对Elasticsearch的开源分析及可视化平台，用来搜索、查看交互存储在Elasticsearch索引中的数据。使用Kibana，可以通过各种图表进行高级数据分析及展示。

Kibana让海量数据更容易理解。它操作简单，基于浏览器的用户界面可以快速创建仪表板（dashboard）实时显示Elasticsearch查询动态。

Kibana可以非常方便地把来自Logstash、ES-Hadoop、Beats或第三方技术的数据整合到Elasticsearch，支持的第三方技术包括Apache Flume、Fluentd等。

监控ES的整体健康状态

直接查询ES索引内容

简单的查询过滤日志数据窗口

可实时的图形统计展示

采用ElastAlert实现日志监控告警

平台缺失针对mysql连接数的告警，指定业务如流式服务数据异常，当异常触发时能够及时通过短信、邮件等方式通知相关负责人员

如故障信息：

以上说的“日志”不仅限于日志信息，也可以是业务数据。

软硬件服务监控平台设计

当业务层日志发现异常时如保存数据到Mysql时经常性报连接数据库超时，只有当业务人中发现再通知我们时已经过了一段时间才发现问题，但已无法重现当时的生产环境，也就靠经验来猜原因是服务器的网络问题还是数据库的真实连接满了还是程序的写法出现问题，因此就需要监控当时生产环境的软硬件监控数据。

经过多方咨询参考各大厂的监控方案和对比在此采用Zabbix作监控。

最近各服务整体问题一览

针对Web服务器和API的访问性能、HAproxy、IIS、Tomcat

实时绘图监控服务器所有TCP端口的数量和 MySql数据库连接数、Redis性能

自定义聚合展示服务器各指表最近的状态,CPU、内存、流量。

显示所有服务器的一个健康状况，一目了然

自动注册监控新的服务器

报警机制，Email、微信、短信等

其它特性

可监控Linux、Windows、打印机、文件系统、网卡设备、 SNMP OID、数据库等平台服务状态。

允许灵活地自定义问题阀值， Zabbix 中称为触发器(trigger), 存储在后端数据库中。

高级告警配置，可以自定义告警升级(escalation)、接收者及告警方式。

数据存储在数据库中历史数据可配置内置数据清理机制。

web 前端采用 php 访问无障碍。
Zabbix API 提供程序级别的访问接口，第三方程序可以很快接入。

灵活的权限系统。

结合以上业务和软硬件上的日志方便开发和运维实时查找问题提高解决问题的效率，而且前期均可只通过配置0代码就可实现监控和报表展示。

扩展性

可用Spark对数据实时分析，智能拦截异常数据和直接发送异常警报。

在Zabbix上结合自己的业务需求二次开发应用系统层面上的预警监控系统。

以后可加入Kafka将日志集中，至于为什么选用kafka集群来构建日志中心，理由主要如下:

1、分布式架构，可支持水平扩展。

2、高吞吐量，在普通的服务器上每秒钟也能处理几十万条消息(远高于我们的峰值1.5万条/秒)。

3、消息持久化，按topic分区存储，支持可重复消费。

4、可根据broker配置定期删除过期数据。

时间： 2024-10-26 11:46:52

零代码如何打造自己的实时监控预警系统的相关文章

android 代码怎么实时监控连接当前wifi热点的设备的连接或断开事件？

问题描述 android 代码怎么实时监控连接当前wifi热点的设备的连接或断开事件? 如题,手机A开了热点,手机B打开Wifi连接上了A.那么当B关闭Wifi按钮时,A怎么实时感知到.有没有实现的代码.方法.求大神们解救哦哦!!!!! 解决方案 // 当网络变化的时候系统会发出一个广播 Broadcast,只要在程序中注册一个广播接收器 BroadcastReceiver,并在 IntentFilter 中添加相应的过滤,这样一旦网络有变化,程序就能监听到 public static fina

业务实时监控服务（ARMS）征文活动

业务实时监控服务(ARMS) 是一款端到端一体化实时监控解决方案的PaaS级阿里云产品.通过该产品,用户可以基于海量的数据迅速便捷地通过定制化为企业带来秒级的业务监控和响应能力.ARMS产品孵化于阿里内部业务,经过长时间考验,目前已被广泛用于阿里内外的商品.物流.风控和各种云产品的各类业务监控场景. ARMS面向全部ARMS用户发起征文活动,为了向更多的人宣传您的业务,打造您的品牌,同时也为了帮助其他的ARMS用户更好地使用ARMS,现在动手写一篇经验满满的文章,传递您的干货,分享您的经验,散发

AJAX + SVG 实现实时监控图表

ajax|监控|图表 AJAX 已经有很多文章介绍它的原理及其应用了.但是遗憾的是现在并没有很多结合实际项目应用.本文结合实际项目中的应用来讲述利用 AJAX 和SVG 技术如何创建各种激动人心的功能,并附带可以运行的例子和源代码. 本文需要一定的 AJAX,SVG 知识和应用经验.当然它们都可以在 ibm.com/developerworks/cn 上找到. 个人对于 AJAX 应用的建议是如果传统的 MVC 能够满足的应用,没有必要使用AJAX来代替,因为这里 AJAX 唯一能带来的好处只是

网站实时监控系统的设计与实现

监控|设计摘要: 本文提出了基于操作系统内核服务和多线程技术的网站实时监控系统,解决了以往监控系统不能及时恢复异常网页的问题.重点介绍了系统的传送控制部分和监控部分关键词: 实时监控:多线程:API 引言对网页监控比较成熟的技术是定时监控,即由用户设定时间间隔,系统按时对需监控的网页文件轮询一遍,来判断文件是否被非法删除或篡改.若发现,立即用备份盘上的备份文件进行恢复.这样的监控存在一个缺陷:被非法删除或篡改的网页不能得到及时的恢复. 本文介绍的网站实时监控系统创造性地利用操作系统内核提

开源倾情奉献：基于.NET打造IP智能网络视频监控系统

转载自 http://www.cnblogs.com/gaochundong/p/opensource_ip_video_surveillance_system_part_1_introduction.html 开源倾情奉献系列链接开源倾情奉献:基于.NET打造IP智能网络视频监控系统(一)开放源代码开源倾情奉献:基于.NET打造IP智能网络视频监控系统(二)基础类库介绍开源倾情奉献:基于.NET打造IP智能网络视频监控系统(三)命令行工具集开源倾情奉献:基于.NET打造IP智能

Python实时监控文件3种方法

在业务稳定性要求比较高的情况下,运维为能及时发现问题,有时需要对应用程序的日志进行实时分析,当符合某个条件时就立刻报警,而不是被动等待出问题后去解决,比如要监控nginx的$request_time和$upstream_response_time时间,分析出最耗时的请求,然后去改进代码,这时就要对日志进行实时分析了,发现时间长的语句就要报警出来,提醒开发人员要关注,当然这是其中一个应用场景,通过这种监控方式还可以应用到任何需要判断或分析文件的地方,所以今天我们就来看看如何用python实现实时监

python实现实时监控文件的方法_python

在业务稳定性要求比较高的情况下,运维为能及时发现问题,有时需要对应用程序的日志进行实时分析,当符合某个条件时就立刻报警,而不是被动等待出问题后去解决,比如要监控nginx的$request_time和$upstream_response_time时间,分析出最耗时的请求,然后去改进代码,这时就要对日志进行实时分析了,发现时间长的语句就要报警出来,提醒开发人员要关注,当然这是其中一个应用场景,通过这种监控方式还可以应用到任何需要判断或分析文件的地方,所以今天我们就来看看如何用python实现实时监

MySQL系统运行状态实时监控(python版本)

昨天的文章,用shell写了一个简单的MySQL系统运行状态实时监控的模版,<MySQL系统运行状态实时监控(shell版本)>,对于这种操作,任何语言都可以完成,今儿就用python写一下,写的不优雅的地方,请各位指正. 首先,为了让python能连接MySQL数据库,需要一些第三方的库,由于我用的是python 2.3版本,因此可以使用mysqldb,(若是python 3.x,则可以使用PyMySQL),可以从以下链接下载压缩,目前最新版本是1.2.5, https://pypi.pyt

零代码平台实现

父亲病的不轻,回家很多天了.除了照顾老爸,心中踌躇弄一个零代码的开发平台,由于现在技术和精力都有限,打算一步一步慢慢去实现.工作以来学到了很重要的两点:一是学英语,二是写文档. 学英语是为了从老外那学到先进的技术.写文档为了在做事情的时候有计划 .故先写个简单思路作为计划吧. 1.一套软件应该有一个统一的UI.打算在Asp.net MVC中写几个强大控件去统一界面.通过控件的组合来完成页面的定制.主要是为了省去程序员界面调整的时间.技术实现:ASP.NET MVC+JS+CSS+HTML

猜你喜欢

php标识和注释

编程语言. PHP PHP:HyperText Preprocessor 超文本预处理器早期 PHP personal HomePage 个人的网页. 能够夹在在 html代码中 ...

用YSlow优化我们的网站！

YSlow是yahoo美国开发的一个页面评分插件,非常的棒,从中我们可以看出我们页面上的很多不足,并且可以知道我们改怎么却改进和优化. 仔细研究了下YSlow跌评分规则. 主要有12条: 1. Mak ...

MySQL管理介绍

mysql 在运行数据库系统时, MySQL的使用相当简单,且进行MySQL安装和使用所需的工作也很少.MySQL的简单性可能就是它极为普及的原因,尤其是在非程序员人群中的普及.当然,它对于训练 ...

MSSQL db

相信大家对ASP+MSSQL注入都已经很熟悉了,连一个对SQL语法丝毫不懂的人也可以用NBSI来轻松入侵大量网站.但就算是一个SQL INJECTION高手,如果针对在MSSQL中只有db_owner ...

Oracle 9i 在AIX上的安装

oracle 运行环境:RS6000 / Aix 4.3.3 /shell:Korn(ksh)/ 虚拟X-Window 安装介质:光盘,共有四张,文件名为AIX64_901_Disk(1-5).CP ...

SQL Server 本机 Web 服务的使用方案

server|web 摘要:获得有关如何设置 SQL Server 以便在异类环境中进行 Web 服务访问的详细讨论,并且了解更多有关 SQL Server 中 Web 服务的主要方案的信息. 下载相 ...

Windows2000操作技巧完全手册(下)

有许多单位没有升级系统,还在使用Win 2000,因为机器上运行着单位的各种应用软件,例如财务网络系统等等,如果升级到XP,就需要购买新的财务软件,重新安装设置,许多企业都没有这方面的资金预算,因此W ...

如何在OS X系统上配置Apache、PHP和MySQL

本周,我一直在思考如何使用WordPress作为一些新项目的发布平台.表面上看来,已经存在很多我需要的东西,但是我想亲自实践一下,看看它是如何工作的,并且尝试将几个已经存在的平台组合起来使用. 问题是 ...

Windows 7应用中心你也有！看看Windows 7任务栏

可以说网络的应用已经成为了我们使用电脑的主要用途,大多数人每天打开电脑后第一个启动的就是浏览器,因为现在几乎所有的事都可以在网页中完成.每次打开网页要么直接输入网址,要么在收藏夹中寻找,可是如果我 ...

Java 语法介绍(四)：数组

1:数组说明数组是Java语言中的特殊类型.它们存放能通过索引来引用的一系列对象,另外,你可以定义数组的数组,下面是一些示例: int i[]; char C[]; float f[][]; 2:数 ...

Photoshop为婚片mm磨皮美白教程

原图效果图教程步骤如下 1.打开原图,复制一层,用仿制图章工具修复脸上比较大的斑点,效果如图: 2.再复制一层,用磨皮滤镜portraiture磨一下皮,参数和效果如图: portraiture滤 ...

Win8系统WiFi显示自动关闭状态如何解决

1.按Win+R键,打开运行,输入"regedit",点击确定 2.定位到任意你想要修改权限的项,并右击该项,选择"权限"; 3.选择想要修改权限的用户组, ...

win10斯巴达浏览器使用教程

随着微软宣布Win10斯巴达浏览器发布,Windows10系统将变得更加复杂.IE11目前是Win10预览版9926的默认浏览器,但是后来的斯巴达采用新的Edge渲染引擎,有望取代IE11,当然也 ...

超级兔子安装失败怎么办?

超级兔子常见问题解答: 1.旧版本已设置,魔法设置.安全助手,在新版本中如何修改或为空密码 ? 超级兔子安全助手的密码删除:在开始菜单的运行中输入"RegEdit"打开注册表定 ...

为啥oracleDBCA创建不了数据库，一直停在85%

问题描述为啥oracleDBCA创建不了数据库,一直停在85% 咋办? 解决方案没有什么错误报告...除了等...大概没什么法子吧... 解决方案二: 看一下详细的日志文件dbca日志文件,以及数 ...

jersey1.8下如何生成wadl

问题描述 jersey1.8下如何生成wadl 请教,我已经写好的jersey的服务接口,需要将服务生成wadl文件, jersey1.8如何生成wadl?需要什么配置.jar包. 解决方案 http ...

自定义 Lint 规则简介

上个月,笔者在巴黎 Droidcon 的 BarCamp 研讨会上聆听了 Matthew Compton 关于编写自己的 Lint 规则的讲话.深受启发之后,笔者想就此话题做进一步的探索. 定义如果 ...

ajax+php实例数据调用与异步传输

ajax+php实例数据调用与异步传输 function init_ajax() { var ajax=false; try{ ajax = new ActiveXObject(" ...

每日一博 | 各种动态渲染 Element 方式的性能探究

树立原则:动态渲染进入一个Dom元素,首先需要保证动态渲染操作必须尽可能少对原有dom树的影响,影响重绘及重排.确定方法论:必须寻找一个容器来缓存渲染期间生成的dom结构(操作必须尽可能少对原有dom ...

财富：新搜索引擎Cuil并不能成为谷歌的克星

8月1日消息,<财富>杂志撰文指出,新搜索引擎Cuil并不能成为谷歌的克星,除非它能开发出与谷歌媲美的广告平台,否则,很难打败谷歌搜索市场霸主的地位. 该文作者Yi-Wyn Yen称,把C ...

“围住神经猫”微信刷屏开发仅用2个人1.5天

"我用了12歩围住神经猫,击败88%的人,你能超过我吗?"很多微信用户发现,这两天自己的朋友圈已被一款名为"围住神经猫"的小游戏刷屏.点开朋友分享的链接,一只露 ...

[C#]23种设计模式

创建型模式工厂方法(Factory Method)在工厂方法模式中,工厂方法用来创建客户所需要的产品,同时还向客户隐藏了哪种具体产品类将被实例化这一细节.工厂方法模式的核心是一个抽象工厂类,各种具体工 ...

财富的故事不可以简单复制

本期集中谈了几个令人羡慕.倍感有趣的财富人物的故事,然财富人物一旦成为了故事的主角,他(她)们的故事就停不下来了,成败得失.喜怒哀乐皆有故事,媒体乐意讲,受众大概也乐意听. 凑巧,有许多故事的全球闻名 ...

java File[] 显示问题

问题描述现在我在ftp上得到一个File[]的数组,我要用哪个控件,能够实现这样的显示风格,需要那个控件有代码提示更好,万分感谢66分祝你生活666 解决方案解决方案二:JTable:加上自定义的 ...

为什么现在myeclipse8.6不支持java EE6啊

问题描述为什么现在myeclipse8.6不支持java EE6啊,还在支持旧的java EE5 ,每次都得改一些东西,好麻烦. 解决方案嗯,确实是这样的..我的myeclipse8.6 for ...

应用户要求暴雪取消论坛实名制

据国外http://www.aliyun.com/zixun/aggregation/894.html">媒体报道称,暴雪于周五表示,迫于大量用户的反对,公司将取消论坛实名制的计划. ...

D3.js实现柱状图的方法详解_javascript技巧

D3.js介绍 D3.js 是一个基于数据操作文档JavaScript库.D3帮助你给数据带来活力通过使用HTML.SVG和CSS.D3重视Web标准为你提供现代浏览器的全部功能,而不是给你一个专有的 ...

解决video标签在安卓webview下无法自动播放问题_Android

在安卓webview下 html5 的 video 设置autoplay 属性或在document ready中使用play方法都不能使它自动播放只能用webview的onPageFinishe ...

制作邮件收发的功能

问题描述最近在做毕业设计,其中要做邮件收发的功能,可是不知道怎么实现,谁能帮忙大概讲解下,理清思路.我用的是C#.NET.先谢过.

js-如何获取这个购物车的订单数据

问题描述如何获取这个购物车的订单数据 js代码太多分割为两部分 !function (t, e, a, n) { "use strict"; function i(e, a) { ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.027 s.