四年打磨,全新公测ARMS终极进化:业务监控实时无边界

作为和企业互联网架构平台 Apsara Aliware“三驾马车”(EDAS/DRDS/MQ)并驾齐驱的又一重磅产品。本文主要从ARMS的诞生背景开始,介绍了ARMS的雏形,着重说明了全新公测的ARMS业务实时监控服务,最后和大家分享了ARMS的五个应用场景并做了ARMS的特点总结。



以下为精彩内容整理:

 

ARMS助力企业应用实时监控

ARMS特点可以用三个词来形容:

  • 业务:方便快捷的定制能力。与其它平台监控产品不同的是,ARMS直接从业务的元数据开始入手,形成一个监控体系,为了让ARMS能理解业务元数据,我们做了很多数据接入层的工作。
  • 实时:基于大数据实时计算和存储平台。
  • 监控:在线报表,报警, Cube OpenAPI等多种输出。

业务监控架构对比

传统业务监控架构定制复杂,对生产数据库有影响;多为离线计算,无法满足企业的业务监控实时性要求;各个基础组建昂贵,需要定制化硬件或一体机。

当前的互联网实时业务监控架构组件比较零散,无端到端打包方案,搭积木式方案复杂;对业务的日志侵入式改造成本高;实现周期长且门槛高,业务方需自行编写各个流计算,MR以及报表等实现。

阿里业务实时监控服务的架构(ARMS)从日志采集,日志传输到日志分析的高度一体化云上解决方案,无需客户运维;完备的日志接入方案,日志接入成本低;可视化的流计算定制接口,提升业务监控定制效率,降低入门门槛;内置报表大屏定制组件以及数据持久层组件,方便各类对接各类场景。

调用统计之实时计算解决之道

ARMS最初是为了应对阿里内部分布式架构的数据和性能统计而生的。这个统计产品就是后来大名鼎鼎的Eagleeye (鹰眼)系统。ARMS当时一开始是作为中间的日志处理层为Eagleeye服务的。

该架构采用基于流计算的架构,以满足实时性。

以统计单个应用的各种服务调用为例:

1. 各个服务特定时间的所有调用次数。

2. 所有服务特定时间的所有调用次数。

3. 特定时间内被调用最多的服务。

方法:1. 服务器端日志抓取。2. Jstorm程序分析。3. 入库列式存储, 形成OLAP-Cube。

数据按需生成,计算实时进行。我们对于每一个数据,在实时计算里都会有对应的计算模块,当数据进来后,会落到各个相应的逻辑模块。我们这样做有两个优点:一是对业务无侵入式改造,一是无限横向扩展架构。

ARMS雏形: 计算编排的抽象化

服务调用统计之后,各类监控需求接踵而至,流式计算定制应接不暇。除了要统计服务数,还要统计内存、CPU甚至容器里的指针,还有各种各样的二方应用,每个人都要写流式计算程序,这样业务方的接入效率就比较低,所以我们抽象出如图的改进措施。

每个人接ARMS系统时,在积木块里通过浏览器方式填各种各样的参数逻辑,这样就把流式计算接入从几天降到几分钟。

实时监控结果一致性的挑战

随着计算集群扩展,计算节点失效成为常态。

解决办法:

1. 日志队列记录批次。

2. 计算集群监控批次计算状态。

3. ARMS在恢复结点重发计算批次。

存储层数据补全的必要性

业务端数据源不可控和高的业务要求( 交易,风控) 带来的数据一致性的新挑战。我们有什么解决办法呢?我们通过存储层后台的数据Merge机制保证最终数据准确性。从流式计算进来打标到后端存储时,我们能识别这种情况,我们不会丢数据,而是把数据放到客户里面,最后通过后台特殊机制merge掉,这样可以从源端避免异常事件的发生。

实时监控的存储层挑战

监控系统的存储层应提供M-OLAP Cube 的能力。

  • 多维度查询:同一类交易数据,按时间聚合方式查询,按类目方式聚合查询,按交易地域方式查询,同时按地域和类目方式上钻、下钻、选钻等。
  • 基于海量可扩展存储层的热点分散:尤其是实时计算中,如何避免当前时间的数据成为存储局部热点。
  • 实时计算某些特殊结果的基于时间维度聚合查询。
  • 压缩、分层、聚合等。

数据源和数据导出的丰富性

支持业务互联网快速迭代产品模式的监控。在业务支持层,我们做了更多的数据源的接入,一开始支持纯日志,后来为了满足多样性,同时也支持了API推送、MQ接收和Binlog解析等等。

业务实施监控的理解

  • 绝不仅仅是收集日志和消息通道:数据源需要丰富性;通道需要高可靠,可堆积,可回溯。
  • 绝不仅仅是实时计算:计算逻辑封装简单可用;监控数据的一致性保证。
  • 绝不仅仅是Hbase,  分析型数据库:如何保证数据补全;数据热点,数据压缩,查询效率。
  • 有了监控结果往往还需要临门一脚:报表,监控;实时大盘。

 

ARMS 让实时监控 化繁为简

经过4年的打磨,ARMS现有20+场景,数百不同的业务大盘,近千台服务器在数十集群上,最大集群规模处理数据15000+MB/s。

在全新的业务实时监控服务ARMS界面中,只需要关心三件事:数据从哪里来;实时计算流程怎么编排;数据该怎么用。

可视化计算编排

不需要编程的实时计算和MOLAP Cube。分布式计算只做两件事情:数据清洗和聚合据算。ARMS中的Map步骤,不需要写一行代码,需把自己的数据导入进来,通过做一些切分逻辑等,自动解析成KV,数据也可是以逗号或冒号隔开的文本方式;Reduce也不需要写一行代码,需做三件事:计算值;维度是什么;数据粒度。

灵活使用 ARMS 结果

ARMS 的最终数据监控结果可以以三种方式供您的IT系统访问。

  • 访问在线报表:通过报表控件和大盘来查看您的数据。
  • 接收报警监控:通过定义需要报警的指标以通过短信,邮件来接受报警监控。
  • 访问数据集的 OpenAPI:每个数据集类似于SQL的一张表,在监控任务中通过配置产生;和传统M-OLAP数据魔方相似,只是通过数据集的OpenAPI进行访问;数据集OpenAPI同样适用于报表控件和报警规则。

拖拽而出的实时大盘

不需要任何编程即可拖拽式定制您的大盘。ARMS支持8种控件,它们对维度的要求是不一样的,用户只需要根据不同的表选取不同的维度,根据不同的表格类型,我们可以帮用户生成适合的数据集,同时各个控件通过拖拽式的组合组合成实时在线大盘。

 

ARMS应用场景

应用性能和状态监控实时大盘。

  • 系统性能和调用日志系统:应用/机房聚合分析——系统监控大盘——性能和状态异常报警。
  • 电商交易实时大盘:电商交易日志收集——地域、门店、商品维度分析——销售实时大盘——销售下跌预警。
  • 公交运力实时监控系统:公交GPS日志+刷卡日志——地图区域聚合分析——公交运力分布实时展示——运力和拥堵报警。
  • 移动终端实时监控系统:手机客户端日志——地区版本聚合分析——客户端使用大盘——客户端异常报警。
  •  物流线路实时监控和预测系统:物流订单数据收集——揽收送达出入仓聚合分析——仓位派送路线水位实时大盘——仓位爆仓预警。

 

ARMS的独特之处

  • 业务:  直接从业务数据(Business Raw
    Data) 出发,赋予用户自己定制的能力。
  • 实时:  基于大数据实时计算,在海量数据中“正确地”第一时间捕获异常。
  • 监控: 在线报表,各类报警,以及MLOAP数据魔方的能力。

                                                                                 

业务实时监控服务 (Application Real-Time Monitoring Service, 简称ARMS)公测中,可访问官网查看具体产品信息:https://www.aliyun.com/product/arms

更多企业互联网架构平台内容可访问:https://www.aliyun.com/aliware

 

时间: 2025-01-20 23:47:05

四年打磨,全新公测ARMS终极进化:业务监控实时无边界的相关文章

EDAS伴侣ARMS终极进化:业务监控实时无边界

作为和企业互联网架构平台 Apsara Aliware"三驾马车"(EDAS/DRDS/MQ)并驾齐驱的又一重磅产品.本文主要从ARMS的诞生背景开始,介绍了ARMS的雏形,着重说明了全新公测的ARMS业务实时监控服务,最后和大家分享了ARMS的五个应用场景并做了ARMS的特点总结.  以下为精彩内容整理:   ARMS助力企业应用实时监控 ARMS特点可以用三个词来形容: 业务:方便快捷的定制能力.与其它平台监控产品不同的是,ARMS直接从业务的元数据开始入手,形成一个监控体系,为了

《天龙八部2》第四章18日公测预告视频放出

(综合/小鸢) 武侠网游巨作<天龙八部2>第四章"飞龙在天"将于3月18日震撼公测,开启革命性的金庸武侠新纪元,其中,由原著最精彩的片段"少林大会"改编的副本"少室山",将是第四章最大的亮点.官方放出最新公测预告视频,全面揭开少室山大战的真相.同时,围绕着的18日公测,两大看点绝对不能错过. 公测预告视频 看点一: 360度全自由飞行 <天龙八部2>历时一年,对游戏引擎进行全面优化,采用全新的动态碰撞检测技术与阻挡点探测技

《第四区》韩服今日公测被冠良心品质称号

(编译/小熙)韩国Nexon公司于昨天正式对外召开了新闻发布会,重点推出了2款游戏--<第四区>和<跑跑卡丁车>revolution更新. 作为Nexon耗时3年研发的网游作品,<第四区>12月30日将开启公测.游戏在早期宣传中被冠以"良心品质"的称号.游戏以对战格斗为主,共为玩家提供了6种不同的武术拳法. <第四区>可以提供最多8人进行对战模式---广场系统,分为组队战和个人站两种小模式.而PVE模式副本系统,也创新的在副本过关时评定等

网易《天下3》5月30日公测 用户翻倍增长

5月24日消息,网易今日在青岛举办首款全模式3D玄幻网游<天下3>公测发布会,网易宣布<天下3>将在5月30日推出全新公测升级版本.网易CEO丁磊透露,网易游戏业务目前仍保持30%的年增长率,其中<天下3>自内测以来实现用户数量的翻倍增长.作为网易3D产品线的领军产品,<天下3>于去年开放测试,网易CEO丁磊曾在最新财报中称,该游戏"充分利用了<天下贰>的用户群,在第四季度展现出了巨大的增长潜力,在收入和玩家数据方面都创下新高.&quo

OS X 10.10.3公测版发布 快来试试全新的照片应用

  今天凌晨的最新消息,苹果向所有的开发者们以及公测项目用户推送最新 Mac OS X 10.10.3 公测版系统,OS X 10.10.3系统当中我们目前已经知道的最大的变化就是,被完全重做的 OS X 系统照片管理应用. 此前,我们有和大家一起体验过全新的Mac OS X照片管理软件,这将会是一个全是的 Photos,有点像 iOS 系统上的 Photos,全面兼容了iPhone 的全景照片, 与 慢动作拍摄等播放模式.照片润湿与修改?这个小功能还是有的, 但是, 照片的旋转需要通过快捷键完

阿里云中间件产品ARMS公测 实时监控“一站式”解决

日前,阿里云业务实时监控服务(Application Real-Time Monitoring Service,简称ARMS)正式公测,阿里云互联网中间件产品家族在实时监控领域再添利器.ARMS是一款为用户提供端到端一体化实时监控解决方案的PaaS级产品.它为用户屏蔽了复杂的监控计算逻辑,可基于海量数据,为不同行业的用户提供诸如系统监控.商品销售.网站分析等各种场景监控方案的能力,迅速便捷地通过定制化为企业带来秒级业务监控和响应能力. 公测地址:https://www.aliyun.com/pr

OVM虚拟化开启公测,支持Docker全新体验!

摘要: 正逢暑夏,OVM虚拟化管理平台再次给您带来了一次全新的超感体验. 此次,针对公测版OVM, 团队成员对此进行了全面升级,即隆重推出公测版OVM-1.1.1.160718_RC版本,欢迎大家一起体验Iaas"新国货"OVM公测版! OVM免费虚拟化管理平台,作为完全免费.公益的一款产品,不仅拥有商业软件同样的稳定性.易用性.高性能,而且还拥有开源软件一样的开放性.可扩展性.是介于商业版和开源版软件之间的第三种选择,刷新了国内Iaas领域没有免费产品的空白. 从内测推出开始至今,仅

phpwind宣布淘满意正式开始公测全新社区购物返利产品

摘要: 近日,阿里巴巴旗下互联网产品与服务提供商phpwind宣布旗下面向地方与垂直社区的电子商务平台-淘满意,正式开始公测全新社区购物返利产品.淘满意作为一个开放淘宝商家资源.购 近日,阿里巴巴旗下互联网产品与服务提供商phpwind宣布旗下面向地方与垂直社区的电子商务平台-淘满意,正式开始公测全新社区购物返利产品.淘满意作为一个开放淘宝商家资源.购买体系以及支付宝支付工具.安全体系的平台,向国内数以万计的社区网站提供了发展社区电子商务的工具性产品.此次独立发布的社区购物返利完全免费开放,站长

剑灵国服8月8日公测 全新首饰八卦曝光

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;       [科技讯]7月21日信息,今日,超人气大作<剑灵>正式宣布将于8月8日开启公开测试,最新版本白青山脉同步上线.本次<剑灵>公测版本将从地图.装备.战斗玩法.剧情等多个纬度进行颠覆革新,腾讯游戏频道第一时间独家为玩家带来<剑灵>公测版本最新首饰和八卦牌内容报导. 在<剑灵>五月上线的"刺金传说&qu