一分钟读懂MySQL分布式消息的处理

在很多MYSQL环境中，对于MYSQL的分布式事物处理一直是个难题，在当前互联网环境中，大多数应用系统是基于SOA的很多复杂接口之间的调用，并且事物之间的处理优先级也是有先后的，所以对于实际入库的数据而言，不同的系统，对于当前入库的处理方式是不一样的，这样就衍生出了对于订阅MYSQL消息的需求。

在公司内部，这套分布式消息系统负责了各个子接口之间数据的衔接，同时肩负后端DW数据仓库的实时消息计算，多数的RDBMS数据，被分解成各种子消息队列，通过不同的topic被各种消费者订阅。

一、如何分解消息

后端订阅程序（基于阿里巴巴的canal）通过解析不同应用的binlog (mysql线上产生的二进制日志) 通过模拟slave的行为，将binlog顺序的订阅到本地，通过内部解析程序，将binlog events解析成对应的消息，通过MetaQ 固化解析完成的消息，自定义存放时间，从而让consumer 自行订阅到对应的系统，进行相关处理。

具体roma文档可以参考我的blog:

二、何时订阅

通常当支付系统需要做异步分布式事务调用的时候，可以采用roma消息。采用水平拆分DB而需要一些统计类的需求的时候（合表）可以订阅合并的topics。当需要一个汇总的数据仓库，执行跨库join查询的时候可以订阅roma消息。

上图中，各类系统通过RPC框架进行异步调用，同时将订阅到的消息（roma异步消息）进行相处理，将操作类型，操作细节发送给对应子系统，从而实现了操作的异步化（而roma对于前端数据库日志的实时解析保证了事物消息的实时性）。

三、对于数据仓库

在我们的系统中，很多核心表被水平拆分成了N份，对于后端实时数据仓库来说，希望通过合并所有的拆分表，进行多维度的查询工作（对job来说，可以通过定期任务抽取水平拆分的表，但是实时性是滞后的）。

在中转服务器上，使用java程序直接订阅roma的消息，拼接成相应的SQL在后端DW上直接执行。

通过订阅同步消息，将前端更新实时同步到后端的数据仓库，从而达到实时分析的需求。后期结合binlog server的改进还可以进行所有系统的binlog 集中化分层订阅。

四、对于实时分析平台

同样可以订阅前端RDBMS操作到后端大数据平台，通过流式计算实现秒级的分析。

后期需要改进的：

roma的订阅能力，对于前端log并发解析的粒度
智能的存储策略动态调整没有被订阅消息的保存时间

作者介绍 Louis Liu(www.vmcd.org)

平安健康互联网数据库架构师。
主要负责核心rdbms、分布式数据库、分布式缓存的架构设计及运维工作。

时间： 2024-10-25 13:14:44

一分钟读懂MySQL分布式消息的处理

一分钟读懂MySQL分布式消息的处理的相关文章

互联网女皇报告精华版：5分钟读懂互联网趋势

《Hack与HHVM权威指南》——1.2.2 读懂报错消息

三分钟读懂TT猫分布式、微服务和集群之路

五分钟读懂SIGIR 2017前沿技术研究成果

2分钟读懂Hadoop和Spark的异同

两分钟读懂企业云，供应商跟你说这些了吗？

2 分钟读懂大数据框架 Hadoop 和 Spark 的异同

一分钟读懂阿里云产品：ECS概述

企业上市前如何运作资本,教你几分钟读懂