当设计消息队列时我们关心什么

应用消息队列可以对系统进行解耦,流量削峰,在分布式系统设计中,消息队列是重要的组件之一。

在开发中应用过ActiveMQ,kafka等mq,不过对消息队列背后的实现原理关注不多,其实了解消息队列背后的实现特别重要,

比如对一致性等实现的关注,可以帮助我们在开发中避免踩坑,规避问题的出现。这篇文章简单探讨下当设计和实现一个消息队列时,我们需要关心哪些地方。

 

消息队列功能和特性

一个传统意义上的消息队列,需要支持消息的发送,接受和消息暂存的功能。

在实际应用中,对消息队列的要求远不止于此,在不同的业务场景中,需要消息队列提供如顺序消息,消息可靠性,消息持久化等需求。

 

1.即时通信和消息队列

从消息能否会被即时接受和处理的角度,可以把消息传递的方式分为两种。

一种是即时消息通讯,也就是说消息从发送者一端发出后立即就可以达到接收者一端;

另一种方式称为延迟消息通讯,即消息从某一端发出后,首先进入一个容器进行临时存储,当达到某种条件后,再由这个容器发送给另一端。

延迟消息通讯的容器实现就是消息队列。

2.消息队列基础功能

消息队列需要支持消息的发送,消息暂存,和消息的异步消费,

3.消息队列需要支持的特性

除了基本功能以外,消息队列在某些特殊的场景还需要支持事务,消息重试等功能。

  • 消息的顺序
  • 投递可靠性保证
  • 消息持久化
  • 支持不同消息模型
  • 多实例集群功能
  • 分布式环境下的负载均衡

 

消息队列的基础设计

为了实现消息队列的基础功能,即消息的传输,存储和消费,

需要从以下几个维度去进行设计:

  • 通信协议
  • 存储选择
  • 消费关系维护

1.通信协议

消息既是信息的载体,消息发送者需要知道如何构造消息,消息接收者需要知道如何解析消息,它们需要按照一种统一的格式描述消息,这种统一的格式称之为消息协议。没有格式的消息是没有意义的。

传统的通信协议标准有XMPP和AMQP协议等,现在更多的消息队列从性能的角度出发使用自己设计实现的通信协议。

(1)AMQP规范和JMS规范

AMQP 是 Advanced Message Queuing Protocol,即高级消息队列协议。AMQP不是一个具体的消息队列实现,而 是一个标准化的消息中间件协议。目标是让不同语言,不同系统的应用互相通信,并提供一个简单统一的模型和编程接口。 目前主流的ActiveMQ和RabbitMQ都支持AMQP协议。

JMS是Java平台的一部分,是一种应用于异步消息传递的标准API,JMS可以允许不同应用、不同模块之间实现可靠、异步数据通信。

在JMS中,支持两种消息模型,点对点(Point-to-point)和发布-订阅(Publish and subscribe), 这两种模式分别对应于JMS中的两种消息目标(Message Destination):队列及主题(queue/topic)。

(2)Kafka的通信协议

Kafka的Producer、Broker和Consumer之间采用的是一套自行设计的基于TCP层的协议。Kafka的这套协议完全是为了Kafka自身的业务需求而定制的,而非要实现一套类似于Protocol Buffer的通用协议。

2.消息存储

消息队列常常保存在链表结构中,拥有权限的进程可以向消息队列中写入或读取消息。

对于分布式系统,消息存储的选择有以下几种:

  • 内存
  • 本地文件系统
  • 分布式文件系统
  • 关系型数据库
  • NoSQL数据库

从速度上内存显然是最快的,对于允许消息丢失,消息堆积能力要求不高的场景(例如日志),内存会是比较好的选择。关系型数据库则是最简单的实现可靠存储的方案,很适合用在可靠性要求很高,最终一致性的场景(例如交易消息)。

对于不需要100%保证数据完整性的场景,要求性能和消息堆积的场景,hbase也是一个很好的选择,典型的比如 kafka的消息落地可以使用hadoop。

 

3.消费关系维护

消息队列需要支持点对点和发布/订阅模式的消费模型, 消费端的消费进度也需要记录,典型的如消费端重连的处理,参考Kafka对每个Consumer提供一个偏移量的支持。

另外消息队列选择Pull还是Push模型进行实现也非常重要。在消费端,ActiveMQ使用PUSH模型,而Kafka使用PULL模型,两者各有利弊。对于PUSH,broker很难控制数据发送给不同消费者的速度,而PULL可以由消费者自己控制,但是PULL模型可能造成消费者在没有消息的情况下盲等,这种情况下可以通过long polling机制缓解。对于几乎每时每刻都有消息传递的流式系统,使用Pull模型更合适。

 

消息队列高级特性实现

1.消息有序支持

消息队列中消息的有序性直接依赖与存储的选择,并且和存储的分布式部署以及消费端的并发情况密切相关。

消息的有序可以使用存储的顺序性来支持,比如Kafka,在一个partition上是一段连续的存储,可以保证这一段连续的消息有序。

使用Redis可以实现一个简单的消息队列,保证生产端和消费端都是单线程的生产和消费,因为底层数据机构有序,就可以实现消息的有序。

2.投递可靠性支持

消息投递的可靠性涉及到分布式数据一致性的话题,比如如何保证不丢数据,消息的幂等此类的问题。

RabbitMQ的设计是,当从队列当中取出一个消息的时候,RabbitMQ需要应用显式地回馈说已经获取到了该消息。如果一段时间内不回馈,RabbitMQ会将该消息重新分配给另外一个绑定在该队列上的消费者。另一种情况是消费者断开连接,但是获取到的消息没有回馈,则RabbitMQ同样重新分配。

投递的可靠性需要消费端和生产端一些约定的规则进行约束,保证投递的可靠性,肯定会影响性能,需要一些额外的工作来记录消息的状态等。

3.消息确认机制

消息确认机制可以给消息一致性提供支持,包括发送端的确认和消费端的确认,AMQP 协议本身使用的是事务机制进行消息确认,但是事务机制性能较差,并且容易发生阻塞。

Kafka应用的是ACK机制,RabbitMQ也设计了单独的消息确认机制。

4.消息发送和投递方式

消息队列支持不同的投递语义,以Kafka为例,提供三种不同的语义:

  • At most once 消息可能会丢,但绝不会重复传输
  • At least one 消息绝不会丢,但可能会重复传输
  • Exactly once 每条消息肯定会被传输一次且仅传输一次

类似的有阿里巴巴的MQ中间件,发送普通消息有三种实现方式:可靠同步发送、可靠异步发送、单向(Oneway)发送。

 

  • 可靠同步发送:

  

  • 可靠异步发送:

 

  • 单向(Oneway)发送

 

除了上面列出的这些,在设计消息队列时还要结合自己实际的业务场景,开源的MQ实现常常不能满足需求,

这也是为什么大的互联网公司都有自己的消息队列,并且不止一种,比如阿里巴巴的MetaQ,RocketMQ和notify等。

 

时间: 2024-09-17 04:21:08

当设计消息队列时我们关心什么的相关文章

OSSIM中分布式消息队列应用

 OSSIM中分布式消息队列应用   1. 消息队列处理 企业日志数量正在以指数级形式高速增长,日志数据的具有海量.多样.异构等特点,基于传统的单一节点混合式安装的OSSIM平台(指OSSIM 4.4及以下系统),无法满足海量日志分析要求.在OSSIM 4.4以后的系统中增加了中间件RabbitMQ,可通过RabbitMQ将系统中各组件解除耦合,避免了系统中运行模块的影响(例如MySQL的写操作等),这样设计可实现分布式日志分析平台的要求. OSSIM中使用RabbitMQ后,可以利用消息队列耦

大型网站架构系列:分布式消息队列(一) (转)

以下是消息队列以下的大纲,本文主要介绍消息队列概述,消息队列应用场景和消息中间件示例(电商,日志系统). 本次分享大纲 消息队列概述 消息队列应用场景 消息中间件示例 JMS消息服务(见第二篇:大型网站架构系列:分布式消息队列(二)) 常用消息队列(见第二篇:大型网站架构系列:分布式消息队列(二)) 参考(推荐)资料(见第二篇:大型网站架构系列:分布式消息队列(二)) 本次分享总结(见第二篇:大型网站架构系列:分布式消息队列(二)) 一.消息队列概述 消息队列中间件是分布式系统中重要的组件,主要

大型网站架构系列:分布式消息队列(一)

以下是消息队列以下的大纲,本文主要介绍消息队列概述,消息队列应用场景和消息中间件示例(电商,日志系统). 本次分享大纲 消息队列概述 消息队列应用场景 消息中间件示例 JMS消息服务(见第二篇:大型网站架构系列:分布式消息队列(二)) 常用消息队列(见第二篇:大型网站架构系列:分布式消息队列(二)) 参考(推荐)资料(见第二篇:大型网站架构系列:分布式消息队列(二)) 本次分享总结(见第二篇:大型网站架构系列:分布式消息队列(二)) 一.消息队列概述 消息队列中间件是分布式系统中重要的组件,主要

PHP使用php-resque库配合Redis实现MQ消息队列的教程_php实例

消息队列处理后台任务带来的问题项目中经常会有后台运行任务的需求,比如发送邮件时,因为要连接邮件服务器,往往需要5-10秒甚至更长时间,如果能先给用户一个成功的提示信息,然后在后台慢慢处理发送邮件的操作,显然会有更好的用户体验. 为了实现类似的需求,Web项目中一般的实现方法是使用消息队列(Message Queue),比如MemcacheQ,RabbitMQ等等,都是很著名的产品. 消息队列说白了就是一个最简单的先进先出队列,队列的一个成员就是一段文本.正是因为消息队列实在太简单了,当拿着消息队

PHP使用php-resque库配合Redis实现MQ消息队列的教程

消息队列处理后台任务带来的问题 项目中经常会有后台运行任务的需求,比如发送邮件时,因为要连接邮件服务器,往往需要5-10秒甚至更长时间,如果能先给用户一个成功的提示信息,然后在后台慢慢处理发送邮件的操作,显然会有更好的用户体验. 为了实现类似的需求,Web项目中一般的实现方法是使用消息队列(Message Queue),比如MemcacheQ,RabbitMQ等等,都是很著名的产品. 消息队列说白了就是一个最简单的先进先出队列,队列的一个成员就是一段文本.正是因为消息队列实在太简单了,当拿着消息

System V 消息队列

1.概述 消息队列可以认为是一个消息链表,System V 消息队列使用消息队列标识符标识.具有足够特权的任何进程都可以往一个队列放置一个消息,具有足够特权的任何进程都可以从一个给定队列读出一个消息.在某个进程往一个队列写入消息之前,并不需要另外某个进程在该队列上等待消息的到达.System V 消息队列是随内核持续的,只有在内核重起或者显示删除一个消息队列时,该消息队列才会真正被删除.可以将内核中的某个特定的消息队列画为一个消息链表,如下图所示: 对于系统中没个消息队列,内核维护一个msqid

消息队列和管道的区别(转载)

转载自:http://bbs.chinaunix.net/viewthread.php?tid=265266 作者:beginner-bj 请问管道和消息队列有什么不同  管道通信(PIPE) 管道通信方式的中间介质是文件,通常称这种文件为管道文件.两个进程利用管道文件进行通信时,一个 进程为写进程,另一个进程为读进程.写进程通过写端(发送端)往管道文件中写入信息:读进程通过读 端(接收端)从管道文件中读取信息.两个进程协调不断地进行写.读,便会构成双方通过管道传递信息 的流水线. 利用系统调用

消息队列(Message Queue)基本概念(转)

背景 之前做日志收集模块时,用到flume.另外也有的方案,集成kafaka来提升系统可扩展性,其中涉及到消息队列当时自己并不清楚为什么要使用消息队列.而在我自己提出的原始日志采集方案中不适用消息队列时,有几个基本问题:1. 日志文件上传过程,有个基本的生产者-消费者问题:2. 另外系统崩溃时,数据丢失的处理问题. 今天,几位同事再次谈到消息队列这么个东西,很NB的样子,我也想弄清楚,OK,搞起. 什么是消息队列 消息队列(Message Queue,简称MQ),从字面意思上看,本质是个队列,F

消息队列

        之前在设计消息队列的时候,用的双缓冲,保持一个读线程,一个写线程!! 读线程对read_list进行操作,写线程对write_list进行操作,保持一个队列的完整行就ok!         比如如果想保持write_list一致,就是在插入操作的时候枷锁,在read_list为空的时候需要和write_list进行交换,也需要枷锁!!这样就保证了很少的线程冲突!!!当时的消息队列的双缓冲使用std::list进行设计!         第二个版本的消息队列,进行了很大程度上的改进