1. 单体架构


image.png

2. 分布式系统架构


image.png

3. 基于消息中间件的分布式系统架构


image.png

4. 消息中间件概述


1. 什么是消息中间件

  • 利用高效可靠的消息传递机制进行平台无关的数据交流。
  • 并基于数据通信来进行分布式系统的集成。
  • 通过提供消息传递和消息排队模型,它可以在分布式环境下扩展进程间的通信。

2. 消息中间件的应用场景

  • 跨系统数据传递。
  • 高并发流量削峰。
  • 数据异步处理。

3. 常用的消息中间件

  • ActiveMQ
  • RabbitMQ
  • Kafka
  • RocketMQ

5. 消息中间件核心设计


1. 本质

  • 一种具有接收数据、保存数据、发送数据等功能的网络应用。
  • 和一般网络应用程序的区别是它主要负责数据的接收和传递,所以性能一般都高于普通程序。

2. 5 大核心组成

  • 协议
  • 持久化机制
  • 消息分发机制
  • 高可用设计
  • 高可靠设计

6. 协议


1. 协议是什么

  • 协议是计算机之间通信时共同遵守的一组约定,都遵守相同的约定,计算机之间才能相互交流。
  • 是对数据格式和计算机之间交互数据时必须遵守的规则的正式描述。
  • 协议三要素:
    • 语法:即数据与控制信息的结构或格式;
    • 语义:即需要发出何种控制信息,完成何种动作以及做出何种响应;
    • 时序(同步):即事件实现顺序的详细说明。

2. 常见协议

  • HTTP 三要素举例:
    • 语法:http 规定了请求报文和响应报文的具体格式。
    • 语义:客户端主动发起的操作称为请求。
    • 时序:一个请求对应一个响应。
  • 消息中间件常用的协议:
    • OpenWire
    • AMQP
    • MQTT
    • Kafka
    • OpenMessage

3. AMQP

  • AMQP(Advanced Message Queuing Protocol)是高级消息队列协议。
  • 04 年 JPMorgan Chase(摩根大通集团)联合其他公司共同设计。
  • 特性:事务支持、持久化支持,出生金融行业,在可靠性消息处理上具备天然的优势。
  • RabbitMQ、ActiveMQ

4. MQTT

  • MQTT(Message Queuing Telemetry Transport)消息队列遥测传输是 IBM 开发的一个即时通讯协议,物联网系统架构中的重要组成部分。
  • 特性:轻量、结构简单、传输快、没有事务支持、没有持久化相关设计。
  • 适用场景:适用于计算能力有限、低带宽、网络不稳定的场景。
  • RabbitMQ、ActiveMQ

5. OpenMessage

  • OpenMessage 是近一两年由阿里发起,与雅虎、滴滴出行、Streamlio 等公司共同参与创立的分布式消息中间件、流处理领域的应用开发标准。
  • 是国内首个在全球范围内发起的分布式消息领域国际标准。
  • 特性:结构简单、解析快、有事务设计、有持久化设计。
  • Apache、RocketMQ

6. Kafka 协议

  • Kafka 协议是基于 TCP 的二进制协议。消息内部是通过长度来分隔,由一些基本数据类型组成。
  • 特性:结构简单、解析快、无事物设计、有持久化设计。
  • Kafka

7. 持久化


1. 持久化是什么

  • 简单来说就是将数据存入磁盘,而不是存在内存中随服务重启而消失,使数据能够永久保存叫持久化。

image.png

2. 常用持久化方式

ActiveMQ RabbitMQ kafka RocketMQ
文件系统 支持 支持 支持 支持
数据库 支持 / / /

8. 消息分发


1.为什么要有消息分发策略

image.png

image.png

2. 常见的消息中间件分发策略

ActiveMQ RabbitMQ Kafka RocketMQ
发布订阅 支持 支持 支持 支持
轮询分发 支持 支持 支持 支持
公平分发 / 支持 支持 /
重发 支持 支持 / 支持
消息拉取 / 支持 支持 支持

9. 高可用


  • 高可用性是指产品在规定的条件和规定的时刻或时刻区间内处于可执行规定功能状态的能力。
  • 当业务量大时,一台消息中间件服务器可能无法满足需求,所以需要消息中间件能够集群部署,来达到高可用的目的。

1. Master-Slave 主从共享数据的部署方式

image.png

2. Master-Slave 主从同步的部署方式

image.png

3. Broker-Cluster 多主集群同步部署方式

image.png

4. Broker-Cluster 多主集群转发部署方式

image.png

5. Master-Slave 与 Broker-Cluster 结合

image.png

10. 高可靠


  • 高可靠性是指系统可以无故障地持续运行。比如一个系统从来不崩溃、报错,或者崩溃、报错的几率较低,那就是高可靠。
  • 在高并发业务场景下,如果不能保证系统的可靠性,那造成的损失将会非常严重。
  • 保证消息中间件的高可靠性,可以从以下几方面考虑:
    • 消息传输可靠:通过协议来保证系统间数据解析的正确性。
    • 消息存储可靠:通过持久化来保证消息的存储可靠性。

应用场景

  • 服务解耦:服务拆分之后如何通信?强依赖还是弱依赖?
    • 强依赖:服务之间互相调用
    • 弱依赖:就使用 mq 来通知调用
  • 削峰填谷:流量很大的场景下,如何对应用服务进行抗压;削峰填谷的意思是:将高峰和低峰时期的速率做一个均衡,如下游服务处理缓慢,就可以将请求缓存起来,慢速的去消费
  • 异步化缓冲:有些业务逻辑可以异步化操作,只需要做到 *最终一致性 *即可

应用思考点

image.png

  • 生产端可靠性投递:消息发出去了,一定要与数据库保证一个原子性
  • 消费端冥等:生产端要做到可靠性投递,可能会投递多次

以上两点,笔者在这里目前无法理解是个什么意思

另外是 mq 本身的问题:

  • 高可用
  • 低延迟:在高压情况下,消息低延迟
  • 消息可靠性:投递到了消息队列中,如何保证消息不丢失;如磁盘发生损坏,有没有其他的解决方案
  • 堆积能力:在高峰情况下,消息能堆积多少
  • 可扩展性:是否支持天然的无感知扩容

在选型的时候,需要针对您当前的业务需求来考虑,以上的各种点,是否能满足您的业务需求

业界主流的分布式消息队列

image.png

  • Active:阿帕奇旗下的
  • Rabbit:
  • Rocket:阿里巴巴捐给阿帕奇的,支持分布式事务
  • Kafka:搞吞吐量、海量数据的存储

##