Thanks to visit codestin.com
Credit goes to github.com

Skip to content

Commit 68291c2

Browse files
committed
docs: update doc description, fix doocs#4
Update doc description Update images Fix doocs#4
1 parent 5709f0f commit 68291c2

14 files changed

+12
-10
lines changed

docs/high-concurrency/how-to-ensure-the-order-of-messages.md

Lines changed: 12 additions & 10 deletions
Original file line numberDiff line numberDiff line change
@@ -5,26 +5,28 @@
55
其实这个也是用 MQ 的时候必问的话题,第一看看你了不了解顺序这个事儿?第二看看你有没有办法保证消息是有顺序的?这是生产系统中常见的问题。
66

77
## 面试题剖析
8-
我举个例子,我们以前做过一个 mysql `binlog` 同步的系统,压力还是非常大的,日同步数据要达到上亿mysql -> mysql,常见的一点在于说大数据 team,就需要同步一个 mysql 库过来,对公司的业务系统的数据做各种复杂的操作。
8+
我举个例子,我们以前做过一个 mysql `binlog` 同步的系统,压力还是非常大的,日同步数据要达到上亿,就是说数据从一个 mysql 库原封不动地同步到另一个 mysql 库里面去(mysql -> mysql)。常见的一点在于说比如大数据 team,就需要同步一个 mysql 库过来,对公司的业务系统的数据做各种复杂的操作。
99

10-
你在 mysql 里增删改一条数据,对应出来了增删改 3 条 `binlog`,接着这三条 `binlog` 发送到 MQ 里面,到消费出来依次执行,起码得保证人家是按照顺序来的吧?不然本来是:增加、修改、删除;你楞是换了顺序给执行成删除、修改、增加,不全错了么。
10+
你在 mysql 里增删改一条数据,对应出来了增删改 3 条 `binlog` 日志,接着这三条 `binlog` 发送到 MQ 里面,再消费出来依次执行,起码得保证人家是按照顺序来的吧?不然本来是:增加、修改、删除;你楞是换了顺序给执行成删除、修改、增加,不全错了么。
1111

1212
本来这个数据同步过来,应该最后这个数据被删除了;结果你搞错了这个顺序,最后这个数据保留下来了,数据同步就出错了。
1313

1414
先看看顺序会错乱的俩场景:
15-
- RabbitMQ:一个 queue,多个 consumer这不明显乱了
15+
- **RabbitMQ**:一个 queue,多个 consumer。比如,生产者向 RabbitMQ 里发送了三条数据,顺序依次是 data1/data2/data3,压入的是 RabbitMQ 的一个内存队列。有三个消费者分别从 MQ 中消费这三条数据中的一条,结果消费者2先执行完操作,把 data2 存入数据库,然后是 data1/data3。这不明显乱了
1616

17-
![rabbitmq-order-1](/img/rabbitmq-order-1.png)
17+
![rabbitmq-order-01](/img/rabbitmq-order-01.png)
1818

19-
- kafka:一个 topic,一个 partition,一个 consumer,内部多线程,这不也明显乱了
19+
- **Kafka**:比如说我们建了一个 topic,有三个 partition。生产者在写的时候,其实可以指定一个 key,比如说我们指定了某个订单 id 作为 key,那么这个订单相关的数据,一定会被分发到同一个 partition 中去,而且这个 partition 中的数据一定是有顺序的。<br>消费者从 partition 中取出来数据的时候,也一定是有顺序的。到这里,顺序还是 ok 的,没有错乱。接着,我们在消费者里可能会搞**多个线程来并发处理消息**。因为如果消费者是单线程消费处理,而处理比较耗时的话,比如处理一条消息耗时几十 ms,那么 1 秒钟只能处理几十条消息,这吞吐量太低了。而多个线程并发跑的话,顺序可能就乱掉了
2020

21-
![kafka-order-1](/img/kafka-order-1.png)
21+
![kafka-order-01](/img/kafka-order-01.png)
2222

2323
### 解决方案
2424
#### RabbitMQ
2525
拆分多个 queue,每个 queue 一个 consumer,就是多一些 queue 而已,确实是麻烦点;或者就一个 queue 但是对应一个 consumer,然后这个 consumer 内部用内存队列做排队,然后分发给底层不同的 worker 来处理。
26-
![rabbitmq-order-2](/img/rabbitmq-order-2.png)
26+
![rabbitmq-order-02](/img/rabbitmq-order-02.png)
2727

28-
#### kafka
29-
一个 topic,一个 partition,一个 consumer,内部单线程消费;写 N 个内存 queue,然后对于 N 个线程,每个线程分别消费一个内存 queue 即可。
30-
![kafka-order-2](/img/kafka-order-2.png)
28+
#### Kafka
29+
- 一个 topic,一个 partition,一个 consumer,内部单线程消费,单线程吞吐量太低,一般不会用这个。
30+
- 写 N 个内存 queue,具有相同 key 的数据都到同一个内存 queue;然后对于 N 个线程,每个线程分别消费一个内存 queue 即可,这样就能保证顺序性。
31+
32+
![kafka-order-02](/img/kafka-order-02.png)
26.3 KB
Loading
-64.4 KB
Binary file not shown.
-98.3 KB
Binary file not shown.
17.9 KB
Loading
20.7 KB
Loading
-28.9 KB
Binary file not shown.
-29 KB
Binary file not shown.
26.4 KB
Loading
38.6 KB
Loading

img/kafka-order-01.png

26.4 KB
Loading

img/kafka-order-02.png

38.6 KB
Loading

img/rabbitmq-order-01.png

17.9 KB
Loading

img/rabbitmq-order-02.png

20.7 KB
Loading

0 commit comments

Comments
 (0)