[大数据] 【kafka专栏】如何保证消息数据的有序性？

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> 【kafka专栏】如何保证消息数据的有序性？ -> 正文阅读

[大数据]【kafka专栏】如何保证消息数据的有序性？

文章目录

一、梳理重要知识点

本文内容主要是说明kafka如何保证消息的有序性？首先我们需要先回顾若干个重要的概念

在这里插入图片描述

kafka生产者缓冲区包含若干个缓冲队列，每一个缓冲队列对应kafka服务端的一个主题的一个分区。
缓冲队列的数据结构是Deque，是一个双端队列，一端放入数据，一端取出数据。

二、如何实现消息的有序性？

其实看了上面的这个图，kafka如何保证消息的有序性就呼之欲出了

在生产者中的双端缓冲队列中，消息是可以保证顺序的，一端进一端出。
每一个双端队列对应kafka服务端的一个主题的分区，所以kafka是可以保证消息数据在一个分区内的有序性。

如果我们希望消息是有序被发送的并且是有序被处理的，需要满足以下场景中的一个：

某个主题只有一个分区，那么这个主题的所有数据"发送"和“消费”都是有序的。这种方式应用场景比较窄，针对数据量比较小的主题可以考虑创建主题时只包含一个分区。
某个主题有多个分区也可以通过自定义分区器，来实现需要有序的消息被发往同一个分区。自定义分区器会在后面的文章中讲解。
某个主题有多个分区，可以在发送消息的时候为消息指定key值，具有相同key值的消息，会被发送到同一个分区。因此具有相同key值的消息数据可以保证有序性。如下所示：生产者发送数据，下文ProducerRecord构造函数的第二个参数是key。

producer.send(
        new ProducerRecord<>(
                "producer_test",   //topic
                "producer_key",   //key
                "noCallback value:" + i)  //value
);