IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> ZooKeeper ZAB协议:崩溃恢复、消息广播 -> 正文阅读

[大数据]ZooKeeper ZAB协议:崩溃恢复、消息广播


ZAB协议

ZAB(ZooKeeper Atomic Broadcast 原子广播) 协议是为分布式协调服务ZooKeeper专门设计的一种支持崩溃恢复的原子广播协议。 在ZooKeeper中,主要依赖ZAB协议来实现分布式数据一致性,基于该协议,ZooKeeper实现了一种主备模式的系统架构来保持集群中各个副本之间的数据一致性。

ZAB协议包括了两种基本的模式,分别是崩溃恢复消息广播

消息广播

为了保证集群中存在过半的机器能够和Leader服务器的数据状态保持一致,ZAB协议中引入了消息广播模式。

在上面我们提到了,ZooKeeper集群中只有Leader服务器能够执行写操作,为了保证集群的数据一致性,我们需要将Leader节点更新的数据同步到Follower与Observer服务器中,所以当Leader服务器接收到客户端发送的写请求后,会自动生成对应的提案并发起一轮消息广播。

消息广播的执行流程如下:

  1. 接受到客户端发送的事务请求,Leader服务器为其生成对应的事务提议。
  2. Leader为每一个Follower和Observer都准备了一个FIFO的队列,并把提议发送到队列上。
  3. 当Follower接收到事务提议后,都会先将其以事务日志的形式写入本地磁盘中,然后再写入成功后反馈给Leader服务器一个ACK。
  4. 当Leader接收到半数以上Follower节点的ACK,它就会认为大部分节点都同意议题,准备开始提交。
  5. Leader向所有节点发送提交事务的Commit请求,完成事务。

消息广播流程

为了防止因为网络等原因导致的Follower、Observer节点处理请求的顺序不同而导致的数据不一致问题,保证消息广播过程中消息接收与发送的顺序性,消息广播中引入了**FIFO队列**和**事务ID**来解决这个问题。
  • 在消息广播的过程中,Leader服务器会为每一个Follower、Observer服务器都各自分配一个单独的队列,然后将需要广播的事务提议放到这些队列中,并根据FIFO策略进行消息发送。由于ZAB由于协议是通过TCP协议来进行网络通信的,这样不仅保证了消息的发送顺序性,也保证了接受顺序性。
  • 在广播事务提议之前,Leader服务器会先给这个提议分配一个全局单调递增的唯一事务ID(ZXID)。为了保证每一个消息严格的因果关系,必须将每一个事务提议按照其ZXID的先后顺序来进行排序与处理。

如果你了解过二阶段提交(2PC)协议,你会发现其实消息广播的过程实际上就是一个简化版本的二阶段提交过程,他将二阶段提交中的中断逻辑删除,Leader服务器不需要等待集群中的全部Follower服务器都响应反馈,只需要得到过半Follower的ACK就开始执行事务的提交。这种简化版的2PC虽然提高了效率,但是无法处理Leader服务器崩溃退出而导致的数据不一致问题,因此ZooKeeper中又添加了崩溃恢复模式来解决这个问题。

崩溃恢复

当Leader服务器出现崩溃退出或机器重启,亦或是集群中不存在半数以上的服务器与Leader服务器保持正常通信时,在重新开始新的一轮原子广播事务操作之前,此时所有节点都会使用崩溃恢复协议来使彼此达到一个一致的状态。

崩溃恢复过程需要确保那些已经在Leader服务器上提交的事务最终被所有的事务提交。

假设一个事务中Leader服务器(server2)上被提交了,并且已经得到了过半Follower服务器的ACK反馈,但是在它将Commit消息发送给所有的Follower机器之前,Leader服务器就挂掉了,如下图:

确保那些已经在Leader服务器上提交的事务最终被所有的事务提交

从上图可以看到,部分的节点收到了commit请求并进行了提交,而有一部分Leader还没来得及发送就已经崩溃了。针对这种情况,崩溃恢复必须要确保该事务最终能够在所有的服务器上都被提交成功,否则将会出现数据不一致的情况。所以在重新选举的时候,必定会选取ZXID最大的节点来确保其保留了最新的事件。

崩溃恢复过程需要确保丢弃那些只在Leader服务器上被提出的事务。

如果Leader服务器在提交了一个事务之后,还没来得及广播发送commit就已经崩溃推出了,从而导致集群中的其他服务器都没有收到这个事务提议。当原先的Leader节点故障恢复后,再次以Follower的角色加入集群后,此时就因为只有它完成了事务提交,而产生了数据不一致的情况,如下图:

确保丢弃那些只在Leader服务器上被提出的事务

针对这种情况,我们需要让server2在故障恢复后能够丢弃这些只在它这个节点上提出的事务,来确保数据一致。

为了能够满足上述的两个要求,所以ZooKeeper让Leader选举算法保证新选举出来的Leader服务器拥有集群中所有机器最高的事务编号(ZXID最大),那么这就肯定能够保证新选举出来的Leader一定具有所有已经提交的提案,此时新的Leader就会将事务日志中尚未提交的消息同步到各个服务器中。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-07-09 17:33:49  更:2021-07-09 17:34:09 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/4 18:27:06-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码