[大数据] 从Redis的集群设计中能够得到哪些启发？

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> 从Redis的集群设计中能够得到哪些启发？ -> 正文阅读

[大数据]从Redis的集群设计中能够得到哪些启发？

聊技术，不止于技术

在大型的分布式系统中，我们都会听到集群的概念，比如Redis集群、ES集群等。

那么集群主要的作用是什么呢？

个人看来集群主要做了这几件事，或者说集群的设计主要为了解决如下问题：

（1）可扩展，好的集群设计可以实现近乎线性扩展，即存储和性能随着硬件的增加而线性增长；

（2）高可用，能够在部分节点故障时实现故障转移。

今天让我们一起来看看Redis集群是如何设计来解决可扩展及高可用问题的，从中我们又能得到哪些启发。

Redis集群的可扩展设计

Redis集群引入了hash slot的概念，实际上也就是数据分区，Redis集群总共有16384个hash slot，集群中的每个节点都会负责一部分hash slot。

假如我们集群中有三个节点，那么：

（1）节点A将包含hash slot 0 ~ 5500；

（2）节点B将包含hash slot 5501 ~11000；

（3）节点C将包含hash slot 11001 ~16383。

Redis集群通过计算每个key值的crc16值，然后对16384取模，来获得key对应的hash slot，实现数据写入/读取。

HASH_SLOT = CRC16(key) mod 16384

Redis之所以引入hash slot的概念，其实是为了方便集群的扩缩容，也就是提供了集群的可扩展性。当我们增加或是减少节点的时候，可以以hash slot为粒度来进行数据的迁移。

对于有状态的集群来讲，要想实现可扩展，一定需要数据迁移的功能，数据迁移又涉及到迁移粒度，对于Redis来讲，数据迁移的粒度为hash slot，对于elasticsearch来讲，为shard分区。

Redis集群允许我们动态的增加及删除节点。增加新的节点，我们可以迁移部分hash slot到新节点中，如果要删除节点，我们可以将待删除节点的hash slot迁移到其他节点，待迁移完成便可以删除相应节点。

Redis集群的数据重分区不会对客户端产生影响，整个过程不影响客户端正常操作。

那这是如何做到的呢？

举个例子，假如我们正在把hash slot 3 从A节点迁移到B节点（hash slot的迁移会将该slot中的所有数据都迁移），在这个过程中客户端发起查询的key值在hash slot 3中：

（1）集群中的所有节点还是会将请求指向A节点；

（2）如果A节点中相应的key值还未迁移，则返回查询结果；

（3）如果A节点中相应的key值已经迁移，则A会将客户端查询重定向到B，由B处理并返回查询结果。

在整个迁移过程中不会再在节点A上新创建key，新增的key值在hash slot 3中的，将在节点B中创建。

数据迁移完成后，集群内会通过内部协议更新各个节点对应的hash slot信息，后续相应key的查询都会直接走B了。

Redis集群通过将数据划分为hash slot，并且能够以hash slot为粒度进行数据迁移，从而实现集群了的可扩展性。通过与客户端的配合，也能够实现在集群扩展过程中的请求不中断。

Redis集群的高可用设计

因为Redis本身是有状态的，而对于有状态的应用来讲，高可用的实现方式就是复制。

Redis集群的高可用是通过主从复制来实现的。

假设Redis集群有三个主A、B、C，他们的从节点分别为A1、B1、C1，当主节点A挂掉后，故障切换流程如下（简化流程）：

（1）节点A挂掉，集群将选举A1为新的主节点，然后继续提供服务；

（2）在新的主选举成功之前，部分读写请求会返回失败；

（3）重启节点A，它会作为从节点重新加入集群。

谈到了主从复制，一个无法回避的问题是数据一致性。

性能与一致性之间，我们需要做个取舍。

Redis选择了性能。

Redis集群无法保证强一致性，因为Redis的主从复制采用的是异步的方式。

Redis的数据写入流程如下：

（1）客户端向master B写入数据；

（2） master B返回OK；

（3） master B向自己的从节点B1发送写入数据。

可以看到master B在返回客户端OK的时候，没有等待确认从节点的数据写入。所以虽然master B返回写入成功，但如果它在向从节点发送数据之前挂掉，那么重新选举产生的主节点将丢失该数据。

这其实是在性能与一致性之间的权衡。如果采用同步复制，也就是在确认了从节点的数据写入成功后在返回给用户，那么我们将获得数据一致性，但牺牲了性能。

可以看到，性能与一致性在分布式系统中的取舍，目前来看是一个无法打破的理论性约束。

Redis集群的客户端

集群同样需要客户端的支持。从单节点变成了集群，客户端最基本的支持也得需要支持配置多个节点ip，从而能够将请求发送给集群中各个节点。

Redis客户端更进一步能够缓存hash slot与各个节点间的路由信息，从而能够直接将请求发送给相应的节点，进一步提升性能。

可以看出，完整的集群方案设计，不光光是集群服务端的事，客户端也是需要考虑的一个很重要的地方。两者结合，才能发挥出更好的效果。

写在最后

如今的计算机系统中，集群是越来越常见的概念。

集群的设计主要用来解决如下两个问题：

（1）可扩展；

（2）高可用。

可扩展即存储和性能能够随着硬件的增加而近乎线性增长。

高可用即能够在部分节点故障时实现故障转移。

可扩展需要通过数据迁移来实现，数据迁移又涉及到数据迁移粒度，Redis集群中迁移粒度为hash slot，其他的集群实现中也有类似的数据迁移粒度概念。

对于有状态的系统来讲，高可用只能通过复制来实现。复制又不可避免的会遇到数据一致性与性能之间的权衡。目前理论限制下，只能二选一。

集群的设计不光光是服务端的事情，也需要客户端的支持。二者结合，才能够发挥更好的效果。

今天主要讲解了Redis集群的设计，相信其中的一些设计思想能够对我们有所启发。

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

Go redis操作

Redis面试题

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

加:2021-09-05 11:05:11 更:2021-09-05 11:07:24

360图书馆购物三丰科技阅读网日历万年历 2026年4日历

-2026/4/4 18:47:53-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码