Redis总结 - 技术栈

一、 Redis实现集群的原理是什么

Redis 集群(Redis cluster)是通过多个 Redis 实例组成的，每个实例存储部分的数据(即每个实例之间的数据是不重复的)。

具体是采用哈希槽(Hash Slot)机制来分配数据，将整个键空间划分为 16384个槽(slots)。每个Redis 实例负责一定范围的哈希槽，数据的 key 经过哈希函数计算后对 16384 取余即可定位到对应的节点。

客户端在发送请求时，会通过集群的任意节点进行连接，如果该节点存储了对应的数据则直接返回，反之该节点会根据请求的键值计算哈希槽并路由到正确的节点。简单来说，集群就是通过多台机器分担单台机器上的压力。

Redis 集群中节点之间的信息如何同步？

Redis 集群内每个节点都会保存集群的完整拓扑信息，包括每个节点的 ID、IP 地址、端口、负责的哈希槽范围等。

节点之间使用 Gossip 协议进行状态交换，以保持集群的一致性和故障检测。每个节点会周期性地发送PING 和 PONG 消息，交换集群信息，使得集群信息得以同步。

Redis集群分片原理

Redis 集群会将数据分散到 16384(2^14)个哈希槽中，集群中的每个节点负责一定范围的哈希槽。在 Redis 集群中，使用 CRC16 哈希算法计算键的哈希槽，以确定该键应存储在哪个节点。

每个节点会拥有一部分的槽位，然后对应的键值会根据其本身的 key，映射到一个哈希槽中，其主要流程如下：

1、根据键值的 key，按照 CRC 16 算法计算一个 16 bit 的值，然后将 16 bit 的值对 16384 进行取余运算，最后得到一个对应的哈希槽编号。

2、根据每个节点分配的哈希槽区间，对应编号的数据落在对应的区间上，就能找到对应的分片实例

Redis 集群中存储 key 示例

第一步：假设我们有一个 Redis 集群，包含三个主节点(Node1、Node2、Node3)，它们分别负责以下哈希槽.

Node1:哈希槽 0-5460
Node2:哈希槽 5461-10922
Node3:哈希槽 10923-16383

现在要存储一个键为 user:1001 的数据。

第二步：计算哈希槽

1、使用 CRC16 哈希算法计算 user:1001 的 CRC16 值。

2、假设计算结果为 12345.

3、然后，计算该值对应的哈希槽！哈希槽 = 12345 % 16384 = 12345。

第三步、确定目标节点

12345 落在 Node3 的负责范围(10923-16383)，因此，会被存储在 Node3 中user:1001

Redis 集群中请求 key 示例（客户端直接连接的并不是对应 key 的节点)，如果客户端连接的是集群的 Node1，但需要访问存储在 Node3 的键 user:1081 ，查询过程如下

1、计算哈希槽：

客户端使用 CRC16 算法计算 user:1001 的哈希值(假设为 12345)

计算哈希槽：12345%16384=12345.

2、查询请求：

因为客户端连接的是集群中的 node1，所以客户端发送查询命令 GET user:1001 到 Node1。

3、Node1 响应：

Node1 检测到请求的键 user:1001 属于 Node3，返回一个 MOVED 错误，指示客户端请求的键在另一个节点上。 MOVED 错误会中返回目标节点的信息(例如，Node3 的IP 和端口)

4、重新连接:

客户端根据返回的目标节点信息，建立与 Node3 的连接。

5、再次发送查询请求:

客户端向 Node3 发送 GET user:1001 。

6、获取结果:

Node3 查询到 user:1001 的值(假设为{"name":"面试鸭"，"age":18})，并返回结果。

为什么 Redis 哈希槽节点的数目是 16384 呢?

1、首先是消息大小的考虑。

正常的心跳包需要带上节点完整配置数据，心跳还是比较频繁的，所以需要考虑数据包的大小，如果使用16384 数据包只要 2k，如果用了 65535 则需要 8k。

2、集群规模的考虑

集群不太可能会扩展超过 1000 个节点，16384 够用且使得每个分片下的槽又不会太少

二、 Redis会出现脑裂问题吗？

脑裂是指在分布式系统中，由于网络分区或其他问题导致系统中的多个节点（特别是主节点）误以为自己是唯一的主节点。这种情况会导致多个主节点同时提供写入服务，从而引起数据不一致。分布式系统就像一个团队在干活，如果发生了脑裂，就好比这个团队突然因为某些原因，比如通信出了问题，分成了几个小团体。

每个小团体都以为自己是整个团队，都在按自己的方式工作，各自为政，对同一件事有不同的决策和做法，就像有的说要这么干，有的说要那么干。这样一来，整个系统就乱套了，数据也可能变得不一致，服务也变得不正常了，这就是分布式系统中的脑裂。

导致脑裂出现原因主要是网络分区。

Redis 中如何避免脑裂问题的发生呢?

这里需要了解两个参数：

1、min-slaves-to-write :设置主节点在至少有指定数量的从节点确认写操作的情况下才执行写操作

2、min-salves-max-lag:设置从节点的最大延迟(以秒为单位)，如果从节点的延迟超过这个值，则该从节点不会被计入 min-slaves-to-write 的计数中

举个例子:当 min-slaves-to-write设置为2，min-slaves-max-lag设置为 10 秒时，主节点只有在至少有 2 个从节点延迟不超过 10 秒的情况下才会接受写操作。

这两个参数就使得发生脑裂的时候，如果某个主节点跟随的从节点数量不够或延迟较大，就无法被写入,这样就能避免脑裂导致的数据不一致。

建议集群部署奇数个节点，例如集群数为5，那么可以设置 min-slaves-to-write为3，min-slaves-max-lag 为 5-10 秒。

🚨重点：脑裂是针对某个分片（某个主节点对应的数据子集）的主从切换混乱，而不是整个集群就一个主节点写入。

换句话说，脑裂是分片级别的主节点冲突。整个集群是多个分片，每个分片都可能独立脑裂。

三、 Redis如何实现分布式锁？

通过 set ex nx 命令 + lua 脚本组合使用。确保多个客户端不会获得同一个资源锁的同时，也保证了安全解锁和意外情况下锁的自动释放。