一致性哈希介绍

一致性哈希(Consistent Hashing)是一种**"让节点扩缩容时,尽可能少地迁移数据"的分布式哈希算法。
1997 年由 MIT 的 Karger 等人提出,现在几乎成了
分布式缓存、负载均衡、分库分表**的标配。


1. 传统哈希的问题

假设有 N 台缓存节点,用 hash(key) % N 决定数据落在哪台机器。

  • 节点宕机或新增 1 台 → N 变化 → 几乎所有 key 重新映射 → 缓存雪崩,数据库瞬间被打爆。

2. 一致性哈希的核心思想

哈希空间 想象成一条首尾相接的 2³² 环形轨道 (0 → 2³²-1 → 0)。

步骤:

  1. 节点入环:对节点 IP/ID 做 hash,得到其在环上的位置。
  2. 数据入环:对 key 做 hash,顺时针找到第一个节点,就是它的归属。
  3. 节点增减:只影响环上相邻的一段弧,其余数据原地不动。

3. 虚拟节点(Virtual Nodes)------解决"倾斜"**

真实节点很少时,环上分布不均,易产生"数据扎堆"。

给每台物理节点生成上百个虚拟节点 (如 node1#1node1#2...),打散在环上,负载方差瞬间下降。


4. 扩缩容示例

  • 初始 3 台节点 A/B/C,key 按顺时针规则落点。
  • 新增节点 D,位于 B→C 之间:
    仅把原本归属 C 的**"B→D"**这段 key 迁给 D,剩余 90%+ 数据不动
  • 节点 B 宕机:
    原来 B→C 之间的 key 顺时针滑到 C,其他区间无感知

5. 代码级直觉(Python 伪代码)

python 复制代码
import hashlib, bisect, collections

ring = []                                      # 有序哈希环
vnode_map = {}                                # 虚拟节点 → 物理节点
VNODE_PER_NODE = 150

def _hash(x):
    return int(hashlib.md5(x.encode()).hexdigest(), 16)

def add_node(node):
    for v in range(VNODE_PER_NODE):
        h = _hash(f"{node}#{v}")
        ring.insert(bisect.bisect_left(ring, h), h)
        vnode_map[h] = node

def get_node(key):
    if not ring: return None
    h = _hash(key)
    pos = bisect.bisect(ring, h) % len(ring)
    return vnode_map[ring[pos]]

增删节点只需 add_node/remove_node,调用端零感知。


6. 一句话总结

一致性哈希 = "把节点和数据放到同一个环上,顺时针找邻居"

节点变化时的数据迁移量从 O(M) 降到 O(M/N)

再加虚拟节点解决倾斜,就成为分布式系统里最优雅的数据分片方案

相关推荐
狼爷1 天前
日均100万订单!「订单超时自动取消」全方案解析(附并发避坑指南)
架构
roman_日积跬步-终至千里1 天前
如何分析复杂架构:一套真正能落地的方法
java·开发语言·架构
Bode_20021 天前
“端-边-云”协同架构构建难点
人工智能·架构·制造
敖正炀1 天前
高并发系统的降级预案与容错策略
分布式·架构
敖正炀1 天前
稳定性监控与告警体系:SLI/SLO/SLA 实践
分布式·架构
敖正炀1 天前
故障演练与混沌工程:ChaosBlade 到 Litmus
分布式·架构
敖正炀1 天前
全链路压测与容量规划方法论
分布式·架构
敖正炀1 天前
限流算法深度与 Guava/Sentinel 源码:从单机令牌桶到分布式滑动窗口的流量防护体系
分布式·架构
前端小蜗1 天前
转生到 AI 时代,我不再相信一键生成代码的传说
前端·人工智能·架构
_Evan_Yao1 天前
限流的艺术:令牌桶与滑动窗口的博弈,以及我为何在 AI 项目中选择了后者
java·后端·架构