一致性哈希介绍

一致性哈希(Consistent Hashing)是一种**"让节点扩缩容时,尽可能少地迁移数据"的分布式哈希算法。
1997 年由 MIT 的 Karger 等人提出,现在几乎成了
分布式缓存、负载均衡、分库分表**的标配。


1. 传统哈希的问题

假设有 N 台缓存节点,用 hash(key) % N 决定数据落在哪台机器。

  • 节点宕机或新增 1 台 → N 变化 → 几乎所有 key 重新映射 → 缓存雪崩,数据库瞬间被打爆。

2. 一致性哈希的核心思想

哈希空间 想象成一条首尾相接的 2³² 环形轨道 (0 → 2³²-1 → 0)。

步骤:

  1. 节点入环:对节点 IP/ID 做 hash,得到其在环上的位置。
  2. 数据入环:对 key 做 hash,顺时针找到第一个节点,就是它的归属。
  3. 节点增减:只影响环上相邻的一段弧,其余数据原地不动。

3. 虚拟节点(Virtual Nodes)------解决"倾斜"**

真实节点很少时,环上分布不均,易产生"数据扎堆"。

给每台物理节点生成上百个虚拟节点 (如 node1#1node1#2...),打散在环上,负载方差瞬间下降。


4. 扩缩容示例

  • 初始 3 台节点 A/B/C,key 按顺时针规则落点。
  • 新增节点 D,位于 B→C 之间:
    仅把原本归属 C 的**"B→D"**这段 key 迁给 D,剩余 90%+ 数据不动
  • 节点 B 宕机:
    原来 B→C 之间的 key 顺时针滑到 C,其他区间无感知

5. 代码级直觉(Python 伪代码)

python 复制代码
import hashlib, bisect, collections

ring = []                                      # 有序哈希环
vnode_map = {}                                # 虚拟节点 → 物理节点
VNODE_PER_NODE = 150

def _hash(x):
    return int(hashlib.md5(x.encode()).hexdigest(), 16)

def add_node(node):
    for v in range(VNODE_PER_NODE):
        h = _hash(f"{node}#{v}")
        ring.insert(bisect.bisect_left(ring, h), h)
        vnode_map[h] = node

def get_node(key):
    if not ring: return None
    h = _hash(key)
    pos = bisect.bisect(ring, h) % len(ring)
    return vnode_map[ring[pos]]

增删节点只需 add_node/remove_node,调用端零感知。


6. 一句话总结

一致性哈希 = "把节点和数据放到同一个环上,顺时针找邻居"

节点变化时的数据迁移量从 O(M) 降到 O(M/N)

再加虚拟节点解决倾斜,就成为分布式系统里最优雅的数据分片方案

相关推荐
Elias不吃糖16 小时前
java开发的三层架构
java·开发语言·架构
AI周红伟16 小时前
周红伟:Sora2模型背后的技术原理与技术架构创新,和Sora2应用代码实操
架构
陌上丨18 小时前
MySQL8.0高可用集群架构实战
数据库·mysql·架构
muddjsv19 小时前
深入浅出 B/S 架构:从原理到实践,解锁 Web 应用开发核心
架构
国科安芯21 小时前
永磁同步电机驱动控制系统中MCU的抗干扰设计
单片机·嵌入式硬件·性能优化·架构·安全性测试
川西胖墩墩21 小时前
钻井平台设备布局图设计方法
人工智能·架构·流程图
独自归家的兔1 天前
系统存储机制深度剖析:从Win11临时文件夹设计看微软存储架构演进
架构
●VON1 天前
Flutter for OpenHarmony:基于原子清空与用户意图防护的 TodoList 批量删除子系统实现
学习·flutter·架构·跨平台·von
molaifeng1 天前
万字长文解析:Redis 8.4 网络 IO 架构深度拆解
网络·redis·架构
SJLoveIT1 天前
【深度复盘】Redis 分布式锁:从 SETNX 到 Redisson 看门狗的架构权衡
redis·分布式·架构