一致性哈希介绍

一致性哈希(Consistent Hashing)是一种**"让节点扩缩容时,尽可能少地迁移数据"的分布式哈希算法。
1997 年由 MIT 的 Karger 等人提出,现在几乎成了
分布式缓存、负载均衡、分库分表**的标配。


1. 传统哈希的问题

假设有 N 台缓存节点,用 hash(key) % N 决定数据落在哪台机器。

  • 节点宕机或新增 1 台 → N 变化 → 几乎所有 key 重新映射 → 缓存雪崩,数据库瞬间被打爆。

2. 一致性哈希的核心思想

哈希空间 想象成一条首尾相接的 2³² 环形轨道 (0 → 2³²-1 → 0)。

步骤:

  1. 节点入环:对节点 IP/ID 做 hash,得到其在环上的位置。
  2. 数据入环:对 key 做 hash,顺时针找到第一个节点,就是它的归属。
  3. 节点增减:只影响环上相邻的一段弧,其余数据原地不动。

3. 虚拟节点(Virtual Nodes)------解决"倾斜"**

真实节点很少时,环上分布不均,易产生"数据扎堆"。

给每台物理节点生成上百个虚拟节点 (如 node1#1node1#2...),打散在环上,负载方差瞬间下降。


4. 扩缩容示例

  • 初始 3 台节点 A/B/C,key 按顺时针规则落点。
  • 新增节点 D,位于 B→C 之间:
    仅把原本归属 C 的**"B→D"**这段 key 迁给 D,剩余 90%+ 数据不动
  • 节点 B 宕机:
    原来 B→C 之间的 key 顺时针滑到 C,其他区间无感知

5. 代码级直觉(Python 伪代码)

python 复制代码
import hashlib, bisect, collections

ring = []                                      # 有序哈希环
vnode_map = {}                                # 虚拟节点 → 物理节点
VNODE_PER_NODE = 150

def _hash(x):
    return int(hashlib.md5(x.encode()).hexdigest(), 16)

def add_node(node):
    for v in range(VNODE_PER_NODE):
        h = _hash(f"{node}#{v}")
        ring.insert(bisect.bisect_left(ring, h), h)
        vnode_map[h] = node

def get_node(key):
    if not ring: return None
    h = _hash(key)
    pos = bisect.bisect(ring, h) % len(ring)
    return vnode_map[ring[pos]]

增删节点只需 add_node/remove_node,调用端零感知。


6. 一句话总结

一致性哈希 = "把节点和数据放到同一个环上,顺时针找邻居"

节点变化时的数据迁移量从 O(M) 降到 O(M/N)

再加虚拟节点解决倾斜,就成为分布式系统里最优雅的数据分片方案

相关推荐
softshow10261 天前
Ubuntu22.04(ROS2 humble)小车仿真环境搭建
架构
简简单单OnlineZuozuo1 天前
提示架构:设计可靠、确定性的AI系统
人工智能·unity·架构·游戏引擎·基准测试·the stanford ai·儿童
梦帮科技1 天前
第三十四篇:开源社区运营:GitHub Stars增长策略
开发语言·前端·爬虫·python·docker·架构·html
dev1 天前
【flutter】0. 搭建一个多端 flutter 开发环境
flutter·架构·前端框架
zhaokuner1 天前
14-有界上下文-DDD领域驱动设计
java·开发语言·设计模式·架构
无限大61 天前
为什么"DevOps"能提高软件开发效率?——从开发到运维的融合
后端·程序员·架构
Rysxt_1 天前
Flutter多端开发原理架构教程
flutter·架构
狗哥哥1 天前
Vue 3 国际化架构重构:从过度设计到简洁优雅
vue.js·架构
oMcLin1 天前
在RHEL 8系统上如何实现基于Docker的微服务架构,并进行自动化部署?
docker·微服务·架构