【Redis】哈希表结构

目录

1、背景

redis中的hashtable(哈希表)是一种高效的键值对存储结构,主要用于实现redis的字典类型,接下来就来讲解一下hashtable(redis版本6.2.18)的底层实现。

2、哈希表

【1】底层结构

hashtable主要包含以下结构体,dict-字典结构:

c 复制代码
typedef struct dict {
    dictType *type; //类型特定函数
    void *privdata; //私有数据
    dictht ht[2]; //哈希表数组(两个,用于rehash)
    long rehashidx; //rehash索引,-1表示不在rehash
    int16_t pauserehash; //如果>0代表rehash暂停(<0表示编码错误)
} dict;

dictht-哈希表结构:

c 复制代码
typedef struct dictht {
    dictEntry **table; //哈希表数组
    unsigned long size; //哈希表大小
    unsigned long sizemask; //哈希表大小掩码,用于计算索引值 
    unsigned long used; //哈希表已有节点数量
} dictht;

dictEntry-哈希表节点,头节点叫哈希桶:

c 复制代码
typedef struct dictEntry {
    void *key; //键
    union {
        void *val;
        uint64_t u64;
        int64_t s64;
        double d;
    } v; //值
    struct dictEntry *next; //指向下个哈希表节点,形成链表
} dictEntry;

【2】哈希冲突

在redis的hashtable实现中,哈希冲突发生在两个或多个不同的键(key)被哈希函数映射到同一个哈希桶(bucket)的情况。这种情况是不可避免的,因为:

1、哈希函数的输出空间(哈希值范围)通常小于输入空间(可能的键数量)

2、即使有完美的哈希函数,在实际应用中内存也是有限的

【3】链地址法

redis采用链地址法来处理哈希冲突,链地址法的实现如下:

1、每个哈希桶实际上是一个单向链表的头指针

2、当发生冲突时,新的键值对会被添加到对应桶的链表中

3、查找时需要遍历链表来找到匹配的键

冲突处理流程如下分为三类,插入操作流程如下:

<1>插入操作流程

c 复制代码
1、计算键的哈希值
2、通过哈希值确定桶位置
3、将新节点插入到链表头部(时间复杂度O(1))

<2>查找操作流程

c 复制代码
1、计算键的哈希值
2、定位到对应的桶
3、遍历链表查找匹配的键

<3>删除操作流程

c 复制代码
1、类似查找过程,找到节点后从链表中移除

【4】传统rehash

链地址法虽然能解决hash冲突,但是当链表越来越长的时候,查询速度也会越来越慢了,毕竟查询时间复杂度为O(n)。所以就需要rehash,rehash是哈希表在扩容或缩容时重新分配所有键值对到新哈希表的过程。传统的一次性rehash方式会一次性将所有键值对从旧表迁移到新表,这会导致:

1、内存占用翻倍(需要同时维护新旧两个表)

2、迁移过程可能阻塞服务(对于大哈希表)

3、响应时间不稳定

【5】渐进式rehash

redis采用渐进式rehash来解决传统rehash问题,核心思想是将rehash过程分摊到多个操作中完成,渐进式rehash的实现机制如下:

<1>使用双表结构:

c 复制代码
typedef struct dict {
  	dictht ht[2]; //两个哈希表,ht[0]是主表,h[1]是rehash目标表
 	long rehashidx; //rehash进度索引,-1表示未进行rehash
} dict;

<2>触发条件满足时:

c 复制代码
1、分配新的哈希表ht[1]
2、设置rehashidx = 0,开始rehash过程

<3>逐步迁移:

c 复制代码
1、每次对字典的增删改查操作时,除了执行指定操作外,还会将ht[0]的rehashidx位置上的所有键值对迁移到ht[1]
2、迁移完成后rehashidx++

<4>完成条件:

c 复制代码
1、当ht[0]的所有键值对都迁移到ht[1]后
2、释放ht[0],将ht[1]设置为新的ht[0]
3、重置rehashidx = -1

渐进性rehash的访问逻辑如下:

<1>查找操作:

c 复制代码
1、现在h[0]查找
2、如果没找到且正在rehash,再到ht[1]查找

<2>插入操作:

c 复制代码
1、新键值对只插入到ht[1]
2、保证ht[0]只减不增

<3>删除/更新操作

c 复制代码
1、同时在两个表中操作

【6】rehash触发条件

redis的哈希表在以下两种情况会触发rehash:

1、扩容条件:当负载因子(哈希表已使用的节点数量/哈希表大小)> 1时,且服务器没有执行RDB快照或AOF重写

2、缩容条件:负载因子 < 0.1时

【7】特性

hashtable的特性如下:

特性 说明
数据结构 采用链式哈希表(数组 + 链表结构)
冲突解决 链地址法
哈希函数 针对不同键类型(字符串、整数等)使用优化后的哈希算法
动态扩容 负载因子 > 1且没执行RDB和AOF
渐进式rehash 扩容/缩容时逐步迁移数据,避免阻塞服务
双哈希表 维护ht[0](主表)和ht[1](rehash目标表)
缩容机制 负载因子 < 0.1
内存效率 通过渐进式rehash减少内存峰值占用
线程安全 依赖redis单线程模型保证原子性操作
时间复杂度 平均O(1)查找/插入/删除(理想情况)
多态支持 通过dictType结构支持不同数据类型的键值操作
相关推荐
张哈大1 小时前
【 Redis | 实战篇 扩展 】
数据库·redis·笔记·缓存
鸠。1 小时前
苍穹外卖05 Redis常用命令&&在Java中操作Redis_Spring Data Redis使用方式&店铺营业状态设置
java·redis·spring
简诚1 小时前
redis在spring boot中异常退出
spring boot·redis
Uranus^3 小时前
深入解析Spring Boot与Redis的缓存集成实践
java·spring boot·redis·缓存·性能优化
一勺菠萝丶4 小时前
Redis实现分布式锁的进阶版:Redisson实战指南
数据库·redis·分布式
好想有猫猫9 小时前
【Redis】List 列表
数据库·c++·redis·分布式·缓存·list
Aurora_NeAr12 小时前
Redis设计与实现——分布式Redis
数据库·redis·分布式
晨晖213 小时前
力扣,哈希表,(滑动窗口),242,(209),438
leetcode·哈希算法·散列表
Bug退退退12314 小时前
分析 redis 的 exists 命令有一个参数和多个参数的区别
数据库·redis·缓存