数据结构-LRU缓存(C语言实现)

遇到困难,不必慌张,正是成长的时候,耐心一点!

目录

  • 前言
  • 一、题目介绍
  • 二、实现过程
    • [2.1 实现原理](#2.1 实现原理)
    • [2.2 实现思路](#2.2 实现思路)
      • [2.2.1 双向链表](#2.2.1 双向链表)
      • [2.2.2 散列表](#2.2.2 散列表)
    • [2.3 代码实现](#2.3 代码实现)
      • [2.3.1 结构定义](#2.3.1 结构定义)
      • [2.3.2 双向链表操作实现](#2.3.2 双向链表操作实现)
      • [2.3.3 实现散列表的操作](#2.3.3 实现散列表的操作)
      • [2.3.4 内存释放代码](#2.3.4 内存释放代码)
      • [2.3.5 题目代码实现](#2.3.5 题目代码实现)
  • 总结

前言

本篇文章主要是为了记录实现LRU缓存的方法和思考的过程。

一、题目介绍

请你设计并实现一个满足 LRU (最近最少使用) 缓存 约束的数据结构。

实现 LRUCache 类:

LRUCache(int capacity) 以 正整数 作为容量 capacity 初始化 LRU 缓存

int get(int key) 如果关键字 key 存在于缓存中,则返回关键字的值,否则返回 -1 。

void put(int key, int value) 如果关键字 key 已经存在,则变更其数据值 value ;

如果不存在,则向缓存中插入该组 key-value 。

如果插入操作导致关键字数量超过 capacity ,则应该逐出最久未使用的关键字。

函数 get 和 put 必须以 O(1) 的平均时间复杂度运行。
示例:

输入

["LRUCache", "put", "put", "get", "put", "get", "put", "get", "get", "get"]

[[2], [1, 1], [2, 2], [1], [3, 3], [2], [4, 4], [1], [3], [4]]

输出

[null, null, null, 1, null, -1, null, -1, 3, 4]

解释

LRUCache lRUCache = new LRUCache(2);

lRUCache.put(1, 1); // 缓存是 {1=1}

lRUCache.put(2, 2); // 缓存是 {1=1, 2=2}

lRUCache.get(1); // 返回 1

lRUCache.put(3, 3); // 该操作会使得关键字 2 作废,缓存是 {1=1, 3=3}

lRUCache.get(2); // 返回 -1 (未找到)

lRUCache.put(4, 4); // 该操作会使得关键字 1 作废,缓存是 {4=4, 3=3}

lRUCache.get(1); // 返回 -1 (未找到)

lRUCache.get(3); // 返回 3

lRUCache.get(4); // 返回 4
提示:

1 <= capacity <= 3000

0 <= key <= 10000

0 <= value <= 105

最多调用 2 * 105 次 get 和 put

下面是本人的一些废话,不感兴趣可直接看实现过程

看完题目,看到函数 get 和 put 必须以 O(1) 的平均时间复杂度运行,第一反应是顺序存储的随机存取才可以实现O(1)的时间复杂度,也就是说一定会有一块连续的存储空间存储数据,且大小为capacity。可以把key对应连续的存储空间的下标,但是看到提示里面的key的范围超出了capacity的范围,那如何在让key在[0,capacity]循环呢?脑子直接想到了循环队列的取余法,因为最近用循环队列比较频繁。

但是,经过取余后,还是会造成出现重复的key,该怎们解决呢?突然想到数据结构里面的散列表的碰撞的处理,立马去看关于散列表的介绍,以前没学的东西,现在又冒出来找我了。

看了以后,觉得很神奇,原来取余法是散列函数的一种,并使用频繁的一种。然后又看了关于碰撞的处理,书上介绍两种,第一种叫开地址法,第二种方法叫拉链法。

解决了碰撞问题,那么如何实现最近最少使用,一想到这是关于链表的题目,慢慢想到了循环单链表,头插法实现最近使用,而尾结点一定是最少使用,也就是当缓存空间达到capacity时,需要删除的。但是写了一半代码,发现当访问结点为尾结点时,需要更改尾结点,也就是需要尾结点的前驱。我知道,在单链表中,寻找某个结点前驱时间复杂度是O(n),不符合题意,立马把代码删除。

经过思考,心情里变得比较烦躁,但又不想看题解,因为想着现在正是考验我的时候,想着这道题一定想要教会我什么。尝试让自己变得冷静,不断地翻开数据结构这本书,看到双向链表,哎,这不就是为了解决以O(1)时间复杂度访问某个结点前驱的问题嘛!为什么没有马上想到,是因为平时做的题目都是单链表,双向链表用的太少了...

以上问题都解决了后,刚开始使用开地址法的线性探查法解决碰撞时,发现最后几个测试用例超时了,但是,说明思路是对的,因为线性探访的最坏情况的时间复杂度就是O(n)。

然后改为使用了拉链法,写代码用的时间不多,调试用了很多时间,最终,在不放弃的情况下,终于找到了代码的某处错误。真是太不容易了,因为常规测试用例通过了,在一些复杂的测试用例没通过,又无法一步一步的调试,只能不断地阅读代码,最后发现是在某个很隐秘且常规测试用例很难覆盖的地方,我当场麻了...

所幸,最后还是一步一步的写出来了,还是非常开心的,感觉时间花的太值了!

二、实现过程

2.1 实现原理

实现原理:散列表+双向链表

散列表解决了key重复问题,并解决函数 get 和 put 必须以 O(1) 的平均时间复杂度运行的问题

双向链表解决了最近使用和最少使用的问题,头插法解决最近使用,尾结点解决了最少使用

结构图如图2.1所示:

图2.1 LRU原理图

2.2 实现思路

2.2.1 双向链表

为了方便双向链表的插入和删除操作,可以使用两个辅助结点,一个伪头部和一个伪尾部,实现了每个真实结点都有前驱和后继

图2.2.1 双向链表

2.2.2 散列表

这里主要想介绍解决碰撞问题的拉链法。

设散列表的大小为m,使用拉链法需要建立m条链表,所有散列地址相同的元素放在同一条链表中,如果某个地址中没有存放任何元素,则对应的链表为空链表。设关键码key,根据散列函数h计算出h(key),即可确定第h(key)条链表,然后在该链表进行插入和删除及检索操作。

在本题中,散列函数为取余法,散列表的大小为capacity
h ( k e y ) = k e y   %   c a p a c i t y h(key) = key \,\%\, capacity h(key)=key%capacity

在本题中, h a s h K e y = h ( k e y ) , h a s h V a l u e = h a s h T a b l e [ h a s h K e y ] hashKey = h(key), hashValue = hashTable[hashKey] hashKey=h(key),hashValue=hashTable[hashKey]

如下图所示

图2.2.1 散列表

2.3 代码实现

本篇文章的代码使用C语言实现

2.3.1 结构定义

c 复制代码
//双向链表结点
struct DoubleNode
{
    int key;        //真实的key
    int value;
    struct DoubleNode* llink;       //双向链表的前驱
    struct DoubleNode* rlink;      //双向链表的后继
};

//双向链表类型
//为了方便操作,使用两个伪结点
struct DoubleList
{
    struct DoubleNode* dummyHead;    //双向链表的伪头部
    struct DoubleNode* dummyRear;    //双向链表的伪尾部  
};

//哈希结点的定义
//相同hashKey构成的链表的结点类型
struct HashNode
{
    struct DoubleNode* address;         //指向双向链表的某个结点
    struct HashNode*   next;
};


//使用双向链表
//保存双向链表的头结点
//散列函数       取余法 
//解决地址碰撞   拉链法   
typedef struct
{
    struct DoubleList* doubleList;      //双向链表
    struct HashNode**  hashTable;       //哈希表
    int capacity;                       //缓存空间大小
    int curCapacty;                     //已用空间
} LRUCache;

2.3.2 双向链表操作实现

c 复制代码
//双向链表的操作
//初始化双向链表
void initDoubleList(struct DoubleList* doubleList)
{
    doubleList->dummyHead = (struct DoubleNode*)calloc(1, sizeof(struct DoubleNode));  //初始化双向链表的伪头部
    doubleList->dummyRear = (struct DoubleNode*)calloc(1, sizeof(struct DoubleNode));  //初始化双向链表的伪尾部
    //头和尾互连
    doubleList->dummyHead->rlink = doubleList->dummyRear;                              
    doubleList->dummyRear->llink = doubleList->dummyHead;
}

//将某个结点向双向链表中的第一个结点前执行插入操作
void insertNodeToDoubleListFirst(struct DoubleList* doubleList, struct DoubleNode* node)
{
    node->rlink = doubleList->dummyHead->rlink;
    node->llink = doubleList->dummyHead;
    doubleList->dummyHead->rlink->llink = node;
    doubleList->dummyHead->rlink = node;
}

//将node结点移动到双向链表的第一个结点
void moveNodeToHead(struct DoubleList* doubleList, struct DoubleNode* node)
{   
    //从双向链表中断开
    node->llink->rlink = node->rlink;
    node->rlink->llink = node->llink;
    //将断开的结点重新插入到双向链表的伪头部后
    insertNodeToDoubleListFirst(doubleList, node);
}

2.3.3 实现散列表的操作

c 复制代码
//哈希表的操作
//散列函数
//取余法
int hashFunc(int key, int m)
{
    return key % m;
}

//在hashTable查看对应的hashKey的结点是否指向已存在的key
struct HashNode* getHashNode(struct HashNode** hashTable, int hashKey, int key)
{
    for (struct HashNode* hashValue = hashTable[hashKey]; hashValue != NULL; hashValue = hashValue->next)
    {
        if (hashValue->address->key == key)
        {
            return hashValue;
        }
    }
    return NULL;
}


//往哈希表插入一个HashNode(头插法)
void insertHashNodeToHashTable(struct HashNode** hashTable, int hashKey,struct HashNode* hnode)
{   
    hnode->next = hashTable[hashKey];
    hashTable[hashKey] = hnode; 
}

//从哈希表hashTable[hashKey]->address == dnode的结点断开在之前的链表
struct HashNode* deleteHashNodeFromHashTable(struct HashNode** hashTable, int hashKey, struct DoubleNode* dnode)
{
    struct HashNode* pre_hashNode = hashTable[hashKey];
    struct HashNode* freeNode = NULL;
    if (pre_hashNode->address == dnode)   //如果第一个为删除结点,则将hashTable[hashKey] = pre_hashNode->next
    {
        freeNode = pre_hashNode;
        hashTable[hashKey] = pre_hashNode->next;
    }
    else                                //否则需要寻找address为dnode的前驱结点
    {
        while (pre_hashNode->next->address != dnode)
        {
            pre_hashNode = pre_hashNode->next;
        }
        freeNode = pre_hashNode->next;
        pre_hashNode->next = pre_hashNode->next->next;
    }
    return freeNode;
}

2.3.4 内存释放代码

c 复制代码
//释放hashTable的内存
void hashTableNodeListFree(struct HashNode** hashTable, int capacity)
{  

    for(int hashKey = 0; hashKey < capacity; hashKey++)
    {
       //释放相同hashKey的链表结点内存
       for(struct HashNode* head = hashTable[hashKey]; head != NULL; NULL)
       {
            struct HashNode* freeNode = head;
            head = head->next;
            free(freeNode);
       }
    }
    free(hashTable);
}

//释放双向链表的内存
void doubleNodeListFree(struct DoubleList* doubleList)
{   
    //释放双向链表每一个数据结点空间
    for(struct DoubleNode* head = doubleList->dummyHead; head != NULL; NULL)
    {
        struct DoubleNode* freeNode = head;
        head = head->rlink;
        free(freeNode);
    }
    //释放双向链表的头结点空间
    free(doubleList);
}

2.3.5 题目代码实现

c 复制代码
LRUCache* lRUCacheCreate(int capacity)
{
    LRUCache* obj = (LRUCache*)calloc(1, sizeof(LRUCache));
    obj->capacity = capacity;
    obj->hashTable = (struct HashNode**)calloc(capacity, sizeof(struct HashNode*));
    obj->doubleList = (struct DoubleList*)calloc(1, sizeof(struct DoubleList));  //初始化双向链表
    initDoubleList(obj->doubleList);
    return obj;
}

int lRUCacheGet(LRUCache* obj, int key)
{
    int hashKey = hashFunc(key, obj->capacity);
    struct HashNode* hashValue = getHashNode(obj->hashTable, hashKey, key);
    if(hashValue != NULL)
    {
        moveNodeToHead(obj->doubleList, hashValue->address);
        return hashValue->address->value;
    }
    return -1;
}

void lRUCachePut(LRUCache* obj, int key, int value)
{
    int hashKey = hashFunc(key, obj->capacity);
    //查看当前的hashKey是否存在
    //存在则修改value
    struct HashNode* hashValue = getHashNode(obj->hashTable, hashKey, key);
    if(hashValue != NULL)
    {
        hashValue->address->value = value;
        moveNodeToHead(obj->doubleList, hashValue->address);
        return;
    }

    //当前的key对应的hashKey不存在
    //则将当前的key插入到hashTable中
    if (obj->curCapacty < obj->capacity)   //缓存空间未满  
    {   
        //新建一个双向链表的结点
        struct DoubleNode* dnode = (struct DoubleNode*)calloc(1, sizeof(struct DoubleNode));
        dnode->key = key;
        dnode->value = value;

        //新建一个HashNode
        struct HashNode* hnode = (struct HashNode*)calloc(1, sizeof(struct HashNode));
        hnode->address = dnode;    
        //插入到哈希表
        insertHashNodeToHashTable(obj->hashTable, hashKey, hnode);

        //将dnode插入到双链表的头
        insertNodeToDoubleListFirst(obj->doubleList, dnode);
        obj->curCapacty++;
    }
    else    //缓存空间已满  重用旧的结点->需要切断旧结点以前的联系->重新赋值->新生
    {
        //逐出最近未使用的关键字,即双向链表的尾结点
        struct DoubleNode* dnode = obj->doubleList->dummyRear->llink;
        //重置dnode在hashTable的位置
        struct HashNode* hnode =  deleteHashNodeFromHashTable(obj->hashTable, hashFunc(dnode->key,obj->capacity), dnode);
        //将dnode重新赋值
        dnode->key    = key;
        dnode->value  = value;
        //使用原来的哈希结点,则 hnode->address = dnode 可省略
        insertHashNodeToHashTable(obj->hashTable, hashKey,hnode);
        moveNodeToHead(obj->doubleList, dnode);
    }
}

void lRUCacheFree(LRUCache* obj)
{
    //先释放双向链表的内存
    doubleNodeListFree(obj->doubleList);
    //释放哈希表的内存
    hashTableNodeListFree(obj->hashTable, obj->capacity);
    //释放缓存的头结点内存
    free(obj);
}

总结

看到题目通过那瞬间,真的非常开心,但我知道,代码还有很多大优化的空间,希望能够持续不断地学习!

仅仅用这篇文章记录本人解题的过程,希望对读者有所帮助吧!

相关推荐
yttandb23 分钟前
重生到现代之从零开始的C语言生活》—— 内存的存储
c语言·开发语言·生活
结衣结衣.40 分钟前
python中的函数介绍
java·c语言·开发语言·前端·笔记·python·学习
no_play_no_games1 小时前
「3.3」虫洞 Wormholes
数据结构·c++·算法·图论
五味香1 小时前
C++学习,信号处理
android·c语言·开发语言·c++·学习·算法·信号处理
梓䈑1 小时前
【C语言】自定义类型:结构体
c语言·开发语言·windows
Mr Aokey2 小时前
双向无头非循环链表的简单实现及介绍
数据结构
TANGLONG2222 小时前
【C语言】数据在内存中的存储(万字解析)
java·c语言·c++·python·考研·面试·蓝桥杯
@qike3 小时前
【C++】—— 日期类的实现
c语言·c++·笔记·算法·学习方法
f狐0狸x3 小时前
C语言指针plus版练习
c语言·指针