数据结构:LRUCache

什么是LRUCache

首先我们来看看什么是cache

缓存(Cache)通常用于两个速度不同的介质之间,以提高数据访问的速度和效率。这里有几个典型的应用场景:

  1. 处理器和内存之间: 处理器(CPU)的运算速度远快于从内存中读取数据的速度。因此,在CPU和内存之间会有多级缓存(L1、L2、甚至L3缓存),用来临时存储即将被CPU使用的数据和指令。这样做可以大幅减少CPU等待数据的时间,提高整体计算效率。
  2. 内存和硬盘之间: 内存的访问速度也远快于硬盘(无论是HDD还是SSD)。操作系统会使用一部分内存作为硬盘缓存(有时称为"磁盘缓存"或"缓冲区缓存"),用于临时存储最近访问过的数据和文件。当再次请求这些数据时,可以直接从内存中获得,而不是从较慢的硬盘中读取。
  3. 数据库系统中: 数据库管理系统(DBMS)也会使用缓存技术来提高查询速度和数据处理效率。缓存可以存储经常访问的查询结果、数据库索引等信息,从而加速后续相同或相似查询的处理速度。
  4. 网络请求: 在网络请求中,缓存也是提高数据访问速度的重要技术。例如,Web浏览器会缓存访问过的网页资源(如HTML文件、图片等),当再次访问这些资源时,可以直接从本地缓存读取,而不需要重新从网络下载。

cache的核心作用是作为一组缓冲区来降低不同介质之间的速度差异。

那么问题来了,cache满了怎么办?

显然,满了就需要删除掉旧的,替换进去新的内容。

但是该如何替换呢?也就是替换策略是什么样的呢?

目前,最常用的替换策略就是LRU(Least Recently Used),意思是最近最少使用,也就是当cache满了以后,用新的数据替换最近最少使用的数据。

顾名思义,LRUCache就是采用LRU替换策略的cache。


LRUCache的实现

LRUCache的实现,我们以一道leetcode的题目为例

传送门:leetcode链接


cache需要实现的功能主要有查找和插入。

想要实现LRUCache的功能是很简单的,但是,想要实现高效的LRUCache并不简单。

所谓高效,我们定义为,插入和查找的时间复杂度都达到O(1)


LRUCache的结构(核心)

想要查找和插入的时间复杂度为O(1),很显然想到hash表

但是如何实现LRU策略呢?

这里,我们的方法是使用一个list容器

当一个数据被使用之后,立即提到list的头部
这样,list的尾的数据,就是LRU的,即最近最少使用的。

所以,我们的结构真的是下面的样子吗?

C++ 复制代码
class LRUCache
{
private:
    unordered_map<int,int> _hash;
    list<pair<int,int>> _list;
    int _capacity;
};

来,我们思考一下

当我们要修改一个数据的时候,我们是不是要先找到,才能修改

hash表中查找很简单,但是list中查找需要遍历一遍,时间复杂度是O(N),显然,就违背了我们高效的初衷。

那怎么办呢?

LRU没办法实现高效的设计吗?

前人给出了天才般的设计。

C++ 复制代码
class LRUCache {
private:
    unordered_map<int,list<pair<int,int>>::iterator> _hash;//通过迭代器可以实现
                                                           //链表的O(1)的查找
    list<pair<int,int>> _list;//链表的查找是O(N),直接使用链表不行
    int _capacity;
};

在原来的设计中,hash和list中都存了value,这显然浪费了呀,凭啥要存两次啊,脸大吗?

所以在新的设计中

我们hash表的value不存真正的value,而是存list的迭代器。

这样,list的查找我们就可以借助hash来完成,就将list查找的时间复杂度降到了O(1)

当然这样的设计维护起来肯定是要稍微麻烦一点的,一点修改,就需要两个容器同时维护。


LRUCache的查找

int get(int key) 如果关键字 key 存在于缓存中,则返回关键字的值,否则返回 -1 。

有一处细节需要注意
当我们找到了数据后,代表着这条数据已经使用过,就需要将他提到list的头部,同时hash也要对应修改

其余非常简单,直接看代码即可

C++ 复制代码
int get(int key) 
{
        auto it = _hash.find(key);

        if(it != _hash.end())
        {
            _list.splice(_list.begin(),_list,it->second);
            _hash[key] = _list.begin();
            return (it->second)->second;
        }
        else
            return -1;
}

LRUCache的插入

void put(int key, int value) 如果关键字 key 已经存在,则变更其数据值 value ;如果不存在,则向缓存中插入该组 key-value 。如果插入操作导致关键字数量超过 capacity ,则应该 逐出 最久未使用的关键字。

如果key已经存在,那就直接更新即可,更新完后,提到list的头部。

如果key不存在,那就直接插入即可,

  1. LRUCache满了,尾删,然后头插

  2. LRUCache没满,直接头插

更新list的同时要一起更新hash表

C++ 复制代码
void put(int key, int value) 
{
        auto it = _hash.find(key);

        if(it != _hash.end())//找到了,直接更新即可
        {
            it->second->second = value;
            _list.splice(_list.begin(),_list,it->second);
        }
        else//没找到,要新插入
        {
            if(_list.size() == _capacity)//把最近不使用的元素删除掉
            {
                pair<int,int> back = _list.back();
                _list.pop_back();
                _hash.erase(back.first);
            }
            _list.push_front({key,value});
            _hash[key] = _list.begin();       
        }
}

完整代码

C++ 复制代码
class LRUCache {
private:
    unordered_map<int,list<pair<int,int>>::iterator> _hash;//通过迭代器可以实现
                                                           //链表的O(1)的查找
    list<pair<int,int>> _list;//链表的查找是O(N),直接使用链表不行
    int _capacity;
public:
    LRUCache(int capacity) {
        _capacity = capacity;
    }
    
    int get(int key) {
        auto it = _hash.find(key);

        if(it != _hash.end())
        {
            _list.splice(_list.begin(),_list,it->second);
            _hash[key] = _list.begin();
            return (it->second)->second;
        }
        else
            return -1;
    }
    
    void put(int key, int value) {
        auto it = _hash.find(key);

        if(it != _hash.end())//找到了,直接更新即可
        {
            it->second->second = value;
            _list.splice(_list.begin(),_list,it->second);
        }
        else//没找到,要新插入
        {
            if(_list.size() == _capacity)//把最近不使用的元素删除掉
            {
                pair<int,int> back = _list.back();
                _list.pop_back();
                _hash.erase(back.first);
            }
            _list.push_front({key,value});
            _hash[key] = _list.begin();       
        }
    }
};

/**
 * Your LRUCache object will be instantiated and called as such:
 * LRUCache* obj = new LRUCache(capacity);
 * int param_1 = obj->get(key);
 * obj->put(key,value);
 */
相关推荐
菜鸡中的奋斗鸡→挣扎鸡3 小时前
滑动窗口 + 算法复习
数据结构·算法
axxy20004 小时前
leetcode之hot100---240搜索二维矩阵II(C++)
数据结构·算法
Uu_05kkq5 小时前
【C语言1】C语言常见概念(总结复习篇)——库函数、ASCII码、转义字符
c语言·数据结构·算法
1nullptr7 小时前
三次翻转实现数组元素的旋转
数据结构
TT哇7 小时前
【数据结构练习题】链表与LinkedList
java·数据结构·链表
A懿轩A8 小时前
C/C++ 数据结构与算法【栈和队列】 栈+队列详细解析【日常学习,考研必备】带图+详细代码
c语言·数据结构·c++·学习·考研·算法·栈和队列
1 9 J9 小时前
数据结构 C/C++(实验五:图)
c语言·数据结构·c++·学习·算法
汝即来归9 小时前
选择排序和冒泡排序;MySQL架构
数据结构·算法·排序算法
aaasssdddd9612 小时前
C++的封装(十四):《设计模式》这本书
数据结构·c++·设计模式
芳菲菲其弥章12 小时前
数据结构经典算法总复习(下卷)
数据结构·算法