数据结构:LRUCache

什么是LRUCache

首先我们来看看什么是cache

缓存(Cache)通常用于两个速度不同的介质之间,以提高数据访问的速度和效率。这里有几个典型的应用场景:

  1. 处理器和内存之间: 处理器(CPU)的运算速度远快于从内存中读取数据的速度。因此,在CPU和内存之间会有多级缓存(L1、L2、甚至L3缓存),用来临时存储即将被CPU使用的数据和指令。这样做可以大幅减少CPU等待数据的时间,提高整体计算效率。
  2. 内存和硬盘之间: 内存的访问速度也远快于硬盘(无论是HDD还是SSD)。操作系统会使用一部分内存作为硬盘缓存(有时称为"磁盘缓存"或"缓冲区缓存"),用于临时存储最近访问过的数据和文件。当再次请求这些数据时,可以直接从内存中获得,而不是从较慢的硬盘中读取。
  3. 数据库系统中: 数据库管理系统(DBMS)也会使用缓存技术来提高查询速度和数据处理效率。缓存可以存储经常访问的查询结果、数据库索引等信息,从而加速后续相同或相似查询的处理速度。
  4. 网络请求: 在网络请求中,缓存也是提高数据访问速度的重要技术。例如,Web浏览器会缓存访问过的网页资源(如HTML文件、图片等),当再次访问这些资源时,可以直接从本地缓存读取,而不需要重新从网络下载。

cache的核心作用是作为一组缓冲区来降低不同介质之间的速度差异。

那么问题来了,cache满了怎么办?

显然,满了就需要删除掉旧的,替换进去新的内容。

但是该如何替换呢?也就是替换策略是什么样的呢?

目前,最常用的替换策略就是LRU(Least Recently Used),意思是最近最少使用,也就是当cache满了以后,用新的数据替换最近最少使用的数据。

顾名思义,LRUCache就是采用LRU替换策略的cache。


LRUCache的实现

LRUCache的实现,我们以一道leetcode的题目为例

传送门:leetcode链接


cache需要实现的功能主要有查找和插入。

想要实现LRUCache的功能是很简单的,但是,想要实现高效的LRUCache并不简单。

所谓高效,我们定义为,插入和查找的时间复杂度都达到O(1)


LRUCache的结构(核心)

想要查找和插入的时间复杂度为O(1),很显然想到hash表

但是如何实现LRU策略呢?

这里,我们的方法是使用一个list容器

当一个数据被使用之后,立即提到list的头部
这样,list的尾的数据,就是LRU的,即最近最少使用的。

所以,我们的结构真的是下面的样子吗?

C++ 复制代码
class LRUCache
{
private:
    unordered_map<int,int> _hash;
    list<pair<int,int>> _list;
    int _capacity;
};

来,我们思考一下

当我们要修改一个数据的时候,我们是不是要先找到,才能修改

hash表中查找很简单,但是list中查找需要遍历一遍,时间复杂度是O(N),显然,就违背了我们高效的初衷。

那怎么办呢?

LRU没办法实现高效的设计吗?

前人给出了天才般的设计。

C++ 复制代码
class LRUCache {
private:
    unordered_map<int,list<pair<int,int>>::iterator> _hash;//通过迭代器可以实现
                                                           //链表的O(1)的查找
    list<pair<int,int>> _list;//链表的查找是O(N),直接使用链表不行
    int _capacity;
};

在原来的设计中,hash和list中都存了value,这显然浪费了呀,凭啥要存两次啊,脸大吗?

所以在新的设计中

我们hash表的value不存真正的value,而是存list的迭代器。

这样,list的查找我们就可以借助hash来完成,就将list查找的时间复杂度降到了O(1)

当然这样的设计维护起来肯定是要稍微麻烦一点的,一点修改,就需要两个容器同时维护。


LRUCache的查找

int get(int key) 如果关键字 key 存在于缓存中,则返回关键字的值,否则返回 -1 。

有一处细节需要注意
当我们找到了数据后,代表着这条数据已经使用过,就需要将他提到list的头部,同时hash也要对应修改

其余非常简单,直接看代码即可

C++ 复制代码
int get(int key) 
{
        auto it = _hash.find(key);

        if(it != _hash.end())
        {
            _list.splice(_list.begin(),_list,it->second);
            _hash[key] = _list.begin();
            return (it->second)->second;
        }
        else
            return -1;
}

LRUCache的插入

void put(int key, int value) 如果关键字 key 已经存在,则变更其数据值 value ;如果不存在,则向缓存中插入该组 key-value 。如果插入操作导致关键字数量超过 capacity ,则应该 逐出 最久未使用的关键字。

如果key已经存在,那就直接更新即可,更新完后,提到list的头部。

如果key不存在,那就直接插入即可,

  1. LRUCache满了,尾删,然后头插

  2. LRUCache没满,直接头插

更新list的同时要一起更新hash表

C++ 复制代码
void put(int key, int value) 
{
        auto it = _hash.find(key);

        if(it != _hash.end())//找到了,直接更新即可
        {
            it->second->second = value;
            _list.splice(_list.begin(),_list,it->second);
        }
        else//没找到,要新插入
        {
            if(_list.size() == _capacity)//把最近不使用的元素删除掉
            {
                pair<int,int> back = _list.back();
                _list.pop_back();
                _hash.erase(back.first);
            }
            _list.push_front({key,value});
            _hash[key] = _list.begin();       
        }
}

完整代码

C++ 复制代码
class LRUCache {
private:
    unordered_map<int,list<pair<int,int>>::iterator> _hash;//通过迭代器可以实现
                                                           //链表的O(1)的查找
    list<pair<int,int>> _list;//链表的查找是O(N),直接使用链表不行
    int _capacity;
public:
    LRUCache(int capacity) {
        _capacity = capacity;
    }
    
    int get(int key) {
        auto it = _hash.find(key);

        if(it != _hash.end())
        {
            _list.splice(_list.begin(),_list,it->second);
            _hash[key] = _list.begin();
            return (it->second)->second;
        }
        else
            return -1;
    }
    
    void put(int key, int value) {
        auto it = _hash.find(key);

        if(it != _hash.end())//找到了,直接更新即可
        {
            it->second->second = value;
            _list.splice(_list.begin(),_list,it->second);
        }
        else//没找到,要新插入
        {
            if(_list.size() == _capacity)//把最近不使用的元素删除掉
            {
                pair<int,int> back = _list.back();
                _list.pop_back();
                _hash.erase(back.first);
            }
            _list.push_front({key,value});
            _hash[key] = _list.begin();       
        }
    }
};

/**
 * Your LRUCache object will be instantiated and called as such:
 * LRUCache* obj = new LRUCache(capacity);
 * int param_1 = obj->get(key);
 * obj->put(key,value);
 */
相关推荐
ん贤28 分钟前
2023第十四届蓝桥杯大赛软件赛省赛C/C++ 大学 B 组(真题&题解)(C++/Java题解)
java·c语言·数据结构·c++·算法·蓝桥杯
我的sun&shine7 小时前
高级数据结构03RB树
数据结构·b树
_GR10 小时前
2022年蓝桥杯第十三届C&C++大学B组真题及代码
c语言·数据结构·c++·算法·蓝桥杯·动态规划
快来卷java10 小时前
常见集合篇(二)数组、ArrayList与链表:原理、源码及业务场景深度解析
java·数据结构·链表·maven
Stardep11 小时前
算法学习11——滑动窗口——最大连续1的个数
数据结构·c++·学习·算法·leetcode·动态规划·牛客网
rigidwill66612 小时前
LeetCode hot 100—二叉搜索树中第K小的元素
数据结构·c++·算法·leetcode·职场和发展
UP_Continue16 小时前
排序--归并排序
数据结构
飞鼠_16 小时前
详解数据结构之树、二叉树、二叉搜索树详解 C++实现
开发语言·数据结构·c++
丶Darling.16 小时前
26考研 | 王道 |数据结构 | 第二章 线性表
数据结构·考研
学也不会17 小时前
d2025331
java·数据结构·算法