数据结构:LRUCache

什么是LRUCache

首先我们来看看什么是cache

缓存(Cache)通常用于两个速度不同的介质之间,以提高数据访问的速度和效率。这里有几个典型的应用场景:

  1. 处理器和内存之间: 处理器(CPU)的运算速度远快于从内存中读取数据的速度。因此,在CPU和内存之间会有多级缓存(L1、L2、甚至L3缓存),用来临时存储即将被CPU使用的数据和指令。这样做可以大幅减少CPU等待数据的时间,提高整体计算效率。
  2. 内存和硬盘之间: 内存的访问速度也远快于硬盘(无论是HDD还是SSD)。操作系统会使用一部分内存作为硬盘缓存(有时称为"磁盘缓存"或"缓冲区缓存"),用于临时存储最近访问过的数据和文件。当再次请求这些数据时,可以直接从内存中获得,而不是从较慢的硬盘中读取。
  3. 数据库系统中: 数据库管理系统(DBMS)也会使用缓存技术来提高查询速度和数据处理效率。缓存可以存储经常访问的查询结果、数据库索引等信息,从而加速后续相同或相似查询的处理速度。
  4. 网络请求: 在网络请求中,缓存也是提高数据访问速度的重要技术。例如,Web浏览器会缓存访问过的网页资源(如HTML文件、图片等),当再次访问这些资源时,可以直接从本地缓存读取,而不需要重新从网络下载。

cache的核心作用是作为一组缓冲区来降低不同介质之间的速度差异。

那么问题来了,cache满了怎么办?

显然,满了就需要删除掉旧的,替换进去新的内容。

但是该如何替换呢?也就是替换策略是什么样的呢?

目前,最常用的替换策略就是LRU(Least Recently Used),意思是最近最少使用,也就是当cache满了以后,用新的数据替换最近最少使用的数据。

顾名思义,LRUCache就是采用LRU替换策略的cache。


LRUCache的实现

LRUCache的实现,我们以一道leetcode的题目为例

传送门:leetcode链接


cache需要实现的功能主要有查找和插入。

想要实现LRUCache的功能是很简单的,但是,想要实现高效的LRUCache并不简单。

所谓高效,我们定义为,插入和查找的时间复杂度都达到O(1)


LRUCache的结构(核心)

想要查找和插入的时间复杂度为O(1),很显然想到hash表

但是如何实现LRU策略呢?

这里,我们的方法是使用一个list容器

当一个数据被使用之后,立即提到list的头部
这样,list的尾的数据,就是LRU的,即最近最少使用的。

所以,我们的结构真的是下面的样子吗?

C++ 复制代码
class LRUCache
{
private:
    unordered_map<int,int> _hash;
    list<pair<int,int>> _list;
    int _capacity;
};

来,我们思考一下

当我们要修改一个数据的时候,我们是不是要先找到,才能修改

hash表中查找很简单,但是list中查找需要遍历一遍,时间复杂度是O(N),显然,就违背了我们高效的初衷。

那怎么办呢?

LRU没办法实现高效的设计吗?

前人给出了天才般的设计。

C++ 复制代码
class LRUCache {
private:
    unordered_map<int,list<pair<int,int>>::iterator> _hash;//通过迭代器可以实现
                                                           //链表的O(1)的查找
    list<pair<int,int>> _list;//链表的查找是O(N),直接使用链表不行
    int _capacity;
};

在原来的设计中,hash和list中都存了value,这显然浪费了呀,凭啥要存两次啊,脸大吗?

所以在新的设计中

我们hash表的value不存真正的value,而是存list的迭代器。

这样,list的查找我们就可以借助hash来完成,就将list查找的时间复杂度降到了O(1)

当然这样的设计维护起来肯定是要稍微麻烦一点的,一点修改,就需要两个容器同时维护。


LRUCache的查找

int get(int key) 如果关键字 key 存在于缓存中,则返回关键字的值,否则返回 -1 。

有一处细节需要注意
当我们找到了数据后,代表着这条数据已经使用过,就需要将他提到list的头部,同时hash也要对应修改

其余非常简单,直接看代码即可

C++ 复制代码
int get(int key) 
{
        auto it = _hash.find(key);

        if(it != _hash.end())
        {
            _list.splice(_list.begin(),_list,it->second);
            _hash[key] = _list.begin();
            return (it->second)->second;
        }
        else
            return -1;
}

LRUCache的插入

void put(int key, int value) 如果关键字 key 已经存在,则变更其数据值 value ;如果不存在,则向缓存中插入该组 key-value 。如果插入操作导致关键字数量超过 capacity ,则应该 逐出 最久未使用的关键字。

如果key已经存在,那就直接更新即可,更新完后,提到list的头部。

如果key不存在,那就直接插入即可,

  1. LRUCache满了,尾删,然后头插

  2. LRUCache没满,直接头插

更新list的同时要一起更新hash表

C++ 复制代码
void put(int key, int value) 
{
        auto it = _hash.find(key);

        if(it != _hash.end())//找到了,直接更新即可
        {
            it->second->second = value;
            _list.splice(_list.begin(),_list,it->second);
        }
        else//没找到,要新插入
        {
            if(_list.size() == _capacity)//把最近不使用的元素删除掉
            {
                pair<int,int> back = _list.back();
                _list.pop_back();
                _hash.erase(back.first);
            }
            _list.push_front({key,value});
            _hash[key] = _list.begin();       
        }
}

完整代码

C++ 复制代码
class LRUCache {
private:
    unordered_map<int,list<pair<int,int>>::iterator> _hash;//通过迭代器可以实现
                                                           //链表的O(1)的查找
    list<pair<int,int>> _list;//链表的查找是O(N),直接使用链表不行
    int _capacity;
public:
    LRUCache(int capacity) {
        _capacity = capacity;
    }
    
    int get(int key) {
        auto it = _hash.find(key);

        if(it != _hash.end())
        {
            _list.splice(_list.begin(),_list,it->second);
            _hash[key] = _list.begin();
            return (it->second)->second;
        }
        else
            return -1;
    }
    
    void put(int key, int value) {
        auto it = _hash.find(key);

        if(it != _hash.end())//找到了,直接更新即可
        {
            it->second->second = value;
            _list.splice(_list.begin(),_list,it->second);
        }
        else//没找到,要新插入
        {
            if(_list.size() == _capacity)//把最近不使用的元素删除掉
            {
                pair<int,int> back = _list.back();
                _list.pop_back();
                _hash.erase(back.first);
            }
            _list.push_front({key,value});
            _hash[key] = _list.begin();       
        }
    }
};

/**
 * Your LRUCache object will be instantiated and called as such:
 * LRUCache* obj = new LRUCache(capacity);
 * int param_1 = obj->get(key);
 * obj->put(key,value);
 */
相关推荐
灼华十一2 小时前
算法编程题-排序
数据结构·算法·golang·排序算法
一子二木生三火2 小时前
IO流(C++)
c语言·开发语言·数据结构·c++·青少年编程
先鱼鲨生2 小时前
排序【数据结构】【算法】
数据结构·算法·排序算法
疯狂的代M夫3 小时前
数据结构 【带环链表2】
数据结构·链表
daily_23333 小时前
数据结构——小小二叉树第二幕(二叉树链式结构的实现以及二叉树的遍历)超详细!!!
数据结构·c++
小小白白蛆3 小时前
剑指offer JZ51 数组中的逆序对
数据结构·算法·排序算法
心死翼未伤4 小时前
python从入门到精通:pyspark实战分析
开发语言·数据结构·python·spark·json
码农飞飞5 小时前
详解Rust结构体struct用法
开发语言·数据结构·后端·rust·成员函数·方法·结构体
wang_changyue6 小时前
CSP-X2024解题报告(T3)
数据结构·算法·leetcode
vir026 小时前
木材加工(二分查找)
数据结构·c++·算法