LFU算法 初始频率 动态频率

LFU(Least Frequently Used)算法是一种缓存淘汰策略,其核心思想是根据数据的访问频率来决定淘汰哪些数据。具体来说,

LFU算法认为如果一个数据在过去一段时间内被访问的次数很少,那么它在未来被再次访问的概率也很低。因此,当缓存空间不足时,LFU算法会选择访问频率最低的数据进行淘汰。

在C++中实现LFU算法,通常需要以下几个步骤:

数据结构设计:LFU算法通常需要一个哈希表和一个优先队列。哈希表用于存储每个元素的访问计数,键是元素的标识,值是元素的访问次数。优先队列用于根据访问次数对元素进行排序,以便快速找到访问次数最少的元素。

初始化 :在初始化时,需要设置缓存的容量,并创建一个哈希表和一个优先队列来存储数据和访问计数。

获取数据 :当调用get方法时,如果键存在于缓存中,则返回键的值,并增加该键的访问计数。如果键不存在,则返回-1。

插入数据 :当调用put方法时,如果键已存在,则更新其值并增加访问计数;如果键不存在,则插入新键值对,并检查缓存是否已满。如果已满,则淘汰访问次数最少的元素。

淘汰策略:在淘汰元素时,LFU算法会选择访问次数最少的元素。如果有多个元素具有相同的最小访问次数,则选择最早插入的那个元素进行淘汰。

1 基于初始的频率

  • LRUCache(int capacity) 以正整数作为容量 capacity 初始化 LRU 缓存。
  • int get(int key) 如果关键字 key 存在于缓存中,则返回关键字的值,否则返回 - 1。
  • void put(int key, int value) 如果关键字已经存在,则变更其数据值;如果关键字不存在,则插入该组「关键字 - 值」。
  • 当缓存容量达到上限时,它应该在写入新数据之前删除最久未使用的数据值,从而为新的数据值留出空间。
  • 在 O(1) 时间复杂度内完成这两种操作。

C++写的伪代码如下:

cpp 复制代码
class LFUCache {
private:
	int m_nCapacity; //缓存的容量
	unordered_map<int, list<pair<int, int>>::iterator>  m_Iter;  //链表索引
	list<pair<int, int>>                                m_List;  //(key,value) 链表

public:
	LFUCache(int capacity)
	{
		m_nCapacity = capacity;
		m_Iter.clear();
		m_List.clear();
	}

	int Get(int key)
	{
		unordered_map<int, list<pair<int, int>>::iterator>::iterator iter = m_Iter.find(key);
		if (iter == m_Iter.end())
			return -1;
		UpdateNode(key, m_Iter[key]->second);
		pair<int,int> tail = m_List.back();
		return tail.second;
	}

	void Put(int key, int value)
	{
		if (m_Iter.find(key) != m_Iter.end())
		{
			UpdateNode(key, value);
			return;
		}
		//若容量已满,则移除"最近最少使用的节点"
		if (m_List.size() >= m_nCapacity)
		{
			DelLeastNode(key);
		}
		AddNode(key,value);
	}

private:
	void UpdateNode(int key, int value)
	{
		m_List.erase(m_Iter[key]); //删除原有的pair
		AddNode(key, value);
	}
	void AddNode(int key, int value)
	{
		m_List.push_back(make_pair(key, value));
		list<pair<int, int>>::iterator iter = m_List.end();
		m_Iter[key] = --iter;
	}
	void DelLeastNode(int key)
	{
		int id = m_List.begin()->first;
		m_List.erase(m_List.begin());
		m_Iter.erase(id);
	}

};

2 基于动态的频率

每读一次,该项的热度加1;每写一次,该项的热点也加1;

  • LFUCache(int capacity) - 用数据结构的容量 capacity 初始化对象。

  • int get(int key) - 如果键存在于缓存中,则获取键的值,否则返回 - 1。

  • void put(int key, int value) - 如果键已存在,则变更其值;如果键不存在,请插入键值对。当缓存达到其容量时,

  • 则应该在插入新项之前,使最不经常使用的项无效。在此问题中,当存在平局(即两个或更多个键具有相同使用频率)时,

  • 应该去除 最近最久未使用的键。

  • 「项的使用次数」就是自插入该项以来对其调用 get 和 put 函数的次数之和。使用次数会在对应项被移除后置为 0 。

  • 为了确定最不常使用的键,可以为缓存中的每个键维护一个 使用计数器 。使用计数最小的键是最久未使用的键。

  • 当一个键首次插入到缓存中时,它的使用计数器被设置为 1 (由于 put 操作)。对缓存中的键执行 get 或 put 操作,使用计数器的值将会递增。

C++写的伪代码如下:

cpp 复制代码
class LFUCache {
private:
	int m_nCapacity;  //容量
	int m_nMinFreq;   //最小的使用次数
	unordered_map<int, pair<int, int>>      m_map;      //(key,value,freq) 三元组
	unordered_map<int, list<int>>           m_freqList; //(freq,key)  频次链表
	unordered_map<int, list<int>::iterator> m_lisIter;  //(freq,index) 频次索引器

	LFUCache(int capacity)
	{
		m_nCapacity = capacity;
		m_nMinFreq  = 0;
		m_map.clear();
		m_freqList.clear();
		m_lisIter.clear();
	}

	void IncreaseFreq(int key)
	{
		int oldFreq = m_map[key].second++;

		//在链表里删除旧元素
		m_freqList[oldFreq].erase(m_lisIter[key]);
		//添加元素,并更新次数
		m_freqList[oldFreq + 1].emplace_front(key); //从双端队列的头部加入元素
		m_lisIter[key] = m_freqList[oldFreq + 1].begin();

		if (m_freqList[m_nMinFreq].empty())
		{
			m_nMinFreq = oldFreq + 1;
		}
	}

	void AddNode(int key, int value)
	{
		m_nMinFreq = 1;
		m_map[key] = make_pair(value, m_nMinFreq);
		m_freqList[m_nMinFreq].emplace_front(key);
		m_lisIter[key] = m_freqList[m_nMinFreq].begin();
	}

	int Get(int key)
	{
		if (m_map.find(key) == m_map.end())
			return -1;
		IncreaseFreq(key);
		return m_map[key].first;
	}

	void Put(int key, int value)
	{
		if (m_nCapacity <= 0)
			return;
		//若key存在,则更新value值
		if (m_map.find(key) != m_map.end())
		{
			m_map[key].first = value;
			IncreaseFreq(key);
			return;
		}
		//处理容量已满的情况
		if (m_map.size() >= m_nCapacity)
		{
			int id = m_freqList[m_nMinFreq].back();
			m_freqList[m_nMinFreq].pop_back(); //弹出末尾的元素
			m_lisIter.erase(id); //删除该元素的索引
			m_map.erase(id);     //删除该元素
		}
		//若key不存在,则新建
		AddNode(key, value);
	}

};
相关推荐
tinker在coding13 分钟前
Coding Caprice - Linked-List 1
算法·leetcode
XH华5 小时前
初识C语言之二维数组(下)
c语言·算法
南宫生5 小时前
力扣-图论-17【算法学习day.67】
java·学习·算法·leetcode·图论
不想当程序猿_5 小时前
【蓝桥杯每日一题】求和——前缀和
算法·前缀和·蓝桥杯
落魄君子5 小时前
GA-BP分类-遗传算法(Genetic Algorithm)和反向传播算法(Backpropagation)
算法·分类·数据挖掘
菜鸡中的奋斗鸡→挣扎鸡5 小时前
滑动窗口 + 算法复习
数据结构·算法
Lenyiin6 小时前
第146场双周赛:统计符合条件长度为3的子数组数目、统计异或值为给定值的路径数目、判断网格图能否被切割成块、唯一中间众数子序列 Ⅰ
c++·算法·leetcode·周赛·lenyiin
郭wes代码6 小时前
Cmd命令大全(万字详细版)
python·算法·小程序
scan7246 小时前
LILAC采样算法
人工智能·算法·机器学习
菌菌的快乐生活6 小时前
理解支持向量机
算法·机器学习·支持向量机