Guava Cache淘汰算法

Guava Cache 使用的淘汰算法是 "基于访问顺序的近似 LRU,具体来说是一种分段 LRU" 实现,注意是近似LRU。

Guava Cache 借鉴了 ConcurrentHashMap的分段锁思想,将缓存分成多个 "Segment"(段),每个 Segment 内部维护自己的访问队列,实现独立的 LRU 淘汰。

数据结构设计

每个 Segment 内部维护两个双向链表

java 复制代码
// 简化的数据结构示意
class Segment<K, V> {
    // 基于访问顺序的双向链表(LRU核心)
    @Nullable ReferenceEntry<K, V> accessQueueHead;  头部
    @Nullable ReferenceEntry<K, V> accessQueueTail;  尾部
  
    // 基于写入顺序的双向链表(用于过期策略)
    @Nullable ReferenceEntry<K, V> writeQueueHead;   头部
    @Nullable ReferenceEntry<K, V> writeQueueTail;   尾部
}

访问顺序维护

当缓存项被访问时(读或写),Guava 会将其移动到访问队列的尾部"(MRU 端):

java 复制代码
// 伪代码:记录访问
void recordAccess(ReferenceEntry<K, V> entry) {
    // 从当前位置移除
    evictFromAccessQueue(entry);
    // 添加到尾部(最近使用)
    addToAccessQueue(entry);
}

淘汰发生在写入新数据时,当缓存大小超过限制:

java 复制代码
// 伪代码:淘汰过程
void evictEntries() {
    if (!overMaximumSize()) {
        return; // 未超限,不淘汰
    }
    
    // 从访问队列头部(LRU端)开始淘汰
    ReferenceEntry<K, V> eldest = accessQueueHead;
    while (eldest != null && overMaximumSize()) {
        // 移除最久未使用的条目
        removeEntry(eldest, RemovalCause.SIZE);
        eldest = accessQueueHead; // 移动到下一个
    }
}

为什么是"近似"LRU?

Guava Cache 的 LRU 是近似的,主要原因:

1、并发性能优化:在并发环境下,为了减少锁竞争,访问记录的更新是延迟的:

java 复制代码
// 读操作时并不立即更新队列,而是先记录"可能需要更新"
void get(key) {
    Entry entry = findEntry(key);
    if (entry != null) {
        // 不是立即移动,而是设置标志位
        entry.setAccessTime(System.currentTimeMillis());
        // 实际的队列更新可能批量进行
    }
}

2、分段设计的影响

由于缓存被分成多个 Segment,每个 Segment 独立维护 LRU 队列。淘汰时:

1、优先淘汰访问频率最低的 Segment" 中的条目

2、而不是全局严格的 LRU 顺序

淘汰的过程案例

java 复制代码
初始: [A]
添加B: [A, B]        // A(最久), B(最新)
添加C: [A, B, C]     // A(最久), B, C(最新)
访问A: [B, C, A]     // B(最久), C, A(最新) - A被移到尾部
添加D: [C, A, D]     // 淘汰最久的B,添加D到尾部
相关推荐
逑之9 分钟前
C语言笔记10:sizeof和strlen,指针与数组
c语言·笔记·算法
求梦82013 分钟前
【力扣hot100题】旋转图像(15)
算法·leetcode·职场和发展
C雨后彩虹5 小时前
任务最优调度
java·数据结构·算法·华为·面试
少林码僧6 小时前
2.31 机器学习神器项目实战:如何在真实项目中应用XGBoost等算法
人工智能·python·算法·机器学习·ai·数据挖掘
钱彬 (Qian Bin)6 小时前
项目实践15—全球证件智能识别系统(切换为Qwen3-VL-8B-Instruct图文多模态大模型)
人工智能·算法·机器学习·多模态·全球证件识别
Niuguangshuo7 小时前
EM算法详解:解密“鸡生蛋“的机器学习困局
算法·机器学习·概率论
a3158238067 小时前
Android 大图显示策略优化显示(一)
android·算法·图片加载·大图片
一条大祥脚8 小时前
26.1.9 轮廓线dp 状压最短路 构造
数据结构·c++·算法
鲨莎分不晴8 小时前
反向传播的数学本质:链式法则与动态规划的完美共舞
算法·动态规划
sonadorje8 小时前
逻辑回归中的条件概率
算法·机器学习·逻辑回归