分页列表缓存

写这篇文章，我们聊聊分页列表缓存，希望能帮助大家提升缓存技术认知。

1 直接缓存分页列表结果

这是最简单易懂的方案，我们按照不同的分页条件查询出结果后，直接缓存分页结果。

伪代码如下：

复制代码

public List<Product> getPageList(String param,int page,int size) {
String key = "productList:page:" + page + "size:" + size +
"param:" + param ;
List<Product> dataList = cacheUtils.get(key);
if(dataList != null) {
return dataList;
}
dataList = queryFromDataBase(param,page,size);
if(dataList != null) {
cacheUtils.set(key , dataList , Constants.ExpireTime);
}
}

这种方案的优点是工程简单，性能也快，但是有一个明显的缺陷基因：列表缓存的颗粒度非常大。

假如列表中数据发生增删，为了保证数据的一致性，需要修改分页列表缓存。

有两种方式：

1、依靠缓存过期来惰性的实现，但业务场景必须包容；

2、使用 Redis 的 keys 找到该业务的分页缓存，执行删除指令。但 keys 命令对性能影响很大，会导致 Redis 很大的延迟。

生产环境使用 keys 命令比较危险，发生事故的几率高，非常不推荐使用。

2 查询对象ID列表，再缓存每个对象条目

直接缓存分页结果虽然好用，但缓存的颗粒度太大，保证数据一致性比较麻烦。

所以我们的目标是更细粒度的控制缓存 。

我们先查询出商品分页对象ID列表，然后为每一个商品对象创建缓存 , 通过商品ID和商品对象缓存聚合成列表返回给前端。

伪代码如下：

核心流程：

1、从数据库中查询分页 ID 列表

复制代码

// 从数据库中查询分页商品 ID 列表
List<Long> productIdList = queryProductIdListFromDabaBase(
param,
page,
size);

对应的 SQL 类似：

复制代码

SELECT id FROM products
ORDER BY id ASC
LIMIT (page - 1) * size , size

2、批量从缓存中获取商品对象

复制代码

Map<Long, Product> cachedProductMap = cacheUtils.mget(productIdList);

假如我们使用本地缓存，直接一条一条从本地缓存中聚合也极快。

假如我们使用分布式缓存，Redis 天然支持批量查询的命令，比如 mget ，hmget 。

3、组装没有命中的商品ID

复制代码

List<Long> noHitIdList = new ArrayList<>(cachedProductMap.size());
for (Long productId : productIdList) {
if (!cachedProductMap.containsKey(productId)) {
noHitIdList.add(productId);
}
}

因为缓存中可能因为过期或者其他原因导致缓存没有命中的情况，所以我们需要找到哪些商品没有在缓存里。

4、批量从数据库查询未命中的商品信息列表，重新加载到缓存

首先从数据库里批量查询出未命中的商品信息列表，请注意是批量。

复制代码

List<Product> noHitProductList = batchQuery(noHitIdList);

参数是未命中缓存的商品ID列表，组装成对应的 SQL，这样性能更快：

复制代码

SELECT * FROM products WHERE id IN
(1,
2,
3,
4);

然后这些未命中的商品信息存储到缓存里 , 使用 Redis 的 mset 命令。

复制代码

//将没有命中的商品加入到缓存里
Map<Long, Product> noHitProductMap =
noHitProductList.stream()
.collect(
Collectors.toMap(Product::getId, Function.identity())
);
cacheUtils.mset(noHitProductMap);
//将没有命中的商品加入到聚合map里
cachedProductMap.putAll(noHitProductMap);

5、遍历商品ID列表，组装对象列表

复制代码

for (Long productId : productIdList) {
Product product = cachedProductMap.get(productId);
if (product != null) {
result.add(product);
}
}

当前方案里，缓存都有命中的情况下，经过两次网络 IO ，第一次数据库查询 IO ，第二次 Redis 查询 IO , 性能都会比较好。

所有的操作都是批量操作，就算有缓存没有命中的情况，整体速度也较快。

"查询对象ID列表，再缓存每个对象条目 " 这个方案比较灵活，当我们查询对象ID列表，可以不限于数据库，还可以是搜索引擎，Redis 等等。

下图是开源中国的搜索流程：

精髓在于：搜索的分页结果只包含业务对象 ID ，对象的详细资料需要从缓存 + MySQL 中获取。

3 缓存对象ID列表,同时缓存每个对象条目

笔者曾经重构过类似朋友圈的服务，进入班级页面，瀑布流的形式展示班级成员的所有动态。

我们使用推模式将每一条动态 ID 存储在 Redis ZSet 数据结构中。Redis ZSet 是一种类型为有序集合的数据结构，它由多个有序的唯一的字符串元素组成，每个元素都关联着一个浮点数分值。

ZSet 使用的是 member -> score 结构：

member : 成员，也是默认的第二排序维度（ score 相同时，Redis 以 member 的字典序排列）
score : 分值，存储类型是 double

如上图所示：ZSet 存储动态 ID 列表 , member 的值是动态编号 , score 值是创建时间。

通过 ZSet 的 ZREVRANGE 命令就可以实现分页的效果。

ZREVRANGE 是 Redis 中用于有序集合（sorted set）的命令之一，它用于按照成员的分数从大到小返回有序集合中的指定范围的成员。

为了达到分页的效果，传递如下的分页参数：

通过 ZREVRANGE 命令，我们可以查询出动态 ID 列表。

查询出动态 ID 列表后，还需要缓存每个动态对象条目，动态对象包含了详情，评论，点赞，收藏这些功能数据，我们需要为这些数据提供单独做缓存配置。

无论是查询缓存，还是重新写入缓存，为了提升系统性能，批量操作效率更高。

若**缓存对象结构简单，使用 mget 、hmget 命令；若结构复杂，可以考虑使用 pipleline，Lua 脚本模式。**笔者选择的批量方案是 Redis 的 pipleline 功能。

我们再来模拟获取动态分页列表的流程：

使用 ZSet 的 ZREVRANGE 命令，传入分页参数，查询出动态 ID 列表；
传递动态 ID 列表参数，通过 Redis 的 pipleline 功能从缓存中批量获取动态的详情，评论，点赞，收藏这些功能数据，组装成列表。

4 总结

本文介绍了实现分页列表缓存的三种方式：

直接缓存分页列表结果
查询对象ID列表，只缓存每个对象条目
缓存对象ID列表，同时缓存每个对象条目

这三种方式是一层一层递进的，要诀是：细粒度的控制缓存 和批量加载对象。