redis百万级数据量预热方案

一、需求描述

项目中需要查询用户对应的地市信息,这些数据是存储在mysql数据库中,并且数据量是百万级别,查询频率高,所以想将需要查询的字段存储到redis中,来提高查询速度

二、需求分析

对redis数据预热,一般思路就通过mysql将数据查询出来,然后遍历存储到redis中。

注意点:

1、因为数据量大,不要直接将所有数据查询出来然后遍历存储,因为大数据量数据全部缓存在服务器内存中会导致内存溢出报错;
解决方式: 分页读取数据,循环遍历直到最后一页

以下是分页读取和数据存储代码

java 复制代码
int i=0;
while (true){
    String sql =" select userid,CITYCODE from tb_tc_orderuser_bycity limit "+i+",5000";
    List<Tcorderinfo> datalist = new ArrayList<>();
    try {
        datalist = jdbcTemplate.query(sql, Tcorderinfo.class);
        if (datalist!=null && datalist.size() >0){
            i=i+datalist.size();
        }else {
            break;
        }
    } catch (Exception e) {
        logger.error("查询用户的数据失败");
    }
    for (Tcorderinfo one : datalist) {
        stringRedisTemplate.opsForValue().set("userCity:"+one.getUserid(),one.getCitycode());
    }
    logger.info("已存入{}数据",i);
    datalist.clear();
}

上述方式是通过stringRedisTemplate.opsForValue().set方法将数据一条条插入redis中的。

虽然能正常执行了,但是一条条的存储到redis中是相当耗时的,统计了一下,一分钟只能存储500左右的数据量,显然不可行
优化方案

redis中有一个叫管道的概念,简单概括,就是可以数据先存储到管道中,然后一起推到redis缓存中,这样可以大大提高存储效率

java 复制代码
int i=0;
while (true){
    String sql =" select userid,CITYCODE from tb_tc_orderuser_bycity limit "+i+",5000";
    List<Tcorderinfo> datalist = new ArrayList<>();
    try {
        datalist = jdbcTemplate.query(sql, Tcorderinfo.class);
        if (datalist!=null && datalist.size() >0){
            i=i+datalist.size();
        }else {
            break;
        }
    } catch (Exception e) {
        logger.error("查询用户的数据失败");
    }
    for (Tcorderinfo one : datalist) {
        batchStoreStringsUsingConnection(datalist);
    }
    logger.info("已存入{}数据",i);
    datalist.clear();
}
java 复制代码
public void batchStoreStringsUsingConnection(List<Tcorderinfo> datalist) {
        stringRedisTemplate.executePipelined((RedisCallback<Void>) connection -> {
            RedisSerializer<String> stringSerializer = stringRedisTemplate.getStringSerializer();

            for (Tcorderinfo one : datalist) {
                String key = "userCity:"+one.getUserid();
                String value = one.getCitycode();

                connection.set(stringSerializer.serialize(key), stringSerializer.serialize(value));
            }

            return null;
        });
    }

将存储方式改为管道存储,分页大小设置为50000,10秒能执行一次循环,也就是10秒能向redis存储5w数据,十分钟可以存储百万数据量,可实现redis数据预热。

相关推荐
ZFSS8 小时前
Localization Translate API 集成与使用指南
java·服务器·数据库·人工智能·mysql·ai编程
东风破1379 小时前
达梦DMDRS搭建、以及DMDRS双向同步
数据库·oracle·dm达梦数据库
KaMeidebaby10 小时前
卡梅德生物技术快报|抗独特型抗体开发:半抗原检测技术瓶颈拆解,抗独特型抗体开发工程化实践
前端·数据库·人工智能·其他·百度·新浪微博
NiceCloud喜云10 小时前
Claude Files API 深入:从上传、复用到配额管理的工程化指南
android·java·数据库·人工智能·python·json·飞书
A XMan.11 小时前
域名Whois信息查询V2版API接入指南
数据库
heimeiyingwang11 小时前
【架构实战】可观测性体系:从监控到全链路追踪
网络·数据库·架构
网管NO.111 小时前
SQL 日期函数全套精讲!时间格式化、日期加减、年月日提取,做日报周报直接套用
数据库·sql
杨云龙UP11 小时前
Linux 根分区被日志吃满?一次 58G Broker 日志清理实战_2026-05-20
linux·运维·服务器·数据库·hdfs·apache
sdk大全12 小时前
Studio 3T for MongoDB 2025.13.0
数据库·mongodb
码农阿豪12 小时前
平替MongoDB:金仓多模数据库助力电子证照国产化实践
数据库·mongodb