SpringBoot高性能清理MySQL历史数据

背景

项目的心跳数据,随着业务的 增长及时间的推移,数据库的数据量越来越庞大,不仅查询性能受到了影响,还消耗过多的数据库空间。为了保证查询的性能,需要控制数据量的大小,与业务商讨,仅保留近60天的数据即可。

清理历史数据需要考虑的地方
  • 1、不能一次性将历史数据删除,消耗时间长,失败风险高,而且还会带来锁的问题
  • 2、查询语句需要索引,不然删除操作也大打折扣
  • 3、根据id范围删除数据(id字段有主键索引)
  • 4、打印一些关键的日志记录一下删除进度及耗时

清理历史数据的主要步骤

说明:项目中引入xxl-job做调度中心,但该篇文章不包含xxl-job的引入及调用,真的有需要,可在评论区回复,可考虑出一篇,建议先从xxl-job官网了解该调度框架的英姿https://www.xuxueli.com/xxl-job

创建craete_time索引

java 复制代码
# 创建creat_time索引 
ALTER TABLE xxx ADD INDEX idx_ctime (create_time);

需要的DTO对象

java 复制代码
@Data
public class MinMaxIdDTO {
    /**
     * 最小Id
     */
    private Long minId;
    /**
     * 最大Id
     */
    private Long maxId;
    /**
     * 总条数
     */
    private Long idCount;
}

编写对应的Mapper接口

java 复制代码
    /**
     * 查询ID范围
     * @param dateTime
     * @return
     */
    MinMaxIdDTO queryIdRange(@Param("dateTime") LocalDateTime dateTime);

    /**
     * 根据ID范围清理数据
     */
    void deleteByIdRange(MinMaxIdDTO minMaxIdDTO);

编写对应的Mapper.xml文件

java 复制代码
<select id="queryIdRange" resultType="com.xxx.xxx.xxx.dto.MinMaxIdDTO">
    SELECT
        MIN(id) AS minId,
        MAX(id) AS maxId,
        COUNT(id) AS idCount
    FROM (
    SELECT id FROM `xxx` WHERE create_time <![CDATA[ <= ]]> #{dateTime} ORDER BY id LIMIT 0,5000
    ) a
</select>


<delete id="deleteByIdRange">
    DELETE FROM `xxx` WHERE id BETWEEN #{minId} AND #{maxId}
</delete>

编写业务逻辑代码

java 复制代码
public void cleanHistoryData() {
    // 当前时间的前两个月
    LocalDateTime before60DateTime = LocalDateTime.now().minusMonths(2);
    // 异步执行
    CompletableFuture.runAsync(() -> {
        try {
            long l = System.currentTimeMillis();
            long total = 0;
            log.info("开始清理xxx表时间[{}]之前的历史数据", before60DateTime);
            do {
                MinMaxIdDTO minMaxIdDTO = xxxMapper.queryIdRange(before60DateTime);
                if (minMaxIdDTO.getIdCount() == 0) {
                    log.info("xxx表已经清理完毕或找不到合适的数据");
                    break;
                }
                total += minMaxIdDTO.getIdCount();
                log.info("xxx表清除ID范围{}-{}的数据", minMaxIdDTO.getMinId(), minMaxIdDTO.getMaxId());
                xxxMapper.deleteByIdRange(minMaxIdDTO);
            } while (true);
            log.info("结束清理xxx表时间[{}]之前的历史数据,共清理:{}条数据,共耗时:{}毫秒", before60DateTime,
                    total, System.currentTimeMillis() - l);
        } catch (Exception e) {
            log.error("清理xxx表历史数据发生异常,停止任务", e);
            throw e;
        }
	// asyncExecutor线程池可加可不加
    }, asyncExecutor);
}

总结

1、添加需要的索引

2、引入xxl-job框架(本篇文章忽略)

3、编写对应的Mapper接口

4、编写对应的Mapper.xml文件

5、编写清理历史数据的逻辑

相关推荐
Omics Pro14 小时前
首个针对生物医药LLM智能体的全流程过程级评测框架
数据库·人工智能·windows·redis·量子计算
要开心吖ZSH14 小时前
MVCC 进阶:快照读 vs 当前读、幻读与 Next-Key Lock
java·数据库·sql·mysql·mvcc
水木流年追梦14 小时前
agent面试必备31- AI Agent 核心进阶:工具路由(Tool Routing)
数据库·人工智能·oracle·面试·职场和发展·embedding
小强库计算机毕业设计14 小时前
源码分享Spring Boot + Vue3 的校园社团管理系统
java·spring boot·后端·计算机毕业设计
格子软件14 小时前
2026年分布式GEO代理流量调度:源码级状态机防重挂实战
java·vue.js·人工智能·spring boot·分布式·vue
xcLeigh15 小时前
KES运维自动化与脚本体系实战
运维·数据库·自动化·脚本·数据迁移·kes
万亿少女的梦16815 小时前
基于Spring Boot的社区管理系统设计与实现
java·spring boot·mysql·vue·系统设计
大气的小蜜蜂15 小时前
领域层的服务
java·前端·数据库
agent89715 小时前
Spring Boot 接口超时治理:从连接池、线程池到熔断限流的完整排查思路
java·spring boot·后端