Redis内存爆了

一次基于redis做队列消费cannel的binlog导致内存被打爆的场景分析

问题复现流程图:

  • 100万次 SQL 更新 → 100万个 Binlog 事件
  • 100万个事件 → 100万个队列任务(都在同一个业务队列中)
  • 100万个任务 → 100万个监控 Key(Horizon 监控每个任务)

每次 MySQL UPDATE 都会产生一个 Binlog 事件 100万次 UPDATE = 100万个 Binlog 事件

  • Canal 为每个 Binlog 事件创建一个队列任务
php 复制代码
foreach ($binlogEvents as $event) {
    // 每个事件都创建一个任务,塞到同一个队列
    Redis::lpush('ai_vending_horizon', json_encode([
        'id' => generateUUID(),
        'event' => $event,
        'timestamp' => time()
    ]));
}

horizon:laravel框架的queue队列管理服务 支持队列中每个任务的监控和管理

  • 暂停/恢复队列
  • 重试失败任务
  • 清空队列
  • 查看任务详情`
  • 任务超时

等等

Laravel Horizon 本身是个很好的工具,但在事故中:

  • 监控开销过大:每个任务都创建多个监控 Key
  • 缺乏批量处理:没有针对大批量任务的优化
  • 内存管理缺失:没有监控 Key 数量的限制
  • 缺乏redis内存监控告警

Horizon都干了啥?

arduino 复制代码
// 每个任务创建6个监控Key
"ai_phone_horizon:task_001"           // 任务状态Key
"ai_phone_horizon:task_001:metrics"   // 任务指标Key  
"ai_phone_horizon:task_001:runtime"   // 运行时间Key
"ai_phone_horizon:task_001:memory"    // 内存使用Key
"ai_phone_horizon:task_001:failed"    // 失败信息Key
"ai_phone_horizon:task_001:retries"   // 重试次数Key

100万个任务 × 6个监控Key = 600万个监控Key

任务级别的监控的作用

diff 复制代码
// 需要知道每个任务的状态
- 任务是否成功执行?
- 任务执行了多长时间?
- 任务消耗了多少内存?
- 任务失败了吗?
- 任务重试了几次?

监控开销计算

100万个任务 × 每个任务6个监控Key = 600万个 Redis Key

同时业务逻辑消费慢,任务被阻塞,导致业务的任务队列数据数据越来越多,对应的key越来越大,变成一个吃内存的超级大key

在这里想到了golang的Asynq库同样可以实现队列的监控,这个玩意的监控策略和laravel Horizon有啥区别?

asynq: github.com/hibiken/asy...

Asynq 的 Key 结构

arduino 复制代码
// 每个任务创建1个存储Key
"asynq:default:t:task_001" = {任务数据}
"asynq:default:t:task_002" = {任务数据}
// 100万个任务 × 1个存储Key = 100万个存储Key

// 监控Key(固定数量,不随任务数量增长)
"asynq:queues:default"           // 队列统计
"asynq:queues:default:processed" // 已处理数
"asynq:queues:default:failed"    // 失败数
"asynq:stats:processed"          // 总处理数
"asynq:stats:failed"            // 总失败数
// 总共约10-20个固定监控Key

关键差异: Asynq 的优势在于不创建任务级别的监控Key,只创建系统级别的统计Key

优化、优化,调整

相关推荐
雄大2 分钟前
使用 QWebChannel 实现 JS 与 C++ 双向通信(超详细 + 踩坑总结 + Demo)
后端
计算机学姐4 分钟前
基于SpringBoot的汉服租赁系统【颜色尺码套装+个性化推荐算法+数据可视化统计】
java·vue.js·spring boot·后端·mysql·信息可视化·推荐算法
回家路上绕了弯4 分钟前
定期归档历史数据实战指南:从方案设计到落地优化
分布式·后端
+VX:Fegn08955 分钟前
计算机毕业设计|基于springboot + vue建筑材料管理系统(源码+数据库+文档)
数据库·vue.js·spring boot·后端·课程设计
掘金者阿豪6 分钟前
Redis `WRONGTYPE` 错误的原因及解决方法
后端
天天摸鱼的java工程师9 分钟前
线程池深度解析:核心参数 + 拒绝策略 + 动态调整实战
java·后端
小杨同学4916 分钟前
C 语言实战:动态规划求解最长公共子串(连续),附完整实现与优化
后端
Cache技术分享18 分钟前
290. Java Stream API - 从文本文件的行创建 Stream
前端·后端
用户9483570165119 分钟前
拒绝 try-catch:如何设计全局通用的异常拦截体系?
后端
golang学习记22 分钟前
Go 1.22 隐藏彩蛋:cmp.Or —— 让“默认值”写起来像呼吸一样自然!
后端