EVAL并发高导致Redis CPU突增是因为其单线程执行Lua脚本,大量请求串行等待而非算力瓶颈;常见表现为CPU使用率高但延迟不明显、evicted_keys上升;根本原因包括全量KEYS扫描、未预热EVALSHA、大结果返回及纯计算循环。为什么 EVAL 并发高会导致 Redis CPU 突增Redis 是单线程执行 Lua 脚本的,EVAL 和 EVALSHA 都会阻塞主线程直到脚本跑完。哪怕脚本只耗时几毫秒,100 个并发进来,就等于排队等 100 × 几毫秒------CPU 不是被算力压垮的,是被「串行等待」拖满的。常见现象:INFO cpu 里 used_cpu_sys 或 used_cpu_user 持续 >80%,但 redis-cli --latency 显示延迟不高;监控看到 instantaneous_ops_per_sec 没爆,但 evicted_keys 或 expired_keys 反而上升(说明其他命令在排队)。脚本里用了 for 循环遍历大集合(比如 redis.call('KEYS', 'user:*'))------这比单纯多请求更伤用 EVAL 发送重复脚本(没预热 EVALSHA),每次都要重解析,额外消耗 CPU脚本返回超大结果(如 return redis.call('LRANGE', 'list:100k', 0, -1)),序列化+网络拷贝也占 CPU怎样让 EVALSHA 真正生效,而不是假装优化EVALSHA 本身不省计算,只省解析。但很多人漏掉关键两步:预加载 + 容错 fallback,结果线上还是走 EVAL 白忙活。启动时用 SCRIPT LOAD 提前加载脚本,拿到 sha1 值缓存到应用层(别每次运行时现场 SCRIPT LOAD)调用 EVALSHA 后必须检查返回是否为 NOAUTH 或 NOSCRIPT 错误,遇到就自动 fallback 到 EVAL 并重新 SCRIPT LOAD集群模式下,SCRIPT LOAD 必须发到对应 slot 的节点,不能随便连一个 proxy 就 load ------ 否则其他节点根本没这个 sha1示例伪代码:sha = cache.get("my_script_sha")<br>if not sha:<br> sha = redis.eval("SCRIPT LOAD", script_content)<br> cache.set("my_script_sha", sha)<br>res = redis.eval("EVALSHA", sha, keys, args)<br>if res == "NOSCRIPT":<br> # 重试逻辑,不是直接 panic</br> sha = redis.eval("SCRIPT LOAD", script_content)<br> res = redis.eval("EVALSHA", sha, keys, args)哪些 Lua 操作最该砍掉,优先级最高不是所有脚本都适合留在 Redis 里。以下三类操作,CPU 开销和风险远大于收益,应第一时间移出: 通义听悟 阿里云通义听悟是聚焦音视频内容的工作学习AI助手,依托大模型,帮助用户记录、整理和分析音视频内容,体验用大模型做音视频笔记、整理会议记录。
相关推荐
掉头发的王富贵12 分钟前
【StarRocks】极限十分钟入门StarRocksNturmoils28 分钟前
WHERE 条件别凭习惯写,常用查询先跑一遍荣码5 小时前
LangGraph多Agent协作:3个Agent干活比1个强,但我踩了4个坑用户83562907805120 小时前
Python 操作 PDF 附件:添加、查看与管理指南Databend21 小时前
在 AWS 中国峰会逛了一天,我在 Databend 展台看到了 Agent 数据基础设施的新思路宇宙之一粟1 天前
乐企版式文件生成平台学测绘的小杨2 天前
CompassFusion:一个从 GNSS 到 GNSS/INS 组合导航的独立工程包ClouGence2 天前
Oracle 数据同步为什么会出现数据不一致?长事务是常被忽略的原因zzzzzz3102 天前
当产品经理说这个很简单:我用Python自动化处理奇葩需求的实战指南雪隐2 天前
个人电脑玩AI-06让5060 Ti给你打工——不光能画画,Qwen3-TTS还能学人说话,连我老板都信了!