缓存穿透--一起学习吧之架构

缓存穿透是指查询一个一定不存在的数据,由于缓存是不命中时需要从数据库查询,查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到数据库去查询,进而给数据库带来压力。在高并发场景下,如果某个key被高并发访问且没有被命中,出于对容错性的考虑,系统会尝试从后端数据库中获取数据,这可能导致大量请求直接打到数据库上。而当该key对应的数据库本身就是空的情况下,就会导致数据库中并发的去执行很多不必要的查询操作,从而对数据库造成巨大的冲击和压力。

缓存穿透可能由用户伪造不存在的数据ID并频繁请求接口导致,也可能由黑客攻击引起。这种攻击会导致服务器响应缓慢,影响用户体验。

缓存穿透带来的危害主要有以下几点:

  1. 后端存储负载加大:由于缓存穿透导致大量请求直接穿透缓存层到达后端存储层,后端存储层需要处理这些额外的请求,从而增加了其负载。如果后端存储不具备高并发处理能力,可能会导致其性能下降,甚至宕机。
  2. 系统性能下降:由于大量请求直接打到后端存储层,可能导致系统整体性能下降,响应时间延长,用户体验变差。
  3. 安全风险:缓存穿透可能被恶意用户或黑客利用,通过伪造不存在的数据ID进行频繁请求,从而攻击系统,导致系统瘫痪或数据泄露。

为了解决缓存穿透问题,可以采取以下几种策略:

  1. 主动方案:

    • 增加ID复杂度:通过提高ID的复杂性和难以预测性,减少被恶意用户或黑客利用的可能性。
    • 数据基础格式校验:对客户端发送的请求进行校验,确保数据格式的合法性,避免非法请求穿透到数据库。
    • 加强用户权限校验:对用户的访问权限进行严格的校验,确保只有合法的用户能够访问数据。
    • 热点参数限流:对热点参数进行限流,防止大量请求同时穿透缓存,对数据库造成过大压力。
  2. 被动方案:

    • 缓存空对象:当查询结果为空时,将一个空对象或默认值缓存起来,并设置一个较短的TTL(Time to Live,生存时间)。当再次遇到相同的查询时,可以直接从缓存中返回空对象或默认值,避免再次查询数据库。需要注意的是,这种方式可能会导致缓存中存储大量的无效数据,占用内存空间。
    • 使用布隆过滤器:布隆过滤器是一种空间效率极高的概率型数据结构,它利用位数组和哈希函数来判断一个元素是否在一个集合中。将所有已存在的数据key放入布隆过滤器中,当新的请求到来时,先通过布隆过滤器判断该key是否存在。如果不存在,则直接返回;如果存在,再到缓存和数据库中进行查询。这种方式可以有效减少不必要的数据库查询,提高系统性能。
    • 限制分页数量:对于需要分页查询的场景,可以通过限制最大分页数来减少缓存穿透的风险。例如,可以设置最大分页数为100页,超过该分页数的请求直接返回空值或错误提示。

需要注意的是,以上方案并非绝对完美,需要根据具体的应用场景和需求进行选择和调整。同时,也需要对缓存和数据库进行监控和调优,确保系统的稳定性和性能。

相关推荐
麦客奥德彪8 分钟前
Android Skills
架构·ai编程
candyTong19 分钟前
Claude Code 的 Edit 工具是怎么工作的
javascript·后端·架构
未若君雅裁35 分钟前
MyBatis 一级缓存、二级缓存与清理机制
java·缓存·mybatis
xian_wwq1 小时前
【学习笔记】AGC协调控制系统概述
笔记·学习
沪漂阿龙2 小时前
面试题详解:智能客服 Agent 系统全栈拆解——Rasa Pro、对话管理、意图识别、GraphRAG、Qwen 与 RAG 优化实战
人工智能·架构
憧憬成为java架构高手的小白2 小时前
docker学习笔记(基于b站多个视频学习)【未完结】
笔记·学习
辰海Coding3 小时前
MiniSpring框架学习-完成的 IoC 容器
java·spring boot·学习·架构
189228048613 小时前
NY352固态MT29F32T08GWLBHD6-24QJ:B
大数据·服务器·人工智能·科技·缓存
云边云科技_云网融合3 小时前
企业大模型时代的网络架构五层演进:从连接到智能的范式重构
网络·重构·架构
Yunzenn3 小时前
字节最新研究cola-DLM第 01 章:语言生成的三次范式之争 —— 从 RNN 到 AR 到扩散
架构·github