【编程底层原理】亿级数据表查询最后10条记录limit 99999990,10性能为啥特慢,而且数据库都被查宕机了

一、影响因素

查询一个包含1亿条数据的表,并使用 LIMIT 99999990, 10 来获取最后的10条记录,性能慢的原因主要是因为 LIMIT 子句的偏移量(offset)非常大。以下是一些导致性能问题的关键因素

  1. 大量跳过 - LIMIT 子句的前一个数字(99999990)是告诉数据库跳过前99999990条记录,这需要数据库扫描并跳过这些记录才能返回最后的10条。
  2. 全表扫描 - 如果没有有效的索引来支持这种类型的查询,数据库可能需要执行全表扫描,这在数据量大的情况下非常耗时。
  3. 排序开销 - 如果查询中包含 ORDER BY 子句,并且排序的列没有索引,数据库需要对所有记录进行排序,这会增加大量的CPU和内存开销。
  4. 临时表空间 - 排序操作可能需要使用临时表空间,对于大量数据,这可能会消耗大量的磁盘I/O资源。
  5. 锁定和闩锁 - 大量的跳过和扫描可能导致数据库锁定和闩锁,影响并发性能,甚至导致其他查询和更新操作被阻塞。
  6. 资源耗尽 - 如果数据库服务器的硬件资源(如CPU、内存、I/O)有限,这种类型的查询可能会消耗大量资源,导致服务器响应缓慢或宕机。

二、优化措施

为了避免这些问题,可以采取以下优化措施- 使用索引 - 确保有一个索引可以快速定位到接近表末尾的位置。例如,如果有一个时间戳或自增ID列,可以在这个列上创建索引。

  • 优化查询 - 如果可能,重写查询逻辑,避免使用大偏移量。如果需要获取最后10条记录,考虑使用其他逻辑来确定这10条记录的位置。
  • 分批处理 - 如果需要处理大量数据,考虑使用分批查询和处理的方法,每次处理一小部分数据。
  • 资源优化 - 根据服务器的硬件配置优化数据库的配置,如增加内存分配,优化I/O性能等。
  • 分布式查询 - 对于非常大的表,考虑使用分区表或分布式数据库系统,以提高查询性能。
  • 监控和调优 - 使用数据库的性能监控工具来识别瓶颈,并根据需要进行调优。
  • 避免大偏移量 - 如果业务逻辑允许,避免使用带有大偏移量的 LIMIT 子句,因为这通常是一个性能杀手。
    在某些情况下,如果表的结构和数据分布允许,可以通过其他方法来获取最后几条记录,例如,如果有一个自增ID,可以先获取最大ID,然后查询紧随其后的记录。
相关推荐
yolo_Yang20 分钟前
【MySQL】mysqldump使用方法
数据库·mysql·oracle
玩转测试开发30 分钟前
xshell设置跳板机登录内网服务器
运维·服务器·数据库
你不是我我42 分钟前
【Java 开发日记】运行时有出现过什么异常?
数据库·oracle
夏玉林的学习之路2 小时前
正则表达式
数据库·c++·qt·mysql·正则表达式
JIngJaneIL2 小时前
财务管理|基于SprinBoot+vue的个人财务管理系统(源码+数据库+文档)
java·前端·数据库·vue.js·spring boot·毕设·财务管理系统
JIngJaneIL3 小时前
口腔健康系统|口腔医疗|基于java和小程序的口腔健康系统小程序设计与实现(源码+数据库+文档)
java·数据库·spring boot·小程序·论文·毕设·口腔医疗小程序
白帽子黑客罗哥3 小时前
常见Web安全漏洞全解析:从原理到防御的实战指南
数据库·web安全·渗透测试·漏洞利用·权限提升
寒山李白5 小时前
IDEA连接MySQL服务器数据库指南
java·数据库·mysql·intellij-idea·idea·database
亿坊电商8 小时前
PHP后端项目中多环境配置管理:开发、测试、生产的优雅解决方案!
服务器·数据库·php
韩立学长8 小时前
基于Springboot的影视评论网站的设计与实现58py6238(程序、源码、数据库、调试部署方案及开发环境)系统界面展示及获取方式置于文档末尾,可供参考。
数据库·spring boot·后端