从全表扫描到毫秒响应:政策快报平台的索引优化实战

政策快报平台刚上线那年,政策数据量只有几十万条,查询速度不是问题。随便一个SQL,怎么写都快。

两年后,数据量突破5000万条,问题开始暴露:列表页越来越慢,后台查询经常超时。explain一看,全是全表扫描。

后来的一年多里,我们做了3轮索引优化,把大部分慢查询从秒级降到了毫秒级。今天复盘这3轮优化的思路和具体操作。

3轮索引优化

第一轮:单列索引(解决最基础的查询)

触发问题:某段时间后台反馈"政策列表加载太慢",持续了大约一周,多个用户在工作时间反映同样的问题。当时的查询语句是按发布日期倒序取最新20条,执行计划显示全表扫描。

慢查询语句:

sql

SELECT * FROM policies WHERE status = 'published' ORDER BY publish_date DESC LIMIT 20;

执行时间:2.8秒。

问题原因:publish_date字段没有索引。

解决方案:

sql

复制代码
CREATE INDEX idx_publish_date ON policies(publish_date);

优化后执行时间:35毫秒,降低约98.8%。

经验总结: 排序字段必须有索引,这是最基本的索引规则。但单列索引只能解决单条件排序问题,多条件查询时就不够用了。

第二轮:联合索引(解决组合查询)

触发问题:加了按地区的筛选条件后,查询又变慢了。因为筛选条件组合多,单列索引只能命中一个条件。

慢查询语句:

sql

复制代码
SELECT * FROM policies 
WHERE region = '广东' AND status = 'published' 
ORDER BY publish_date DESC 
LIMIT 20;

执行时间:1.5秒。

问题原因:region有索引,但需要回表取publish_date做排序。

解决方案:

sql

复制代码
CREATE INDEX idx_region_status_publish ON policies(region, status, publish_date);

优化后执行时间:28毫秒。

索引字段顺序的选择:等值条件(region、status)放在前面,范围/排序条件(publish_date)放在后面。这符合"最左前缀"原则,且能覆盖ORDER BY排序,避免filesort。

经验总结: 多条件查询需要联合索引。字段顺序很重要:等值查询放前面,范围查询放后面。

第三轮:覆盖索引(解决"回表"问题)

触发问题:后台列表页需要展示政策ID、标题、发布日期、地区,但索引只覆盖了部分字段,查询需要回表取其他数据,增加了额外的I/O开销。

慢查询语句(含select多个字段):

sql

复制代码
SELECT id, title, region, publish_date, status 
FROM policies 
WHERE region = '广东' AND status = 'published' 
ORDER BY publish_date DESC 
LIMIT 20;

执行时间:原本联合索引已能命中,但需要回表取title字段,耗时约120毫秒(含回表I/O)。

问题原因:查询需要的字段不在索引中,需要回表。

解决方案:

sql

复制代码
CREATE INDEX idx_region_status_publish_cover 
ON policies(region, status, publish_date, id, title);

优化后执行时间:25毫秒(无需回表,全部从索引读取)。

经验总结: 高频查询可以考虑覆盖索引。索引包含了查询需要的所有字段,不需要回表,查询速度最快。但覆盖索引会增加写入成本和存储空间,仅对高频查询使用。

3条索引经验总结

经验一: 先看执行计划再建索引。执行计划(explain)会告诉你查询走了哪个索引、扫描了多少行、有没有回表、有没有filesort------根据这些信息决定建什么索引,而不是凭感觉乱建。

经验二: 联合索引字段顺序有讲究。等值条件放前面,范围/排序条件放后面。顺序错了,索引可能完全用不上。

经验三: 覆盖索引效果好,但不能滥用。覆盖索引能避免回表,显著提升查询速度,但索引本身也占用存储空间,且每次写入都要更新索引。仅在核心高频查询上使用。

结尾

索引优化不是"建了就完事"。数据量在增长,查询模式在变化,索引策略需要持续调整。定期review慢查询日志,发现新的慢查询就优化,保持系统响应速度。

相关推荐
agent8972 小时前
Elasticsearch 慢查询排查:从 Mapping、分片、分页到聚合优化
大数据·elasticsearch·django
今日综合2 小时前
2026精选教务管理系统深度分析:功能差异、收费模式全拆解
大数据·人工智能
thubier(段新建)2 小时前
OWTB 3PL 核心主流程与行业落地方案
大数据·人工智能
YangYang9YangYan2 小时前
2026大数据专业毕业学数据分析的价值
大数据·数据挖掘·数据分析
跨境生态圈2 小时前
2026外贸获客渠道全面洗牌:AI正在重新分配全球流量,你的品牌在答案里吗?
大数据·运维·人工智能·chatgpt
YangYang9YangYan2 小时前
2026大数据专业填报志愿学数据分析的价值
大数据·数据挖掘·数据分析
TTBIGDATA2 小时前
【Ambari Plus】11.Kafka 安装
大数据·hadoop·分布式·kafka·ambari·hdp·ambari plus
星空3 小时前
git指令
大数据·elasticsearch·搜索引擎
李昊哲小课3 小时前
Ubuntu26.04 搭建 Hadoop3.5.0 完全分布式
大数据·hadoop·分布式·ubuntu·hdfs·mapreduce