SQL NOT EXISTS理解

什么是NOT EXISTS

通常用来对比两个表,比如要查今日新增的学生数据

其中 NOT EXISTS 可以单独作为一个 WHERE 条件参与查询

复制代码
SELECT *
FROM student t1
WHERE 
 pt = '2026-03-09'
 AND NOT EXISTS (
   SELECT 1
   FROM student t2
   WHERE pt = '2026-03-08'
    AND t2.student_id = t1.student_id
);

NOT EXISTS 与索引

上述SQL执行的次数不会是 student 表行数 ✖ student表行数。有索引的情况下只会执行 student表行数 次

假设 student表行数今日行数为100万 ,昨日行数为98万

场景1:有索引(理想情况)

操作 次数 说明

t1 分区定位 1次 通过 pt 索引直接定位

t1 表扫描 100万次 扫描 t1 的每一行

t2 索引查找 100万次 每行 t1 用 mallId 索引在 t2 中查找

总计 200万次 比暴力扫描快49万倍! ✅

场景2:没有索引(最差情况)

操作 次数 说明

t1 分区定位 1次 通过 pt 索引直接定位

t1 表扫描 100万次 扫描 t1 的每一行

t2 全表扫描 100万 × 98万次 每行 t1 扫描 t2 的所有数据 😱

总计 980亿次 非常慢! ❌

💡 关键优化技术

  1. 分区裁剪(Partition Pruning)
  • WHERE t1.pt = '2026-03-08'
  • 只扫描 2026-03-08 分区
  • 不扫描其他分区
  • 减少数据量
  1. 索引查找(Index Lookup)
  • WHERE t2.mallId = t1.mallId
  • 使用 mallId 索引
  • 不用全表扫描 t2
  • 快速定位
  1. 短路机制(Short-circuit)
  • NOT EXISTS (...)
  • 找到一条匹配就立即停止
  • 不需要扫描所有匹配项
  • 提高效率

可能的执行计划:

复制代码
+----+-------------+-------+-------+---------------+---------+---------+------+------+--------------------------+
| id | select_type | table | type  | possible_keys | key     | key_len | ref  | rows | Extra                    |
+----+-------------+-------+-------+---------------+---------+---------+------+------+--------------------------+
|  1 | SIMPLE      | t1    | range | idx_pt        | idx_pt  | 33      | NULL | 1000 | Using where; Using index |
|  1 | SIMPLE      | t2    | ref   | idx_mallId    | idx_mallId| 8     | t1.mallId | 1   | Using where; Not exists |
+----+-------------+-------+-------+---------------+---------+---------+------+------+--------------------------+

🎯 总结

总共执行次数是多少?

  • 有索引:约200万次;【其中一张表的行数】
  • 无索引:980亿次【笛卡尔积】
相关推荐
woxihuan1234566 小时前
SQL删除数据时存在依赖关系_设置外键级联删除ON DELETE
jvm·数据库·python
东风破1376 小时前
DM8达梦共享存储集群DSC搭建步骤
数据库·学习·dm达梦数据库
雪碧聊技术6 小时前
当数据库字段数大于Java实体类属性数时,MyBatis还能映射成功吗?一文详解
数据库·自动映射·mybatis映射机制·java实体类·宽容映射机制
Jetev6 小时前
如何确定SQL字段是否为空_使用IS NULL与IS NOT NULL
jvm·数据库·python
m0_702036536 小时前
mysql如何处理不走索引的OR查询_使用UNION ALL优化重写
jvm·数据库·python
代钦塔拉7 小时前
Qt4 vs Qt5 带参数信号槽的连接方式详解
开发语言·数据库·qt
2401_846339567 小时前
MySQL在云环境如何选择存储类型_SSD与高性能云盘配置建议
jvm·数据库·python
zhaoyong2228 小时前
SQL如何统计每个用户的首次行为时间_MIN聚合与分组
jvm·数据库·python
2501_901006478 小时前
C#怎么实现配置热更新 C#如何在运行时动态刷新配置文件不需要重启程序【技巧】
jvm·数据库·python
m0_470857648 小时前
HTML怎么创建响应式图片备选方案_HTML srcset与sizes结构【详解】
jvm·数据库·python