SQL NOT EXISTS理解

什么是NOT EXISTS

通常用来对比两个表,比如要查今日新增的学生数据

其中 NOT EXISTS 可以单独作为一个 WHERE 条件参与查询

复制代码
SELECT *
FROM student t1
WHERE 
 pt = '2026-03-09'
 AND NOT EXISTS (
   SELECT 1
   FROM student t2
   WHERE pt = '2026-03-08'
    AND t2.student_id = t1.student_id
);

NOT EXISTS 与索引

上述SQL执行的次数不会是 student 表行数 ✖ student表行数。有索引的情况下只会执行 student表行数 次

假设 student表行数今日行数为100万 ,昨日行数为98万

场景1:有索引(理想情况)

操作 次数 说明

t1 分区定位 1次 通过 pt 索引直接定位

t1 表扫描 100万次 扫描 t1 的每一行

t2 索引查找 100万次 每行 t1 用 mallId 索引在 t2 中查找

总计 200万次 比暴力扫描快49万倍! ✅

场景2:没有索引(最差情况)

操作 次数 说明

t1 分区定位 1次 通过 pt 索引直接定位

t1 表扫描 100万次 扫描 t1 的每一行

t2 全表扫描 100万 × 98万次 每行 t1 扫描 t2 的所有数据 😱

总计 980亿次 非常慢! ❌

💡 关键优化技术

  1. 分区裁剪(Partition Pruning)
  • WHERE t1.pt = '2026-03-08'
  • 只扫描 2026-03-08 分区
  • 不扫描其他分区
  • 减少数据量
  1. 索引查找(Index Lookup)
  • WHERE t2.mallId = t1.mallId
  • 使用 mallId 索引
  • 不用全表扫描 t2
  • 快速定位
  1. 短路机制(Short-circuit)
  • NOT EXISTS (...)
  • 找到一条匹配就立即停止
  • 不需要扫描所有匹配项
  • 提高效率

可能的执行计划:

复制代码
+----+-------------+-------+-------+---------------+---------+---------+------+------+--------------------------+
| id | select_type | table | type  | possible_keys | key     | key_len | ref  | rows | Extra                    |
+----+-------------+-------+-------+---------------+---------+---------+------+------+--------------------------+
|  1 | SIMPLE      | t1    | range | idx_pt        | idx_pt  | 33      | NULL | 1000 | Using where; Using index |
|  1 | SIMPLE      | t2    | ref   | idx_mallId    | idx_mallId| 8     | t1.mallId | 1   | Using where; Not exists |
+----+-------------+-------+-------+---------------+---------+---------+------+------+--------------------------+

🎯 总结

总共执行次数是多少?

  • 有索引:约200万次;【其中一张表的行数】
  • 无索引:980亿次【笛卡尔积】
相关推荐
Databend20 小时前
在 AWS 中国峰会逛了一天,我在 Databend 展台看到了 Agent 数据基础设施的新思路
数据库·人工智能·agent
ClouGence2 天前
Oracle 数据同步为什么会出现数据不一致?长事务是常被忽略的原因
数据库·后端·oracle
飞将2 天前
从零实现数据库(2)——HashIndex + IndexManager
数据库
Nturmoils3 天前
订单列表慢查询,先看 WHERE、ORDER BY 和 LIMIT
数据库
渣波3 天前
拒绝 SQL 焦虑!手把手带你用 NestJS + Prisma + DTO 写出“防弹”级后端代码
javascript·数据库·后端
倔强的石头_4 天前
KingbaseES 新版MySQL 兼容版体验:旧版迁移 + 功能实测
数据库
zzzzzz3105 天前
9K Star 炸裂开源!这个 C 语言写的代码知识图谱,把 Linux 内核索引压缩到了 3 分钟
linux·服务器·sql
倔强的石头_7 天前
《Kingbase护城河》——数据库存储空间全景探测与精细化瘦身实战
数据库
云技纵横7 天前
唯一索引 INSERT 死锁实战:5 秒复现交叉插入的 S 锁循环等待
sql·mysql
冬奇Lab8 天前
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite
数据库·人工智能·llm