SQL join和EXISTS效率

先看两个查询,查询目的是在a表中找出b表出现的vid

1.join查询

sql 复制代码
select a.vid, a.attach_url, a.attach_url_type, a.create_time
from ods_truck.tl_vehicle_attach_log a
         join (select distinct vid
               from ods_truck.tl_truck_log_20240613
               where oprater in ('remove', 'delete')
                 and cast(oprater_time as bigint) < unix_timestamp('20210101', 'yyyyMMdd') * 1000
) b on a.vid = b.vid;

2.exists查询

sql 复制代码
select a.vid, a.attach_url, a.attach_url_type, a.create_time
from ods_truck.tl_vehicle_attach_log a
where exists (
    select 1
    from ods_truck.tl_truck_log_20240613 b
    where a.vid = b.vid
      and oprater in ('remove', 'delete')
      and cast(oprater_time as bigint) < unix_timestamp('20210101', 'yyyyMMdd') * 1000
    )
exists 解释

exists 和 not exists 用于判断B表结果集是否在A表存在,这个使用select 1原因是exists 不需要判断具体的列,只需要知道有没有结果集返回

  • exists 有结果集返回为真
  • not exists 没有结果集返回为真

这里使用select 1没有查询所有的列,优化了查询效率

比较效率

第一种join

  • 优点:子查询先执行,只保留了满足条件的vid的去重集合,减少了主查询时需要比较的记录数,如果vid上有索引,可能会更高效。
  • 缺点:如果子查询返回大量不同的vid,则JOIN操作可能消耗较多资源

第二个查询(EXISTS方式)

  • 优点:EXISTS通常在找到第一个匹配项后就会停止后续的行搜索,因此对于外层表的每一行,内层查询不会全表扫描,这在内层表数据量大时非常高效。
  • 缺点:对于每个外层表的行,都需要执行一次内层查询,如果外层表非常大,这可能会导致较高的查询成本

总结

一般而言,如果内层查询(即满足特定条件的vid)返回的结果集较小,且外层表较大,EXISTS可能会更高效 ,因为它避免了不必要的全表扫描。相反,如果内层查询返回的结果集相对较大,而外层表较小,预先计算并JOIN去重结果集的方法可能会更优

实际效率还需根据具体的数据库系统优化器、索引策略、数据分布等因素来确定,建议在实际环境中进行性能测试来决定最佳方案。

相关推荐
雪碧聊技术29 分钟前
linux(centos7)如何执行python脚本
linux·python3·爬虫脚本·linux安装python3·linux运行爬虫脚本
lbb 小魔仙30 分钟前
Ubuntu 22.04 安装 Docker 完整步骤(附镜像加速配置)
linux·ubuntu·docker
杜子不疼.33 分钟前
Spring AI 与向量数据库:构建企业级 RAG 智能问答系统
数据库·人工智能·spring
山峰哥37 分钟前
Python爬虫实战:从零构建高效数据采集系统
开发语言·数据库·爬虫·python·性能优化·架构
_OP_CHEN2 小时前
【C++数据结构进阶】从B + 树 / B * 树到数据库索引:B树的进化之路与 MySQL 实战解析
数据结构·数据库·b树·mysql·innodb·b+树·mylsam
Full Stack Developme3 小时前
Linux 多种压缩格式,优缺点和适用场景
linux·运维·服务器
旖旎夜光4 小时前
Linux(4)(下)
linux·学习
云老大TG:@yunlaoda3608 小时前
华为云国际站代理商TaurusDB的成本优化体现在哪些方面?
大数据·网络·数据库·华为云
TG:@yunlaoda360 云老大8 小时前
华为云国际站代理商GeminiDB的企业级高可用具体是如何实现的?
服务器·网络·数据库·华为云
Shanxun Liao8 小时前
Cenots 7.9 配置多台 SSH 互信登陆免密码
linux·运维·ssh