SQL join和EXISTS效率

行走荷尔蒙2024-06-17 8:37

先看两个查询，查询目的是在a表中找出b表出现的vid

1.join查询

sql 复制代码

select a.vid, a.attach_url, a.attach_url_type, a.create_time
from ods_truck.tl_vehicle_attach_log a
         join (select distinct vid
               from ods_truck.tl_truck_log_20240613
               where oprater in ('remove', 'delete')
                 and cast(oprater_time as bigint) < unix_timestamp('20210101', 'yyyyMMdd') * 1000
) b on a.vid = b.vid;

2.exists查询

sql 复制代码

select a.vid, a.attach_url, a.attach_url_type, a.create_time
from ods_truck.tl_vehicle_attach_log a
where exists (
    select 1
    from ods_truck.tl_truck_log_20240613 b
    where a.vid = b.vid
      and oprater in ('remove', 'delete')
      and cast(oprater_time as bigint) < unix_timestamp('20210101', 'yyyyMMdd') * 1000
    )

exists 解释

exists 和 not exists 用于判断B表结果集是否在A表存在，这个使用select 1原因是exists 不需要判断具体的列，只需要知道有没有结果集返回

exists 有结果集返回为真
not exists 没有结果集返回为真

这里使用select 1没有查询所有的列，优化了查询效率

比较效率

第一种join

优点：子查询先执行，只保留了满足条件的vid的去重集合，减少了主查询时需要比较的记录数，如果vid上有索引，可能会更高效。
缺点：如果子查询返回大量不同的vid，则JOIN操作可能消耗较多资源

第二个查询（EXISTS方式）

优点：EXISTS通常在找到第一个匹配项后就会停止后续的行搜索，因此对于外层表的每一行，内层查询不会全表扫描，这在内层表数据量大时非常高效。
缺点：对于每个外层表的行，都需要执行一次内层查询，如果外层表非常大，这可能会导致较高的查询成本

总结

一般而言，如果内层查询（即满足特定条件的vid）返回的结果集较小，且外层表较大，EXISTS可能会更高效 ，因为它避免了不必要的全表扫描。相反，如果内层查询返回的结果集相对较大，而外层表较小，预先计算并JOIN去重结果集的方法可能会更优 。

实际效率还需根据具体的数据库系统优化器、索引策略、数据分布等因素来确定，建议在实际环境中进行性能测试来决定最佳方案。

上一篇：康士柏新能源汽车检测设备-科技之光驶向未来

下一篇：WordPress管理员后台登录地址修改教程，WordPress admin登录地址文件修改方法

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 03国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 052026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 07微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 08AI科技热点日报 | 2026年07月01日 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 102026上半年大模型全景技术解读：推理融合、Agent 爆发与多模态统一