PostgreSQL-SQL语句的执行过程(一)

一、SQL 语句的执行过程

  • 应用程序在与PostgreSQL服务器创建连接后,将sql查询语句发送 到PostgreSQL服务器。PostgreSQL服务器接收到sql查询语句后,会进行以下操作:

      • 1)解析器对sql语句进行语法检查和语义检查,并生成查询树,然后把查询树作为输入参数传给重写器。
      • 2)重写器在根据存储在系统表中的规则修改查询树。先把视图重写为对应的基础表,然后把重写后的查询树交给优化器。
      • 3)优化器根据查询树产生执行计划,然后交给执行器。
      • 4)执行器执行查询计划树并返回查询结果。
        • 优化器的分类
          • SPJ优化
            • 基于选择(select)、投影(PROJECT)、连接(JOIN)3种基本操作的查询优化。
          • 非SPJ优化
            • 在SPJ基础上,对分组、集合、排序等操作的查询优化。

二、查询树

  • 概念

    • 查询优化的对象是查询树。它是一个SQL语句的内部表现形式,组成该语句的每个对立部分都是分别存储的。[需要在服务端做一些配置]

三、逻辑优化

  • 概念

    • 逻辑优化的基本理论来源于关系代数。PostgreSQL数据库属于关系性数据库,关系型数据库查询语言的基础就是关系代数,因此,对查询语言的优化就可以通过使用关系代数的运算来进行。
  • 逻辑优化的顺序

    • 对子查询的优化

      • 对子查询的优化分为两个步骤

        • 对子查询进行上体[尽可能的把子查询提到父查询同一及],这样减少查询的层次,减少嵌套查询,使得查询节点尽可能的在叶子结点完成选择操作。

          sql 复制代码
          --1带子查询的
          explain 
          select * from test.demo where id  not in (select demo_id from  test.demo_item);
          --1的查询计划
          Seq Scan on demo  (cost=18.12..18.12 rows=1 width=64)
            Filter: (NOT (ANY ((id)::text = ((hashed SubPlan 1).col1)::text)))
            SubPlan 1
              ->  Seq Scan on demo_item  (cost=0.00..16.50 rows=650 width=32)
          
          
          --2  不带子查询的
          explain
          select * from test.demo a inner join test.demo_item b on a.id =b.demo_id;
          --2的查询计划
          Hash Join  (cost=0.01..18.98 rows=3 width=160)
            Hash Cond: ((b.demo_id)::text = (a.id)::text)
            ->  Seq Scan on demo_item b  (cost=0.00..16.50 rows=650 width=96)
            ->  Hash  (cost=0.00..0.00 rows=1 width=64)
                  ->  Seq Scan on demo a  (cost=0.00..0.00 rows=1 width=64)
          • 很明显【2 不带子查询】没有subplan,这表示b表查询语句不是作为子查询执行的,而是与a表进行了连接操作,就是把b表父查询的同一层,把两者进行了连接。
          • 以上两个查询,分别使用了not in 与inner join,查询计划完全不同,代价也是相差很远。
        • 把选择出来的少量结果进行表间的连接操作,从而将表连接的操作数量降到最低,提高查询性能。

    • 对where、having、on等条件表达优化及等价谓词重写

      • 基于关系代数中的并、交、差等运算规则,用户可以对查询树的条件表达式进行优化。

        • 谓词的优化

          复制代码
          --查询中如果使用的between  and
          select * from a where a.create_date between '2026-01-01' and '2026-01-02';
          --优化为
          select * from a where a.create_date >= '2026-01-01'  and a.create_date<= '2026-01-02';
    • 对外链接进行优化

      • 外连接包括左外链接、右外链接、全外连接等多种连接方式。把外连接转换为内链接,可以使表的连接顺序更随意,提高查询效率。
相关推荐
曲幽8 小时前
FastAPI + PostgreSQL 实战:从入门到不踩坑,一次讲透
python·sql·postgresql·fastapi·web·postgres·db·asyncpg
DolphinDB14 小时前
集成 Prometheus 与 DolphinDB 规则引擎,构建敏捷监控解决方案
数据库
IvorySQL14 小时前
PostgreSQL 技术日报 (3月10日)|IIoT 性能瓶颈与内核优化新讨论
数据库·postgresql·开源
DBA小马哥17 小时前
时序数据库是什么?能源行业国产化替换的入门必看
数据库·时序数据库
爱可生开源社区20 小时前
某马来西亚游戏公司如何从 SQL Server 迁移至 OceanBase?
数据库
小瓦码J码21 小时前
PostgreSQL表名超长踩坑记
数据库·postgresql
yhyyht21 小时前
InfluxDB入门记录(三)flux-dsl
数据库·后端
IvorySQL2 天前
PostgreSQL 技术日报 (3月9日)|EXPLAIN ANALYZE 计时优化与复制语法讨论
数据库·postgresql·开源
用户8307196840822 天前
Java 告别繁琐数据统计代码!MySQL 8 窗口函数真香
java·sql·mysql
stark张宇2 天前
MySQL 核心内幕:从索引原理、字段选型到日志机制与外键约束,一篇打通数据库任督二脉
数据库·mysql·架构