PostgreSQL-SQL语句的执行过程(一)

一、SQL 语句的执行过程

应用程序在与PostgreSQL服务器创建连接后，将sql查询语句发送到PostgreSQL服务器。PostgreSQL服务器接收到sql查询语句后，会进行以下操作：
- - 1）解析器对sql语句进行语法检查和语义检查，并生成查询树，然后把查询树作为输入参数传给重写器。
  - 2）重写器在根据存储在系统表中的规则修改查询树。先把视图重写为对应的基础表，然后把重写后的查询树交给优化器。
  - 3）优化器根据查询树产生执行计划，然后交给执行器。
  - 4）执行器执行查询计划树并返回查询结果。
    - 优化器的分类
      - SPJ优化
        
        基于选择(select)、投影（PROJECT）、连接（JOIN）3种基本操作的查询优化。
      - 非SPJ优化
        
        在SPJ基础上，对分组、集合、排序等操作的查询优化。

二、查询树

概念
- 查询优化的对象是查询树。它是一个SQL语句的内部表现形式，组成该语句的每个对立部分都是分别存储的。 $需要在服务端做一些配置$

三、逻辑优化

概念
- 逻辑优化的基本理论来源于关系代数。PostgreSQL数据库属于关系性数据库，关系型数据库查询语言的基础就是关系代数，因此，对查询语言的优化就可以通过使用关系代数的运算来进行。
逻辑优化的顺序
- 对子查询的优化
  - 对子查询的优化分为两个步骤
    - 对子查询进行上体 $尽可能的把子查询提到父查询同一及$ ，这样减少查询的层次，减少嵌套查询，使得查询节点尽可能的在叶子结点完成选择操作。
      sql 复制代码
      
      --1带子查询的 explain select * from test.demo where id not in (select demo_id from test.demo_item); --1的查询计划 Seq Scan on demo (cost=18.12..18.12 rows=1 width=64) Filter: (NOT (ANY ((id)::text = ((hashed SubPlan 1).col1)::text))) SubPlan 1 -> Seq Scan on demo_item (cost=0.00..16.50 rows=650 width=32) --2 不带子查询的 explain select * from test.demo a inner join test.demo_item b on a.id =b.demo_id; --2的查询计划 Hash Join (cost=0.01..18.98 rows=3 width=160) Hash Cond: ((b.demo_id)::text = (a.id)::text) -> Seq Scan on demo_item b (cost=0.00..16.50 rows=650 width=96) -> Hash (cost=0.00..0.00 rows=1 width=64) -> Seq Scan on demo a (cost=0.00..0.00 rows=1 width=64)
      - 很明显【2 不带子查询】没有subplan，这表示b表查询语句不是作为子查询执行的，而是与a表进行了连接操作，就是把b表父查询的同一层，把两者进行了连接。
      - 以上两个查询，分别使用了not in 与inner join，查询计划完全不同，代价也是相差很远。
    - 把选择出来的少量结果进行表间的连接操作，从而将表连接的操作数量降到最低，提高查询性能。
- 对where、having、on等条件表达优化及等价谓词重写
  - 基于关系代数中的并、交、差等运算规则，用户可以对查询树的条件表达式进行优化。
    - 谓词的优化
      复制代码
      
      --查询中如果使用的between and select * from a where a.create_date between '2026-01-01' and '2026-01-02'; --优化为 select * from a where a.create_date >= '2026-01-01' and a.create_date<= '2026-01-02';
- 对外链接进行优化
  - 外连接包括左外链接、右外链接、全外连接等多种连接方式。把外连接转换为内链接，可以使表的连接顺序更随意，提高查询效率。