PostgreSQL-SQL语句的执行过程(一)

一、SQL 语句的执行过程

  • 应用程序在与PostgreSQL服务器创建连接后,将sql查询语句发送 到PostgreSQL服务器。PostgreSQL服务器接收到sql查询语句后,会进行以下操作:

      • 1)解析器对sql语句进行语法检查和语义检查,并生成查询树,然后把查询树作为输入参数传给重写器。
      • 2)重写器在根据存储在系统表中的规则修改查询树。先把视图重写为对应的基础表,然后把重写后的查询树交给优化器。
      • 3)优化器根据查询树产生执行计划,然后交给执行器。
      • 4)执行器执行查询计划树并返回查询结果。
        • 优化器的分类
          • SPJ优化
            • 基于选择(select)、投影(PROJECT)、连接(JOIN)3种基本操作的查询优化。
          • 非SPJ优化
            • 在SPJ基础上,对分组、集合、排序等操作的查询优化。

二、查询树

  • 概念

    • 查询优化的对象是查询树。它是一个SQL语句的内部表现形式,组成该语句的每个对立部分都是分别存储的。[需要在服务端做一些配置]

三、逻辑优化

  • 概念

    • 逻辑优化的基本理论来源于关系代数。PostgreSQL数据库属于关系性数据库,关系型数据库查询语言的基础就是关系代数,因此,对查询语言的优化就可以通过使用关系代数的运算来进行。
  • 逻辑优化的顺序

    • 对子查询的优化

      • 对子查询的优化分为两个步骤

        • 对子查询进行上体[尽可能的把子查询提到父查询同一及],这样减少查询的层次,减少嵌套查询,使得查询节点尽可能的在叶子结点完成选择操作。

          sql 复制代码
          --1带子查询的
          explain 
          select * from test.demo where id  not in (select demo_id from  test.demo_item);
          --1的查询计划
          Seq Scan on demo  (cost=18.12..18.12 rows=1 width=64)
            Filter: (NOT (ANY ((id)::text = ((hashed SubPlan 1).col1)::text)))
            SubPlan 1
              ->  Seq Scan on demo_item  (cost=0.00..16.50 rows=650 width=32)
          
          
          --2  不带子查询的
          explain
          select * from test.demo a inner join test.demo_item b on a.id =b.demo_id;
          --2的查询计划
          Hash Join  (cost=0.01..18.98 rows=3 width=160)
            Hash Cond: ((b.demo_id)::text = (a.id)::text)
            ->  Seq Scan on demo_item b  (cost=0.00..16.50 rows=650 width=96)
            ->  Hash  (cost=0.00..0.00 rows=1 width=64)
                  ->  Seq Scan on demo a  (cost=0.00..0.00 rows=1 width=64)
          • 很明显【2 不带子查询】没有subplan,这表示b表查询语句不是作为子查询执行的,而是与a表进行了连接操作,就是把b表父查询的同一层,把两者进行了连接。
          • 以上两个查询,分别使用了not in 与inner join,查询计划完全不同,代价也是相差很远。
        • 把选择出来的少量结果进行表间的连接操作,从而将表连接的操作数量降到最低,提高查询性能。

    • 对where、having、on等条件表达优化及等价谓词重写

      • 基于关系代数中的并、交、差等运算规则,用户可以对查询树的条件表达式进行优化。

        • 谓词的优化

          复制代码
          --查询中如果使用的between  and
          select * from a where a.create_date between '2026-01-01' and '2026-01-02';
          --优化为
          select * from a where a.create_date >= '2026-01-01'  and a.create_date<= '2026-01-02';
    • 对外链接进行优化

      • 外连接包括左外链接、右外链接、全外连接等多种连接方式。把外连接转换为内链接,可以使表的连接顺序更随意,提高查询效率。
相关推荐
Andy Dennis2 小时前
一文漫谈数据库存储之索引(B+, B-link, LSM tree等)
数据库·b+树·lsm-tree
CHANG_THE_WORLD3 小时前
字符串定义的汇编分析
汇编·数据库
数据知道3 小时前
PostgreSQL:如何通过progres_fdw跨库关联查询?
数据库·postgresql
v***57003 小时前
MYSQL 创建索引
数据库·mysql
heimeiyingwang4 小时前
大模型 RAG 技术原理与企业级落地实践
大数据·数据库·人工智能·架构
倔强的石头_5 小时前
【金仓数据库】ksql 指南(七) —— 启动和管理事务(KingbaseES 数据一致性保障)
数据库
志栋智能6 小时前
自动化运维真的只能选复杂平台吗?
运维·网络·数据库·人工智能·自动化
LaughingZhu6 小时前
Product Hunt 每日热榜 | 2026-02-17
大数据·数据库·人工智能·经验分享·搜索引擎
树码小子6 小时前
Mybatis(16)Mybatis-Plus条件构造器(1)
数据库·mybatis-plus