PostgreSQL——SQL优化

PostgreSQL------SQL优化

    • 前言:信创下的PostgreSQL
    • [1. EXPLAIN下查看真正的执行结果](#1. EXPLAIN下查看真正的执行结果)
    • [2. 读取顺序](#2. 读取顺序)
    • [3. 核心指标分析](#3. 核心指标分析)
      • [3.1 读懂数值](#3.1 读懂数值)
      • [3.2 读懂扫描方式](#3.2 读懂扫描方式)
      • [3.3 读懂连接方式](#3.3 读懂连接方式)
      • [3.4 读懂I/O](#3.4 读懂I/O)
    • [4. 实战快速分析](#4. 实战快速分析)

前言:信创下的PostgreSQL

接触PostgreSQL数据库是所在项目为满足信创需求,将Oracle数据库迁移至PostgreSQL数据库。迁移过程中会伴随着SQL调整,相应的SQL会有慢查询的问题,因此记录一下PostgreSQL中SQL优化的流程。

1. EXPLAIN下查看真正的执行结果

sql 复制代码
##基础版
explain ...sql...

##进阶版
explain (analyze,verbose,buffers) ...sql...

进阶版增加了三个配置项,为了更详细地暴露具体问题,推荐三个配置项都加上

  • analyze:真正执行SQL
  • verbose:显示更多细节
  • buffers:显示内存、磁盘使用情况

2. 读取顺序

执行计划分析为树状结构,读取顺序如下:

  • 缩进最深优先执行;同级缩进下,由上至下执行。
  • 下层节点处理完成,传递给上层执行。

3. 核心指标分析

3.1 读懂数值

sql 复制代码
Seq Scan on users  (cost=0.00..15.00 rows=1000 width=36) (actual time=0.015..0.120 rows=1000 loops=1)

如上是某个SQL执行结果,其中数值部分为后半部分,具体如下:

  • cost:SQL优化器中的成本单位(注意:单位不是指 )。

    示例中:

    • 0.00:启动成本,返回第一行数据需要准备的成本;0.00说明不需要准备。
    • 15.00:总成本,获取所有行数据预估需要的成本。
  • rows:优化核心数值,指的结果行数。

    示例中:

    • 1000:优化器预估返回行数。
    • actual-1000:真实执行后返回行数。
  • width:每行数据的平均字节数。select结果越多则拉取的width值越大

  • loops:当前节点被循环执行次数。当循环次数大于1时,总耗时=循环次数 × actual time

  • time:真实执行成本时间。

3.2 读懂扫描方式

扫描方式 说明 注意点 优化思路
Seq Scan 全表扫描 仅适用小表;大表则会影响性能 1、查询条件增加过滤 2、数据表中增加索引
Index Scan 索引扫描。分两步: 1、查索引定位位置 2、根据位置回表查询 标准的查询 尝试利用覆盖索引(Covering Index)。
Index Only Scan 仅索引扫描。 与Index Scan相比不用回表查询,仅通过索引扫描就能够获取所需的数据。 极快 一般无需优化
Bitmap Heap Scan + Bitmap Index Scan 位图扫描。 先在索引中把符合条件的行标记为位图,然后批量取数。 一般 通常无需优化

3.3 读懂连接方式

连接方式 原理 场景 风险
Nested Loop (嵌套循环) 拿外表的一行,去内表找匹配的行 经典的小表驱动大表。 适用于:外表结果集为小表 外表的结果集决定内表查询,若外表结果集太大,会导致内表的查询非常慢
Hash Join (哈希连接) 把一张表的数据在内存中转Hash表,然后扫描另一张表进行连接。 大表之间的等值连接 数据库内存(work_mem)需要够大,否则性能会下降。
Merge Into (归并连接) 两表排列好顺序,然后类似拉链进行左右匹配。 连接字段上已经有索引(天生有序),或者数据量巨大且需要排序

3.4 读懂I/O

在开启BUFFERS后,会看到类似的输出:Buffers:shared hit=1274 read=311

这是最真实的性能指标:

  • shared hit:数据在内存中找到数据。
  • read:数据在内存中找不到数据,需要从磁盘进行读取。

尽一切可能减少 Buffers 的总数量(Hit + Read)。通常逻辑读(Hit)越少,SQL 就越快。如果 Read 很高,说明内存不够用或索引不佳。

4. 实战快速分析

实战分析步骤:

  • 1、查看哪个actual time值最高,说明该查询耗时最高。(注意 actual time × loops
  • 2、估算偏差:查看rows和actual偏差是否过大,超过10倍以上则先对涉及的表进行ANALYZE tableName(PG内部的地图可能没有及时更新, 需要使用语句更新)
  • 3、扫描类型:首先避免大表的Seq Scan,如果Index Scan还是慢,则考虑添加索引,以满足索引覆盖。
  • 4、I/O查看:查看Buffers的read是否过高,是否出现Temp Read/Write。
  • 5、Filter:如果节点显示 Filter:(col_a =5)且同时出现Rows Removed by Filter,说明没走索引,在内存中硬过滤。
相关推荐
编程修仙2 小时前
第十一篇 Spring事务
xml·java·数据库·spring
绝顶少年2 小时前
Redis 高可用架构三部曲:主从复制、哨兵模式与集群模式深度解析
数据库·redis·架构
倔强的石头1062 小时前
从 Oracle 到 KingbaseES:破解迁移痛点,解锁信创时代数据库新可能
数据库·oracle·金仓数据库
2301_800256112 小时前
8.3 查询优化 核心知识点总结
大数据·数据库·人工智能·sql·postgresql
三七吃山漆2 小时前
攻防世界——supersqli
数据库·网络安全·web·ctf
零日失眠者2 小时前
【Oracle入门到删库跑路-08】核心技能:用户和权限管理
数据库·oracle
我科绝伦(Huanhuan Zhou)3 小时前
Oracle控制文件、SCN与检查点机制深度解析及数据库初始化原理
运维·数据库·oracle
cui_win3 小时前
MySQL max_connections连接数配置没生效,最终靠改这个参数解决
数据库·mysql
爱吃面条的猿3 小时前
DBeaver 全能数据库管理工具的使用配置
数据库·dbeaver