PostgreSQL——SQL优化

PostgreSQL------SQL优化

    • 前言:信创下的PostgreSQL
    • [1. EXPLAIN下查看真正的执行结果](#1. EXPLAIN下查看真正的执行结果)
    • [2. 读取顺序](#2. 读取顺序)
    • [3. 核心指标分析](#3. 核心指标分析)
      • [3.1 读懂数值](#3.1 读懂数值)
      • [3.2 读懂扫描方式](#3.2 读懂扫描方式)
      • [3.3 读懂连接方式](#3.3 读懂连接方式)
      • [3.4 读懂I/O](#3.4 读懂I/O)
    • [4. 实战快速分析](#4. 实战快速分析)

前言:信创下的PostgreSQL

接触PostgreSQL数据库是所在项目为满足信创需求,将Oracle数据库迁移至PostgreSQL数据库。迁移过程中会伴随着SQL调整,相应的SQL会有慢查询的问题,因此记录一下PostgreSQL中SQL优化的流程。

1. EXPLAIN下查看真正的执行结果

sql 复制代码
##基础版
explain ...sql...

##进阶版
explain (analyze,verbose,buffers) ...sql...

进阶版增加了三个配置项,为了更详细地暴露具体问题,推荐三个配置项都加上

  • analyze:真正执行SQL
  • verbose:显示更多细节
  • buffers:显示内存、磁盘使用情况

2. 读取顺序

执行计划分析为树状结构,读取顺序如下:

  • 缩进最深优先执行;同级缩进下,由上至下执行。
  • 下层节点处理完成,传递给上层执行。

3. 核心指标分析

3.1 读懂数值

sql 复制代码
Seq Scan on users  (cost=0.00..15.00 rows=1000 width=36) (actual time=0.015..0.120 rows=1000 loops=1)

如上是某个SQL执行结果,其中数值部分为后半部分,具体如下:

  • cost:SQL优化器中的成本单位(注意:单位不是指 )。

    示例中:

    • 0.00:启动成本,返回第一行数据需要准备的成本;0.00说明不需要准备。
    • 15.00:总成本,获取所有行数据预估需要的成本。
  • rows:优化核心数值,指的结果行数。

    示例中:

    • 1000:优化器预估返回行数。
    • actual-1000:真实执行后返回行数。
  • width:每行数据的平均字节数。select结果越多则拉取的width值越大

  • loops:当前节点被循环执行次数。当循环次数大于1时,总耗时=循环次数 × actual time

  • time:真实执行成本时间。

3.2 读懂扫描方式

扫描方式 说明 注意点 优化思路
Seq Scan 全表扫描 仅适用小表;大表则会影响性能 1、查询条件增加过滤 2、数据表中增加索引
Index Scan 索引扫描。分两步: 1、查索引定位位置 2、根据位置回表查询 标准的查询 尝试利用覆盖索引(Covering Index)。
Index Only Scan 仅索引扫描。 与Index Scan相比不用回表查询,仅通过索引扫描就能够获取所需的数据。 极快 一般无需优化
Bitmap Heap Scan + Bitmap Index Scan 位图扫描。 先在索引中把符合条件的行标记为位图,然后批量取数。 一般 通常无需优化

3.3 读懂连接方式

连接方式 原理 场景 风险
Nested Loop (嵌套循环) 拿外表的一行,去内表找匹配的行 经典的小表驱动大表。 适用于:外表结果集为小表 外表的结果集决定内表查询,若外表结果集太大,会导致内表的查询非常慢
Hash Join (哈希连接) 把一张表的数据在内存中转Hash表,然后扫描另一张表进行连接。 大表之间的等值连接 数据库内存(work_mem)需要够大,否则性能会下降。
Merge Into (归并连接) 两表排列好顺序,然后类似拉链进行左右匹配。 连接字段上已经有索引(天生有序),或者数据量巨大且需要排序

3.4 读懂I/O

在开启BUFFERS后,会看到类似的输出:Buffers:shared hit=1274 read=311

这是最真实的性能指标:

  • shared hit:数据在内存中找到数据。
  • read:数据在内存中找不到数据,需要从磁盘进行读取。

尽一切可能减少 Buffers 的总数量(Hit + Read)。通常逻辑读(Hit)越少,SQL 就越快。如果 Read 很高,说明内存不够用或索引不佳。

4. 实战快速分析

实战分析步骤:

  • 1、查看哪个actual time值最高,说明该查询耗时最高。(注意 actual time × loops
  • 2、估算偏差:查看rows和actual偏差是否过大,超过10倍以上则先对涉及的表进行ANALYZE tableName(PG内部的地图可能没有及时更新, 需要使用语句更新)
  • 3、扫描类型:首先避免大表的Seq Scan,如果Index Scan还是慢,则考虑添加索引,以满足索引覆盖。
  • 4、I/O查看:查看Buffers的read是否过高,是否出现Temp Read/Write。
  • 5、Filter:如果节点显示 Filter:(col_a =5)且同时出现Rows Removed by Filter,说明没走索引,在内存中硬过滤。
相关推荐
Codefengfeng13 小时前
数据安全知识点速通
sql
七牛云行业应用13 小时前
Moltbook一夜崩盘:150万密钥泄露背后的架构“死穴”与重构实战
网络安全·postgresql·架构·高并发·七牛云
自不量力的A同学13 小时前
Redisson 4.2.0 发布,官方推荐的 Redis 客户端
数据库·redis·缓存
Exquisite.14 小时前
Mysql
数据库·mysql
全栈前端老曹14 小时前
【MongoDB】深入研究副本集与高可用性——Replica Set 架构、故障转移、读写分离
前端·javascript·数据库·mongodb·架构·nosql·副本集
R1nG86314 小时前
CANN资源泄漏检测工具源码深度解读 实战设备内存泄漏排查
数据库·算法·cann
阿钱真强道14 小时前
12 JetLinks MQTT直连设备事件上报实战(继电器场景)
linux·服务器·网络·数据库·网络协议
AskHarries14 小时前
Debian 12 环境下 PostgreSQL 15 部署与安全配置
postgresql
逍遥德15 小时前
Sring事务详解之02.如何使用编程式事务?
java·服务器·数据库·后端·sql·spring