【PostgreSQL17新特性之-explain命令新增选项】

EXPLAIN是一个用于显示语句执行计划的命令,可用于显示以下语句类型之一的执行计划:

复制代码
- SELECT
- INSERT
- UPDATE
- DELETE
- VALUES
- EXECUTE
- DECLARE
- CREATE TABLE AS
- CREATE MATERIALIZED VIEW

PostgreSQL17-beta1版本近日发布了,新版本里,explain命令新增了两个选项,分别是MEMORY 和SUMMARY。

复制代码
postgres<17beta1>(ConnAs[postgres]:PID[23802] 2024-05-28/23:37:23)=# \h explain
Command:     EXPLAIN
Description: show the execution plan of a statement
Syntax:
EXPLAIN [ ( option [, ...] ) ] statement

where option can be one of:

    ANALYZE [ boolean ]
    VERBOSE [ boolean ]
    COSTS [ boolean ]
    SETTINGS [ boolean ]
    GENERIC_PLAN [ boolean ]
    BUFFERS [ boolean ]
    SERIALIZE [ { NONE | TEXT | BINARY } ]
    WAL [ boolean ]
    TIMING [ boolean ]
    SUMMARY [ boolean ]
    MEMORY [ boolean ]
    FORMAT { TEXT | XML | JSON | YAML }

URL: https://www.postgresql.org/docs/17/sql-explain.html

1.EXPLAIN的SERIALIZE选项

EXPLAIN(ANALYZE,SERIALIZE)允许收集有关查询发出的数据量的统计信息,以及将数据转换为在线格式所需的时间。以前,如果不将数据实际发送到客户端,就无法对此进行调查,在这种情况下,网络传输成本可能会淹没您想要看到的内容。特别是,此功能允许在格式化过程中研究压缩或离线数据的反TOAST(de-TOASTing)成本。

SERIALIZE(序列化)是将数据对象(数据存储区域中表示的代码和数据的组合)转换为一系列字节的过程,这些字节以易于传输的形式保存对象的状态。在这种序列化形式下,数据可以传递到另一个数据存储(例如内存计算平台)、应用程序或其他目标。举个例子,从 toast 获取数据并生成要发送到客户端的输出就属于序列化的时间。

具体测试如下,可以看到SERIALIZE选项必须和ANALYZE一起使用,众所周知,explain带有ANALYZE选项后,这条SQL对应会实际进行执行,所以对于线上一些可能影响性能比较大的SQL,或者涉及到数据变更的SQL的时候,需要谨慎评估。可以看到有了这个新的SERIALIZE选项,执行计划里可以看到序列化的实际时间,方便了我们对于SQL的进一步分析和优化。

复制代码
postgres<17beta1>(ConnAs[postgres]:PID[23802] 2024-05-29/00:20:33)=# explain  select * from t1;
+-------------------------------------------------------+
|                      QUERY PLAN                       |
+-------------------------------------------------------+
| Seq Scan on t1  (cost=0.00..20.15 rows=415 width=273) |
+-------------------------------------------------------+
(1 row)

postgres<17beta1>(ConnAs[postgres]:PID[23802] 2024-05-29/00:20:34)=# explain (SERIALIZE) select * from t1;
ERROR:  EXPLAIN option SERIALIZE requires ANALYZE
postgres<17beta1>(ConnAs[postgres]:PID[23802] 2024-05-29/00:20:36)=# explain (analyze,SERIALIZE) select * from t1;
+---------------------------------------------------------------------------------------------------+
|                                            QUERY PLAN                                             |
+---------------------------------------------------------------------------------------------------+
| Seq Scan on t1  (cost=0.00..20.15 rows=415 width=273) (actual time=0.012..0.054 rows=415 loops=1) |
| Planning Time: 0.041 ms                                                                           |
| Serialization: time=0.703 ms  output=87kB  format=text                                            |
| Execution Time: 0.792 ms                                                                          |
+---------------------------------------------------------------------------------------------------+
(4 rows)

2.EXPLAIN的MEMORY选项

PostgreSQL17-beta1添加了EXPLAIN (MEMORY)选项来报告规划器的内存消耗。

当指定Memory选项时,这将在"Planning:"(目前只有"Buffers:")下添加一个新的"Memory:"行。PostgreSQL17-beta1为planner活动创建了一个单独的内存上下文,仅在给出此选项时使用。

该上下文分配的内存总量报告为allocated(已分配);从中减去上下文的自由列表中的内存,并将结果报告为used(已使用)。

复制代码
postgres<17beta1>(ConnAs[postgres]:PID[24195] 2024-05-29/01:23:43)=# explain  select * from t1;
+-------------------------------------------------------+
|                      QUERY PLAN                       |
+-------------------------------------------------------+
| Seq Scan on t1  (cost=0.00..20.15 rows=415 width=273) |
+-------------------------------------------------------+
(1 row)

postgres<17beta1>(ConnAs[postgres]:PID[24195] 2024-05-29/01:23:55)=# explain (memory) select * from t1;
+-------------------------------------------------------+
|                      QUERY PLAN                       |
+-------------------------------------------------------+
| Seq Scan on t1  (cost=0.00..20.15 rows=415 width=273) |
| Planning:                                             |
|   Memory: used=20kB  allocated=32kB                   |
+-------------------------------------------------------+
(3 rows) 

参考链接:

1.https://www.depesz.com/2024/04/11/waiting-for-postgresql-17-invent-serialize-option-for-explain/

2.https://git.postgresql.org/gitweb/?p=postgresql.git;a=commit;h=5de890e3610d5a12cdaea36413d967cf5c544e20

3.https://git.postgresql.org/gitweb/?p=postgresql.git;a=commit;h=06286709ee0637ec7376329a5aa026b7682dcfe2

4.https://hazelcast.com/glossary/serialization/

相关推荐
RestCloud3 小时前
揭秘 CDC 技术:让数据库同步快人一步
数据库·api
得物技术6 小时前
MySQL单表为何别超2000万行?揭秘B+树与16KB页的生死博弈|得物技术
数据库·后端·mysql
可涵不会debug10 小时前
【IoTDB】时序数据库选型指南:工业大数据场景下的技术突围
数据库·时序数据库
ByteBlossom10 小时前
MySQL 面试场景题之如何处理 BLOB 和CLOB 数据类型?
数据库·mysql·面试
IvorySQL10 小时前
IvorySQL 4.6:DocumentDB+FerretDB 实现 MongoDB 兼容部署指南
postgresql
麦兜*10 小时前
MongoDB Atlas 云数据库实战:从零搭建全球多节点集群
java·数据库·spring boot·mongodb·spring·spring cloud
Slaughter信仰10 小时前
深入理解Java虚拟机:JVM高级特性与最佳实践(第3版)第十章知识点问答(10题)
java·jvm·数据库
麦兜*10 小时前
MongoDB 在物联网(IoT)中的应用:海量时序数据处理方案
java·数据库·spring boot·物联网·mongodb·spring
-Xie-11 小时前
Mysql杂志(十六)——缓存池
数据库·mysql·缓存