【PostgreSQL17新特性之-explain命令新增选项】

EXPLAIN是一个用于显示语句执行计划的命令,可用于显示以下语句类型之一的执行计划:

复制代码
- SELECT
- INSERT
- UPDATE
- DELETE
- VALUES
- EXECUTE
- DECLARE
- CREATE TABLE AS
- CREATE MATERIALIZED VIEW

PostgreSQL17-beta1版本近日发布了,新版本里,explain命令新增了两个选项,分别是MEMORY 和SUMMARY。

复制代码
postgres<17beta1>(ConnAs[postgres]:PID[23802] 2024-05-28/23:37:23)=# \h explain
Command:     EXPLAIN
Description: show the execution plan of a statement
Syntax:
EXPLAIN [ ( option [, ...] ) ] statement

where option can be one of:

    ANALYZE [ boolean ]
    VERBOSE [ boolean ]
    COSTS [ boolean ]
    SETTINGS [ boolean ]
    GENERIC_PLAN [ boolean ]
    BUFFERS [ boolean ]
    SERIALIZE [ { NONE | TEXT | BINARY } ]
    WAL [ boolean ]
    TIMING [ boolean ]
    SUMMARY [ boolean ]
    MEMORY [ boolean ]
    FORMAT { TEXT | XML | JSON | YAML }

URL: https://www.postgresql.org/docs/17/sql-explain.html

1.EXPLAIN的SERIALIZE选项

EXPLAIN(ANALYZE,SERIALIZE)允许收集有关查询发出的数据量的统计信息,以及将数据转换为在线格式所需的时间。以前,如果不将数据实际发送到客户端,就无法对此进行调查,在这种情况下,网络传输成本可能会淹没您想要看到的内容。特别是,此功能允许在格式化过程中研究压缩或离线数据的反TOAST(de-TOASTing)成本。

SERIALIZE(序列化)是将数据对象(数据存储区域中表示的代码和数据的组合)转换为一系列字节的过程,这些字节以易于传输的形式保存对象的状态。在这种序列化形式下,数据可以传递到另一个数据存储(例如内存计算平台)、应用程序或其他目标。举个例子,从 toast 获取数据并生成要发送到客户端的输出就属于序列化的时间。

具体测试如下,可以看到SERIALIZE选项必须和ANALYZE一起使用,众所周知,explain带有ANALYZE选项后,这条SQL对应会实际进行执行,所以对于线上一些可能影响性能比较大的SQL,或者涉及到数据变更的SQL的时候,需要谨慎评估。可以看到有了这个新的SERIALIZE选项,执行计划里可以看到序列化的实际时间,方便了我们对于SQL的进一步分析和优化。

复制代码
postgres<17beta1>(ConnAs[postgres]:PID[23802] 2024-05-29/00:20:33)=# explain  select * from t1;
+-------------------------------------------------------+
|                      QUERY PLAN                       |
+-------------------------------------------------------+
| Seq Scan on t1  (cost=0.00..20.15 rows=415 width=273) |
+-------------------------------------------------------+
(1 row)

postgres<17beta1>(ConnAs[postgres]:PID[23802] 2024-05-29/00:20:34)=# explain (SERIALIZE) select * from t1;
ERROR:  EXPLAIN option SERIALIZE requires ANALYZE
postgres<17beta1>(ConnAs[postgres]:PID[23802] 2024-05-29/00:20:36)=# explain (analyze,SERIALIZE) select * from t1;
+---------------------------------------------------------------------------------------------------+
|                                            QUERY PLAN                                             |
+---------------------------------------------------------------------------------------------------+
| Seq Scan on t1  (cost=0.00..20.15 rows=415 width=273) (actual time=0.012..0.054 rows=415 loops=1) |
| Planning Time: 0.041 ms                                                                           |
| Serialization: time=0.703 ms  output=87kB  format=text                                            |
| Execution Time: 0.792 ms                                                                          |
+---------------------------------------------------------------------------------------------------+
(4 rows)

2.EXPLAIN的MEMORY选项

PostgreSQL17-beta1添加了EXPLAIN (MEMORY)选项来报告规划器的内存消耗。

当指定Memory选项时,这将在"Planning:"(目前只有"Buffers:")下添加一个新的"Memory:"行。PostgreSQL17-beta1为planner活动创建了一个单独的内存上下文,仅在给出此选项时使用。

该上下文分配的内存总量报告为allocated(已分配);从中减去上下文的自由列表中的内存,并将结果报告为used(已使用)。

复制代码
postgres<17beta1>(ConnAs[postgres]:PID[24195] 2024-05-29/01:23:43)=# explain  select * from t1;
+-------------------------------------------------------+
|                      QUERY PLAN                       |
+-------------------------------------------------------+
| Seq Scan on t1  (cost=0.00..20.15 rows=415 width=273) |
+-------------------------------------------------------+
(1 row)

postgres<17beta1>(ConnAs[postgres]:PID[24195] 2024-05-29/01:23:55)=# explain (memory) select * from t1;
+-------------------------------------------------------+
|                      QUERY PLAN                       |
+-------------------------------------------------------+
| Seq Scan on t1  (cost=0.00..20.15 rows=415 width=273) |
| Planning:                                             |
|   Memory: used=20kB  allocated=32kB                   |
+-------------------------------------------------------+
(3 rows) 

参考链接:

1.https://www.depesz.com/2024/04/11/waiting-for-postgresql-17-invent-serialize-option-for-explain/

2.https://git.postgresql.org/gitweb/?p=postgresql.git;a=commit;h=5de890e3610d5a12cdaea36413d967cf5c544e20

3.https://git.postgresql.org/gitweb/?p=postgresql.git;a=commit;h=06286709ee0637ec7376329a5aa026b7682dcfe2

4.https://hazelcast.com/glossary/serialization/

相关推荐
-雷阵雨-20 小时前
MySQL——数据库约束
数据库·mysql
大筒木老辈子20 小时前
MySQL笔记---C/C++访问MySQL数据库
数据库·笔记·mysql
友友马20 小时前
『 数据库 』MySQL复习(表的约束)
数据库·mysql
奥尔特星云大使20 小时前
MySQL分布式架构:MyCat详解
数据库·分布式·mysql·mycat·高可用
SelectDB技术团队20 小时前
Apache Doris 内部数据裁剪与过滤机制的实现原理 | Deep Dive
大数据·数据库·apache·数据库系统·数据裁剪
像风一样!21 小时前
学习MySQL数据库的高级特性(上)
数据库·mysql
夜泉_ly1 天前
Redis -持久化
数据库·redis·缓存
Microsoft Word1 天前
跨平台向量库:Linux & Windows 上一条龙部署 PostgreSQL 向量扩展
linux·windows·postgresql
2401_837088501 天前
什么是NoSQL?
数据库·nosql
web安全工具库1 天前
从课堂笔记到实践:深入理解Linux C函数库的奥秘
java·数据库·算法