GPDB EXPLAIN ANALYZ比直接执行SQL慢?

自从GPDB闭源后,HashData接手举起了GPDB开源的大旗,由GPDB衍生而来的CloudberryDB于近期加入了Apache软件基金会孵化器,给GPDB开源社区带来了热度和活力。

昨天在CC群里看到GPDB中EXPLAIN ANALYZ比直接执行SQL慢的讨论。一般情况下,EXPLAIN ANALYZE由于不会向客户端输出元组,没有网络传输代价和IO转换代价(除非指定了SERIALIZE)所以比直接执行SQL快。但是EXPLAIN ANALYZE调用了gettimeofday()系统调用,在比较慢的机器上,这个代价就有点大了,可能会冲掉EXPLAIN ANALYZE上面省掉的动作节省的时间。在GPDB中还有另外一种场景导致EXPLAIN ANALYZE执行很慢:比如GPDB集群数据很不均衡,执行加了limit的SQL。

原因:在GPDB中执行explain analyze时,master执行了ExecutorRun后会等所有QE结束后才继续向下执行ExecutorEnd;而SQL正常执行时,一旦有的SEGMENT数据比较少执行的比较快,将数据发送给master后,master发现数据量够了,就会在ExecutorEnd中向SEGMENT发送消息,终止没有执行玩完的SEGMENT。

接下来,我们看下执行的流程,来充分理解下。

1、explain analyze流程

1)Explain analyze流程中,master执行ExecutorRun函数开始执行计划的执行

2)然后master就会通过函数cdbdisp_checkDispatchResult函数等待所有QE执行完。注意这里waitMode入参为DISPATCH_WAIT_NONE

3)2)中的执行函数指针为cdbdisp_checkDispatchResult_async,它调用函数checkDispatchResult,注意它的入参timeout_sec为-1

4)checkDispatchResult函数中当timeout_sec为-1,且waiMode为DISPATCH_WAIT_NONE时,poll的超时时间为DISPATCH_WAIT_TIMEOUT_MSEC。

5)checkDispatchResult函数的循环中,需要接收到所有QE完成后,才会退出循环

由此,了解到Explain analyze会等待所有QE完成。

2、SQL正常执行流程

SQL正常执行时,走的是执行器三部曲:ExecutorStart-ExecutorRun-ExecutorEnd

1)master不用等所有QE全部执行完,它得到需要行数的元组后,就可以执行到ExecutorEnd

2)ExecutorEnd通过ExecSquelchNode告诉子节点,通过ExecSquelchMotion通知QE不用执行了

3)Master然后进入checkDispatchResult等待QE反馈消息,注意他这里的timeout_sec为-1,waitMode为DISPATCH_WAIT_FINISH,由此poll的超时时间为DISPATCH_WAIT_CANCEL_TIMEOUT_MSEC

由此,正常执行时,master不用等待所有QE结束,它得到需要的行数后就可以进入ExecutorEnd,向QE发送终止执行命令,然后结束。

3、参考

https://www.postgresql.org/docs/current/using-explain.html#USING-EXPLAIN-ANALYZE

https://www.postgresql.org/docs/current/sql-explain.html

相关推荐
小画家~7 分钟前
第四十六: channel 高级使用
java·前端·数据库
晴天¥12 分钟前
了解Oracle中的体系结构
数据库
DemonAvenger18 分钟前
Redis慢查询分析与优化:性能瓶颈排查实战指南
数据库·redis·性能优化
Li_yizYa19 分钟前
Redis-常见数据类型及应用场景
java·数据库·redis
尽兴-32 分钟前
SQL 执行失败如何回滚?事务已提交还能恢复吗?——MySQL 误操作数据恢复全指南
sql·mysql·binlog·undolog·redolog
瀚高PG实验室1 小时前
逻辑导入导出(pg_dump/pg_restore)用法2-导入到不同的schema或tablespace
数据库·瀚高数据库
whyfail1 小时前
前端数据存储新选择:IndexedDB与Dexie.js技术指南
前端·javascript·数据库
煎蛋学姐1 小时前
SSM校园快递系统q9061(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·开题报告·java 开发·校园信息化·ssm 框架
元亓亓亓1 小时前
考研408--操作系统--day11--文件管理&逻辑物理结构&目录&存储空间管理
数据库·考研·文件管理·408
cly11 小时前
Ansible自动化(十三):调试与优化
数据库·自动化·ansible