GaussDB 数据库架构师修炼(十八) SQL引擎-分布式计划

1 分布式架构

  • GaussDB基于MPP (Massively Parallel Processing) 并行架构
  • Streaming流式计算框架

2 分布式计划

  • CN轻量化(light proxy)
  • FQS( fast query shipping )
  • STREAM计划
  • XC计划

|----------|--------------------------|-----------------------|
| 计划类型 | 场景 | 原理 |
| CN轻量化 | 可以直接在一个DN执行 | 直接下发SQL语句给DN |
| FQS | 语句可以完全下推DN执 行, DN之间不需要交互 | 需要走执行器逻辑下发给DN |
| STREAM | 需要DN之间交互, CN只 汇总数据 | 在CN上生成计划,下发计划给DN执行 |
| XC | 适用于所有场景 | 部分语句下推DN执行,无法下推的在CN执行 |

3 计划生成

1)计划生成主要是查询的路径树计划树结构转换的过程, 在分布式场景下对关联****join 、聚集操作Agg有特殊的生成逻辑

2) 当join列与分布列不一致时,需要网络stream节点,可能生成的路径:

t1 HASH BY (c1), t2 HASH BY (c2)

SELECT * FROM t1 JOIN t2 ON cx=cy;

如下:每一种策略都有可以执行,根据最下层AGG过滤元组的数量有关。

4 不支持下推的

  • 1)根据函数属性判断下推

IMMUTABLE:忽略shippable属性,可以下推

STABLE:判断shippable,受限下推

VOLATILE:判断shippable,受限下推

2)不支持下推的语法

SQL子句中存在使用RETURNING

聚集函数使用ORDER BY、COUNT(DISTINCT expr) 、expr中的列不支持重分布

数组表达式

相关推荐
czlczl200209251 天前
Redis数据编码
数据库·redis·缓存
Wpa.wk1 天前
pb协议接口测试
数据库·redis·缓存
IpdataCloud1 天前
资源受限设备上轻量级IP查询模块的部署方法
网络·数据库·网络协议·tcp/ip
青槿吖1 天前
SpringMVC通关秘籍(下):日期转换器、拦截器与文件上传的奇幻冒险
java·开发语言·数据库·sql·mybatis·状态模式
楼田莉子1 天前
MySQL数据库:表及其表相关的操作
数据库·学习·mysql
ZTLJQ1 天前
驾驭高并发:Python协程与 async/await 完全解析
服务器·数据库·python
百年੭ ᐕ)੭*⁾⁾1 天前
DataFrame存入mysql以及读取操作
数据库·mysql·numpy·pandas·ipython
²º²²এ松1 天前
vs code连接ubuntu esp项目
linux·数据库·ubuntu
Maverick061 天前
02-SQL执行计划与优化器:Oracle是怎么决定“该怎么查“的
数据库·sql·oracle·ffmpeg