Clickhouse查询语句执行过程

问题

简述clickhosue中一条select语句的执行过程,使用的引擎是ReplacingMergeTree。例如:

sql 复制代码
select col1,col2 from table final
prewhere col3 > ? and col4 = ? and col5 = ? -- col3为分区键,col4为二级索引,col5为主键字段
where col6 = ? 
order by col7;

回答

  1. 分区过滤。根据col3确定分区,这一步在内存中完成
  2. 一级索引过滤granularity。根据col5字段从分区中过滤出来符合条件的granularity,这个也是在内存中完成
  3. 二级索引过滤granularity。从磁盘上读取col4,对granularity再次进行过滤。这个会进行磁盘的IO操作
  4. prewhere其他条件过滤。如果prewhere还有其他的字段,就从磁盘上读取出来,再次进行granularity的过滤
  5. 读取其他所有需要的字段并进行final合并。读取select中的所有字段和where中要使用的字段,读取主键的所有字段,以及version字段,按version对数据进行merge操作
  6. where过滤数据。使用col6字段进行过滤
  7. 对数据进行order by或者group操作返回数据

注意

  1. 上述只有第一步和第二步,即分区过滤和一级索引过滤,是在内存中完成的,其他均需要进行IO操作
  2. 需要注意final是在prewhere之后,where之前起作用
  3. prewhere之后,final之前会读取当前sql所需要的所有字段
相关推荐
sunshine88513 分钟前
财务RPA的深水区应用:超越自动化,迈向智能决策支持
数据库
efir OONA23 分钟前
MySQL数据库误删恢复_mysql 数据 误删
数据库·mysql·adb
zhangchaoxies1 小时前
如何在 Go 中安全复制接口指针所指向的值
jvm·数据库·python
陈陈CHENCHEN1 小时前
【数据库】MySQL 8.0.40 至 8.0.44 RPM 方式升级指南
数据库·mysql
m0_734949792 小时前
怎么利用Navicat进行调整备份文件压缩等级_详细配置与操作步骤
jvm·数据库·python
T.i.s2 小时前
番外续2-MIT-BIH Arrhythmia Database
数据库
有味道的男人2 小时前
AI 效率翻倍:对接 1688 拍立淘接口,商品全量信息一键抓取
数据库
m0_741173333 小时前
如何处理SQL中的NULL值_使用ISNULL或COALESCE函数
jvm·数据库·python
志栋智能3 小时前
超自动化巡检:解锁运维数据的深层价值
运维·服务器·数据库·自动化
m0_380113843 小时前
补单系统搭建及源码分享
数据库·spring boot·mybatis