Clickhouse查询语句执行过程

爱被窝的程序猿2024-02-13 20:59

问题

简述clickhosue中一条select语句的执行过程，使用的引擎是ReplacingMergeTree。例如：

sql 复制代码

select col1,col2 from table final
prewhere col3 > ? and col4 = ? and col5 = ? -- col3为分区键，col4为二级索引,col5为主键字段
where col6 = ? 
order by col7;

回答

分区过滤。根据col3确定分区，这一步在内存中完成
一级索引过滤granularity。根据col5字段从分区中过滤出来符合条件的granularity，这个也是在内存中完成
二级索引过滤granularity。从磁盘上读取col4，对granularity再次进行过滤。这个会进行磁盘的IO操作
prewhere其他条件过滤。如果prewhere还有其他的字段，就从磁盘上读取出来，再次进行granularity的过滤
读取其他所有需要的字段并进行final合并。读取select中的所有字段和where中要使用的字段，读取主键的所有字段，以及version字段，按version对数据进行merge操作
where过滤数据。使用col6字段进行过滤
对数据进行order by或者group操作返回数据

注意

上述只有第一步和第二步，即分区过滤和一级索引过滤，是在内存中完成的，其他均需要进行IO操作
需要注意final是在prewhere之后，where之前起作用
prewhere之后，final之前会读取当前sql所需要的所有字段

上一篇：Agile Initiative, Epic, and Story/Task

下一篇：Apache 神禹（shenyu）源码阅读（一）——Admin向Gateway的数据同步（Admin端）

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 03国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 09历年考研数学一、数学二、数学三真题试卷及答案PDF 102026开年大模型最新对比解析及场景落地指南