clickhouse 查询优化思路

wending-Y2024-12-20 3:00

最重要的是要学会看懂explain ，尤其是下推
创建表时，可以选择表为分布式表。
多个表join ，创建表时根据join 字段,进行分片，让数据在同一个节点进行join ，提高join 效率。
多个表join , 通过创建物化视图的方式，以空间换时间的方法，提前把两个表的数据写到一起，不过这会有一会总量，源表的修改和删除不会同步到物化视图的数据里。
多个表join,如果其它表数据量和字段比较少的情况下，可以直接写成一个大宽表。
多个表join,可以考虑下join 顺序，防止中间结果过大
对于分页场景，有一个思路是，先只把id找出来，然后再根据id去找其他字段，这是因为复杂的查询分页语句，查询会导致全量检索数据做很多计算。

bash 复制代码

select 
id,create_time
from 
table
order by create_time
limit 20 ,0

对于单条记录的检索，虽然ck不擅长这种检索，但是可以通过跳数索引的方式，也可以过滤大量的数据，提高检索效率。
可以通过分区字段进行过滤。
对于一些下推失败的话，可以把外层的下推条件，下推到查询语句里面。
对于不必要的字段减少查询，尤其是对于列式数据库来说。
使用prewhere 可以提前在读数据层面做一些过滤。
可以把历史数据提前做一步汇总，然后再union 当天的数据。

上一篇：Message Processing With Spring Integration高级应用：自定义消息通道与端点

下一篇：MicroPython+ESP32：一.开发环境的搭建

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03如何新建文件夹？电脑新建文件夹的4种方法 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05AI科技热点日报 | 2026年07月01日 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？09Kimi K3 真实体验：全网评价整理，优缺点一次性说清楚 10微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新