Clickhouse物化视图进阶：Projection

派大星的海洋ku2024-03-29 14:41

前言

Projection是clickhouse 21.6版本才有的新特性，要使用projection需更新至最新版本

概念

Projection概念由C-Store提出，并在Vertica数据库中落地发展(不同于SQL中的Projection运算) Projections是一组列的集合，使用建表语句定义 Projections按照不同的顺序存储数据，用以优化多样的查询 Vertica扩展Projection支持使用部分聚合函数进行数据上卷优化
ClickHouse Projection沿袭该设计并进行优化 支持使用任意函数存储并自由组合参与数据上卷运算 支持Projection与原始明细表的联合查询

特点

SELECT,INSERT,UPDATE,DELETE等操作的一致性保障
查询无需任何改动，自动匹配最优Projection进行计算
可直接通过待优化的查询进行定义，并自动泛化匹配其他查询

缺陷

无法跨Part聚合
无法脱离原始表存储，无法使用不同的生命周期与存储介质配置
不支持JOINS

分类

Projection主要分为两种：normal 与aggregate

使用查询定义Projection，新建的Projection仅影响后续的写入数据
对历史数据构建Projection需要进行Materialize操作
查询无需任何改动即可使用Projection优化
可对单表增加多个Projection，查询将择优使用

如何选择正确地Projection

对每一个候选进行索引分析，得出其预期数据扫描量，并缓存结果
选择预期扫描数据最少的候选： a. 不用区分projection类型是normal或aggregate，数据量少则优 b. 预期扫描量同时包含了projection的物化程度 c. 尽可能复用缓存结果，避免重复进行索引分析
当最终选择某个projection 后，将利用前述的回溯分析过程重建查询计划，并同时满足projection parts 和ordinary parts的读取与计算

Clickhouse物化视图痛点

Clickhouse按照LSM树的结构存储数据

仅支持一种列排序方式 Order By（uid,pid）无法优化pid的查询; Z-Curve索引支持近邻查询，但索引效率整体下滑; Skip-index在召回率高的数据分布中表现很差;
OLAP预聚合模型需要手动参与设计预聚合存储AggregatingMergeTree仅支持一种预聚合方式; 查询需要改写方可使用预聚合数据，用户体验差; 明细数据不复存在，无法解决实时明细混合分析需求;
clickhouse物化视图无一致性保障

Projection使用通用的机制完备地解决了前述三大问题

Projection可按照不同的列进行数据重排
Projection可使用聚合查询直接定义预聚合模型
Projection查询分析能自动选择最优Projection进行查询优化，无需改写查询
Projection在任时刻针对任一数据变换操作均提供一致性保证

Projection的一致性保障

Insert操作：当数据块写入时，其作为数据源向所有定义的Projections提供输入，形成Projection Parts，最终和原始数据合并构建出带有projection 的part数据目录
Select操作：当查询命中某一Projection时,形成的查询计划将确保所有数据产生符合预期的结果。针对缺失Projection Parts的数据，将在运行时动态构建并在不引入额外计算开销的前提下与其余数据合并
Mutation操作： Projection在定义时记录了其关联依赖的原始列信息。当对应的列发生变化时，所有相关的Projection将被重新物化，形成的新Part将包含一致的ProjectionPart进行原子提交

上一篇：揭秘 MyBatis Plus：如何无痛扩展 MyBatis 和实现自动化 CRUD

下一篇：现代化应用部署工具-Docker

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI科技热点日报 | 2026年07月01日 06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 09幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 102026 年 AI 大模型 & AI 编程工具实战全总结