clickhouse 各个引擎适用的场景

1. MergeTree - 最常用的引擎

场景:网站访问日志分析

sqlCREATE TABLE website_logs (

date Date,

user_id UInt32,

page_url String,

visit_time DateTime

) ENGINE = MergeTree()

PARTITION BY toYYYYMM(date)

ORDER BY (user_id, date);

现实例子:就像一个图书馆的借书记录,按时间分区(每月一个文件夹),按用户ID排序,方便快速查找某个用户的借书历史。

2. ReplacingMergeTree - 去重引擎

场景:用户资料表(会更新)

sqlCREATE TABLE user_profiles (

user_id UInt32,

name String,

phone String,

updated_at DateTime

) ENGINE = ReplacingMergeTree(updated_at)

ORDER BY user_id;

现实例子:像员工档案柜,每个员工只能有一份最新的档案。如果员工信息更新了,旧的档案会被新的替换掉。

3. SummingMergeTree - 自动求和引擎

场景:销售数据统计

sqlCREATE TABLE daily_sales (

date Date,

product_id UInt32,

sales_amount Float64

) ENGINE = SummingMergeTree()

ORDER BY (date, product_id);

现实例子:像收银台的小票汇总,同一天同一商品的多次销售会自动加起来,最终得到每日每商品的总销售额。

4. AggregatingMergeTree - 聚合引擎

场景:用户行为指标统计

sqlCREATE TABLE user_metrics (

date Date,

user_id UInt32,

page_views AggregateFunction(sum, UInt64),

unique_pages AggregateFunction(uniq, String)

) ENGINE = AggregatingMergeTree()

ORDER BY (date, user_id);

现实例子:像健身房的会员运动记录统计表,自动计算每个会员每天的总运动时间、使用过的不同器械数量等指标。

5. CollapsingMergeTree - 折叠引擎

场景:订单状态变化记录

sqlCREATE TABLE order_changes (

order_id UInt32,

status String,

amount Float64,

sign Int8 -- 1表示新增,-1表示撤销

) ENGINE = CollapsingMergeTree(sign)

ORDER BY order_id;

现实例子:像银行账户的交易记录,如果一笔交易被撤销,会插入一条相反的记录来抵消原交易,最终余额是正确的。

6. VersionedCollapsingMergeTree - 版本化折叠引擎

场景:商品价格变化历史

sqlCREATE TABLE product_prices (

product_id UInt32,

price Float64,

version UInt64,

sign Int8

) ENGINE = VersionedCollapsingMergeTree(sign, version)

ORDER BY (product_id, version);

现实例子:像商品价格标签的更新历史,每次改价都有版本号,可以追踪价格变化轨迹,错误的价格记录可以被正确版本覆盖。

7. GraphiteMergeTree - 时序数据引擎

场景:服务器监控指标

sqlCREATE TABLE server_metrics (

metric_name String,

timestamp UInt32,

value Float64

) ENGINE = GraphiteMergeTree('graphite_rollup')

ORDER BY (metric_name, timestamp);

现实例子:像医院的心电监护仪,记录病人的心率、血压等生命体征,旧数据会按规则自动聚合(比如每分钟的数据合并成每小时的平均值)。

8. Memory - 内存引擎

场景:临时计算表

sqlCREATE TABLE temp_calculations (

id UInt32,

result Float64

) ENGINE = Memory;

现实例子:像计算器的临时结果,数据存在内存中,计算完就清空,重启后就没了。

9. Distributed - 分布式引擎

场景:大规模数据分析

sqlCREATE TABLE global_sales (

date Date,

region String,

sales Float64

) ENGINE = Distributed(cluster_name, database_name, local_table_name, rand());

现实例子:像连锁超市的总部系统,可以查询全国各个分店的销售数据,数据实际存储在各地的服务器上,但查询时像一张大表。

选择建议

日志分析、报表 → MergeTree

用户资料、配置信息 → ReplacingMergeTree

销售统计、计数器 → SummingMergeTree

复杂指标统计 → AggregatingMergeTree

状态变化追踪 → CollapsingMergeTree

监控指标 → GraphiteMergeTree

临时计算 → Memory

多机房部署 → Distributed

相关推荐
做cv的小昊16 分钟前
【TJU】研究生应用统计学课程笔记(6)——第二章 参数估计(2.4 区间估计)
人工智能·笔记·线性代数·算法·机器学习·数学建模·概率论
Echo_NGC223728 分钟前
【论文解读】Attention Is All You Need —— AI 时代的“开山之作“,经典中的经典(transformer小白导读)
人工智能·python·深度学习·神经网络·机器学习·conda·transformer
一切皆是因缘际会33 分钟前
下一代 AI 架构:基于记忆演化与单向投影的安全智能系统
大数据·人工智能·深度学习·算法·安全·架构
falldeep39 分钟前
五分钟了解OpenClaw底层架构
人工智能·算法·机器学习·架构
FserSuN41 分钟前
Machine Learning Specialization - Week 1, 1-8学习总结
人工智能·学习·机器学习
weixin_446260851 小时前
模型能力深度对决:GPT-4o、Claude 3.5和DeepSeek V系列模型的横向评测与未来趋势洞察
人工智能·算法·机器学习
逸Y 仙X1 小时前
文章十八:Elasticsearch 多条件组合查询实战运用
大数据·elasticsearch·搜索引擎
Mr数据杨1 小时前
泰坦尼克乘客生存预测与风险决策建模
机器学习·数据分析·kaggle
weixin_307779131 小时前
云计算大数据Azure服务分类详解
大数据·分类·自动化·云计算·azure
jason成都1 小时前
jetlinks社区版本扩展-TDengine
大数据·时序数据库·tdengine