ClickHouse表引擎概述
表引擎的功能:
Ø 数据的存储方式 Ø 数据的存储位置
Ø 是否可以使用索引 Ø 是否可以使用分区
Ø 是否支持数据副本 Ø 并发数据访问
ClickHouse在建表时必须指定表引擎。
表引擎主要分为四大类:MergeTree系列、Log系列、与其他存储/处理系统集成引擎、特定功能的引擎, 每类引擎包含了多个具体的引擎,每种引擎均有其使用的场景。
1、MergeTree系列引擎(MergeTree表引擎介绍)
适用于高负载任务的最通用和功能最强大的表引擎。可以快速插入数据并进行后续的
后台数据处理。支持数据复制(使用Replicated* 的引擎版本)、分区和其他引擎不支持
的特性。
MergeTree系列的引擎有:
- MergeTree
- ReplacingMergeTree
- SummingMergeTree
- AggregatingMergeTree
- CollapsingMergeTree
- VersionedCollapsingMergeTree
- GraphiteMergeTree
2、Log系列引擎
具有最小功能的轻量级引擎。用于将数据快速写入大量小表(低于100万行)并整体
读取的场景。
Log系列的引擎有:
- TinyLog
- StripeLog
- Log
3、集成引擎
集成引擎集成第三方的存储和系统来读写数据,ClickHouse本身不存储数据。集成引擎包含:
- Kafka
- MySQL
- ODBC
- JDBC
- HDFS
4、特定功能的引擎
该类引擎实现了某些特定的功能。
该类引擎包含:
- Distributed
- MaterializedView
- Dictionary
- Merge
- File
- Null
- Set
- Join
- URL
- View
- Memory
- Buffer