clickhouse

memgLIFE2026-01-30 13:21

分片副本表结构

PARTITION BY toYYYYMM(time) 按日期分区，每月一个分区

排序键设计完整：覆盖了主要查询维度

ReplacingMergeTree 避免重复统计

核心组件比喻
节点（Node）
相当于一个仓库，可以存储货物（数据），并且能自己处理打包、查询任务。
比如你在全国有 10 个仓库，每个仓库就是一个节点。
分片（Shard）
假设你的订单数据量太大，一个仓库放不下，于是你把数据按规则拆分。
例如：按客户所在省份分片，北京的数据放在分片1，上海的数据放在分片2。
每个分片可能由一个或多个仓库（节点）负责。

副本（Replica）

为了防止某个仓库着火或宕机导致数据丢失，你在另一个地方建立备份仓库，存一模一样的数据。
比如北京分片的数据，除了仓库A存一份，还在仓库B存一份完全相同的。
A 是主副本，B 是副本，它们互为副本。
ClickHouse 就是：
把大数据分片存储（并行处理查询更快）
每个分片有副本（高可用、可负载均衡）
所有节点组成一个集群，对外像一个整体数据库。
视图
引用 clicks 的数据

SETTINGS index_granularity = 8192 详解
8192 = 2¹³ 每个颗粒大小 ≈ 8192行 × 平均行大小
什么是 Granularity（粒度）？
在 ClickHouse 中，数据在磁盘上按颗粒（granule）存储
每个颗粒是物理上连续存储的一组行
index_granularity = 8192 表示：每个索引颗粒包含 8192 行数据

上一篇：一维热传导方程的PINN求解——损失函数实时绘制

下一篇：【Linux 实战】Makefile 自动化构建进阶：静态库 / 动态库通用模板（一键编译 + 系统安装）

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 09微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 102026 年 AI 大模型 & AI 编程工具实战全总结