ClickHouse的优缺点和应用场景

当业务场景需要一个大批量、快速的、可支持聚合运算的数据库,那么可选择ClickHouse。

选择ClickHouse 的原因:

  1. 记录类型类似于LOG,读取、运算远远大于写入操作
  2. 选取有限列,对近千万条数据,快算的运算出结果。
  3. 数据批量从ODPS表中同步,数据一致性容忍度高
  4. 支持复杂数据结构,例如Array,方便查询
  5. 数据成本越少越好

简单的Mysql、ClickHouse 性能对比:

ClickHouse的优点

1、只需要读取要计算的列数据,而非行式的整行数据读取,降低 IO cost。

2、同列同类型,有十倍压缩提升,进一步降低 IO。

3、Clickhouse 根据不同存储场景,做个性化搜索算法。

ClickHouse 的缺点

  • 不支持事物
  • 不支持Update/Delete操作
  • 支持有限操作系统(不支持win,PS:并不是大问题)

ClickHouse特点

  1. 真正的面向列的DBMS
  2. 数据高效压缩
  3. 磁盘存储的数据
  4. 多核并行处理
  5. 在多个服务器上分布式处理
  6. 支持SQL语法
  7. 向量化引擎
  8. 实时数据更新
  9. 支持索引
  10. 支持近似预估计算
  11. 支持嵌套的数据结构
  12. 支持数组作为数据类型
  13. 支持限制查询复杂性以及配额
  14. 复制数据复制和对数据完整性的支持
相关推荐
洛克大航海18 分钟前
Ubuntu安装Hbase
大数据·linux·数据库·ubuntu·hbase
GIOTTO情1 小时前
媒介宣发的技术革命:Infoseek如何用AI重构企业传播全链路
大数据·人工智能·重构
ApacheSeaTunnel2 小时前
新兴数据湖仓手册·从分层架构到数据湖仓架构(2025):数据仓库分层的概念与设计
大数据·数据仓库·开源·数据湖·dataops·白鲸开源·底层技术
落雪财神意2 小时前
股指10月想法
大数据·人工智能·金融·区块链·期股
柳贯一(逆流河版)2 小时前
ElasticSearch 实战:全文检索与数据聚合分析的完整指南
大数据·elasticsearch·全文检索
白鲸开源2 小时前
最佳实践:基于Apache SeaTunnel从MySQL同步到PostgreSQL
大数据·mysql·postgresql
QYResearch3 小时前
2025年全球移动变电站市场占有率及行业竞争格局分析报告
大数据
字节跳动数据平台3 小时前
为何底层数据湖决定了 AI Agent 的上限?
大数据
QYResearch3 小时前
自主机器人扫雪机行业现状与分析
大数据
数据与人工智能律师8 小时前
解码Web3:DeFi、GameFi、SocialFi的法律风险警示与合规路径
大数据·网络·人工智能·云计算·区块链