ClickHouse的优缺点和应用场景

当业务场景需要一个大批量、快速的、可支持聚合运算的数据库,那么可选择ClickHouse。

选择ClickHouse 的原因:

  1. 记录类型类似于LOG,读取、运算远远大于写入操作
  2. 选取有限列,对近千万条数据,快算的运算出结果。
  3. 数据批量从ODPS表中同步,数据一致性容忍度高
  4. 支持复杂数据结构,例如Array,方便查询
  5. 数据成本越少越好

简单的Mysql、ClickHouse 性能对比:

ClickHouse的优点

1、只需要读取要计算的列数据,而非行式的整行数据读取,降低 IO cost。

2、同列同类型,有十倍压缩提升,进一步降低 IO。

3、Clickhouse 根据不同存储场景,做个性化搜索算法。

ClickHouse 的缺点

  • 不支持事物
  • 不支持Update/Delete操作
  • 支持有限操作系统(不支持win,PS:并不是大问题)

ClickHouse特点

  1. 真正的面向列的DBMS
  2. 数据高效压缩
  3. 磁盘存储的数据
  4. 多核并行处理
  5. 在多个服务器上分布式处理
  6. 支持SQL语法
  7. 向量化引擎
  8. 实时数据更新
  9. 支持索引
  10. 支持近似预估计算
  11. 支持嵌套的数据结构
  12. 支持数组作为数据类型
  13. 支持限制查询复杂性以及配额
  14. 复制数据复制和对数据完整性的支持
相关推荐
三块钱079427 分钟前
【原创】从s3桶将对象导入ES建立索引,以便快速查找文件
大数据·elasticsearch·搜索引擎·s3
拓端研究室TRL2 小时前
PyMC+AI提示词贝叶斯项目反应IRT理论Rasch分析篮球比赛官方数据:球员能力与位置层级结构研究
大数据·人工智能·python·算法·机器学习
漂流瓶6666663 小时前
如何搭建spark yarn 模式的集群
大数据·spark·eclipse
啊喜拔牙3 小时前
如何搭建spark yarn模式的集群
大数据·分布式·spark
春风不会绿大地4 小时前
Flink+Hologres搭建实时数仓
大数据·flink
Bob99985 小时前
Amlogic S905L3系列盒子 ROM DIY相关
java·javascript·数据仓库·vscode·eclipse·tomcat·vim
董可伦5 小时前
Flink HA 总结
大数据·flink
weixin_307779136 小时前
AWS Glue ETL设计与调度最佳实践
开发语言·数据仓库·云计算·etl·aws
不爱学英文的码字机器7 小时前
数字孪生的浪潮:从虚拟镜像到现实世界的 IT 变革
大数据·python
kaamelai7 小时前
Kaamel视角下的MCP安全最佳实践
大数据·人工智能·安全