ClickHouse的优缺点和应用场景

当业务场景需要一个大批量、快速的、可支持聚合运算的数据库,那么可选择ClickHouse。

选择ClickHouse 的原因:

  1. 记录类型类似于LOG,读取、运算远远大于写入操作
  2. 选取有限列,对近千万条数据,快算的运算出结果。
  3. 数据批量从ODPS表中同步,数据一致性容忍度高
  4. 支持复杂数据结构,例如Array,方便查询
  5. 数据成本越少越好

简单的Mysql、ClickHouse 性能对比:

ClickHouse的优点

1、只需要读取要计算的列数据,而非行式的整行数据读取,降低 IO cost。

2、同列同类型,有十倍压缩提升,进一步降低 IO。

3、Clickhouse 根据不同存储场景,做个性化搜索算法。

ClickHouse 的缺点

  • 不支持事物
  • 不支持Update/Delete操作
  • 支持有限操作系统(不支持win,PS:并不是大问题)

ClickHouse特点

  1. 真正的面向列的DBMS
  2. 数据高效压缩
  3. 磁盘存储的数据
  4. 多核并行处理
  5. 在多个服务器上分布式处理
  6. 支持SQL语法
  7. 向量化引擎
  8. 实时数据更新
  9. 支持索引
  10. 支持近似预估计算
  11. 支持嵌套的数据结构
  12. 支持数组作为数据类型
  13. 支持限制查询复杂性以及配额
  14. 复制数据复制和对数据完整性的支持
相关推荐
专注数据的痴汉27 分钟前
「数据获取」《中国商务年鉴》(2004-2024)
大数据·人工智能·信息可视化
一只小青团36 分钟前
Hadoop之javaAPI写HDFS的shell命令
大数据·hadoop·分布式
泰克教育官方账号1 小时前
泰涨知识 | 10分钟快速入门Hive之基本操作篇
数据仓库·hive·hadoop
天下无敌笨笨熊1 小时前
ES作为向量库研究
大数据·python·elasticsearch
paperxie_xiexuo4 小时前
如何用自然语言生成科研图表?深度体验PaperXie AI科研绘图模块在流程图、机制图与结构图场景下的实际应用效果
大数据·人工智能·流程图·大学生
旗讯数字5 小时前
旗讯 OCR 技术解析:金融行业手写表格识别方案与系统集成实践
大数据·金融·ocr
2501_9414043116 小时前
绿色科技与可持续发展:科技如何推动环境保护与资源管理
大数据·人工智能