ClickHouse的优缺点和应用场景

当业务场景需要一个大批量、快速的、可支持聚合运算的数据库,那么可选择ClickHouse。

选择ClickHouse 的原因:

  1. 记录类型类似于LOG,读取、运算远远大于写入操作
  2. 选取有限列,对近千万条数据,快算的运算出结果。
  3. 数据批量从ODPS表中同步,数据一致性容忍度高
  4. 支持复杂数据结构,例如Array,方便查询
  5. 数据成本越少越好

简单的Mysql、ClickHouse 性能对比:

ClickHouse的优点

1、只需要读取要计算的列数据,而非行式的整行数据读取,降低 IO cost。

2、同列同类型,有十倍压缩提升,进一步降低 IO。

3、Clickhouse 根据不同存储场景,做个性化搜索算法。

ClickHouse 的缺点

  • 不支持事物
  • 不支持Update/Delete操作
  • 支持有限操作系统(不支持win,PS:并不是大问题)

ClickHouse特点

  1. 真正的面向列的DBMS
  2. 数据高效压缩
  3. 磁盘存储的数据
  4. 多核并行处理
  5. 在多个服务器上分布式处理
  6. 支持SQL语法
  7. 向量化引擎
  8. 实时数据更新
  9. 支持索引
  10. 支持近似预估计算
  11. 支持嵌套的数据结构
  12. 支持数组作为数据类型
  13. 支持限制查询复杂性以及配额
  14. 复制数据复制和对数据完整性的支持
相关推荐
数据皮皮侠1 小时前
最新上市公司业绩说明会文本数据(2017.02-2025.08)
大数据·数据库·人工智能·笔记·物联网·小程序·区块链
计算机毕设-小月哥3 小时前
完整源码+技术文档!基于Hadoop+Spark的鲍鱼生理特征大数据分析系统免费分享
大数据·hadoop·spark·numpy·pandas·计算机毕业设计
Jinkxs3 小时前
AI重塑金融风控:从传统规则到智能模型的信贷审批转型案例
大数据·人工智能
时序数据说10 小时前
时序数据库市场前景分析
大数据·数据库·物联网·开源·时序数据库
2501_9301040415 小时前
GitCode 疑难问题诊疗:全方位指南
大数据·elasticsearch·gitcode
健康平安的活着15 小时前
es7.17.x es服务yellow状态的排查&查看节点,分片状态数量
大数据·elasticsearch·搜索引擎
念念010715 小时前
基于MATLAB多智能体强化学习的出租车资源配置优化系统设计与实现
大数据·人工智能·matlab
苛子16 小时前
iPaaS、ETL、数据集成平台是什么?三者是什么关系?
数据仓库·etl
sunxinyu17 小时前
曲面/线 拟合gnuplot
大数据·线性回归·数据处理·数据拟合·二维三维空间数据
专注API从业者18 小时前
基于 Flink 的淘宝实时数据管道设计:商品详情流式处理与异构存储
大数据·前端·数据库·数据挖掘·flink