ClickHouse的优缺点和应用场景

当业务场景需要一个大批量、快速的、可支持聚合运算的数据库,那么可选择ClickHouse。

选择ClickHouse 的原因:

  1. 记录类型类似于LOG,读取、运算远远大于写入操作
  2. 选取有限列,对近千万条数据,快算的运算出结果。
  3. 数据批量从ODPS表中同步,数据一致性容忍度高
  4. 支持复杂数据结构,例如Array,方便查询
  5. 数据成本越少越好

简单的Mysql、ClickHouse 性能对比:

ClickHouse的优点

1、只需要读取要计算的列数据,而非行式的整行数据读取,降低 IO cost。

2、同列同类型,有十倍压缩提升,进一步降低 IO。

3、Clickhouse 根据不同存储场景,做个性化搜索算法。

ClickHouse 的缺点

  • 不支持事物
  • 不支持Update/Delete操作
  • 支持有限操作系统(不支持win,PS:并不是大问题)

ClickHouse特点

  1. 真正的面向列的DBMS
  2. 数据高效压缩
  3. 磁盘存储的数据
  4. 多核并行处理
  5. 在多个服务器上分布式处理
  6. 支持SQL语法
  7. 向量化引擎
  8. 实时数据更新
  9. 支持索引
  10. 支持近似预估计算
  11. 支持嵌套的数据结构
  12. 支持数组作为数据类型
  13. 支持限制查询复杂性以及配额
  14. 复制数据复制和对数据完整性的支持
相关推荐
源码之家1 小时前
基于python新闻数据分析可视化系统 Hadoop 新闻平台 爬虫 情感分析 舆情分析 可视化 Django框架 vue框架 机器学习 大数据毕业设计✅
大数据·爬虫·python·数据分析·毕业设计·情感分析·新闻
原神启动11 小时前
云计算大数据——shell教程(三剑客之sed)
大数据
小高学习java2 小时前
Canal、Elasticsearch、RabbitMq构建高可用、高性能的异构数据同步方案(亲测可用!!!!)
大数据·elasticsearch·rabbitmq·java-rabbitmq
_OP_CHEN2 小时前
算法基础篇:(十二)基础算法之倍增思想:从快速幂到大数据运算优化
大数据·c++·算法·acm·算法竞赛·倍增思想
武子康3 小时前
大数据-159 Apache Kylin Cube 实战:Hive 装载与预计算加速(含 Cuboid/实时 OLAP,Kylin 4.x)
大数据·后端·apache kylin
lisw053 小时前
边缘计算与云计算!
大数据·人工智能·机器学习·云计算·边缘计算
森语林溪3 小时前
数据“洪灾”变“水利”——古人“格物致知”的大数据实践
大数据
Hello.Reader4 小时前
Flink CDC 用 Db2 CDC 实时同步数据到 Elasticsearch
大数据·elasticsearch·flink
老蒋新思维4 小时前
创客匠人 2025 高峰论谈(11.22-25):AI 智能体重构创始人 IP 打造与知识变现的管理逻辑
大数据·网络·人工智能·网络协议·tcp/ip·重构·知识付费
TDengine (老段)6 小时前
TDengine 字符串函数 TO_BASE64 用户手册
android·大数据·服务器·物联网·时序数据库·tdengine·涛思数据