【技术选型】clickhouse vs starRocks

比对结论

如果只能单机部署的话,clickhouse基本无敌。

如果集群化,starRocks可以替换clickhouse,但支持的函数会相对少一些(clickhouse有不少自定义函数)

信息比对

功能 clickhouse starRocks
join 大表关联容易OOM 对join有相关优化
场景 比较适合大宽表 对于星形或者雪花模型的兼容性更好
并发性 大量短查询,每秒不超过100次 数千用户同时分析查询,部分场景是万级
数据导入更新 相对比较慢,更适合静态数据 秒级的数据导入和实时更新,提供准实时的服务
mysql兼容性 不完全 完全兼容
内置函数 非常丰富。支持窗口和聚合函数,以及table function 支持窗口和聚合函数
部署 单机版无敌,分布式相对不友好 默认分布式,这就意味着需要的资源更多
分布式 需要代码实现部分布式的能力。例如,建表需要先本地表在分布式表,可以类比于物化视图。且数据分布,需要手动分发,不支持自动处理 正常的分布式系统

参考文档

数据仓库系列:StarRocks的简单试用及与clickhouse的对比_starrocks clickhouse对比-CSDN博客
ClickHouse vs StarRocks 选型对比

性能比对

Star Schema Benchmark(以下简称 SSB)是学术界和工业界广泛使用的一个星型模型测试集,通过这个测试集合可以方便的对比各种 OLAP 产品的基础性能指标。ClickHouse 通过改写 SSB,将星型模型打平转化成宽表 (flat table),改造成了一个单表测试 benchmark。本报告记录了 StarRocks、ClickHouse 和 Apache Druid 在 SSB 单表数据集上的性能对比结果,测试结论如下:

  • 在标准测试数据集的 13 个查询上,StarRocks 整体查询性能是 ClickHouse 的 2.1 倍,Apache Druid 的 8.7 倍。
  • StarRocks 启用 Bitmap Index 后整体查询性能是未启用的 1.3 倍,此时整体查询性能是 ClickHouse 的 2.8 倍,Apache Druid 的 11.4 倍。

参考文档

SSB Flat Table 性能测试 | StarRocks

相关推荐
Lansonli35 分钟前
大数据Spark(六十一):Spark基于Standalone提交任务流程
大数据·分布式·spark
Rverdoser2 小时前
电脑硬盘分几个区好
大数据
傻啦嘿哟2 小时前
Python 数据分析与可视化实战:从数据清洗到图表呈现
大数据·数据库·人工智能
Theodore_10222 小时前
大数据(2) 大数据处理架构Hadoop
大数据·服务器·hadoop·分布式·ubuntu·架构
簌簌曌3 小时前
CentOS7 + JDK8 虚拟机安装与 Hadoop + Spark 集群搭建实践
大数据·hadoop·spark
斯特凡今天也很帅3 小时前
clickhouse常用语句汇总——持续更新中
数据库·sql·clickhouse
Theodore_10225 小时前
大数据(1) 大数据概述
大数据·hadoop·数据分析·spark·hbase
Aurora_NeAr5 小时前
Apache Spark详解
大数据·后端·spark
IvanCodes7 小时前
六、Sqoop 导出
大数据·hadoop·sqoop