【技术选型】clickhouse vs starRocks

比对结论

如果只能单机部署的话,clickhouse基本无敌。

如果集群化,starRocks可以替换clickhouse,但支持的函数会相对少一些(clickhouse有不少自定义函数)

信息比对

功能 clickhouse starRocks
join 大表关联容易OOM 对join有相关优化
场景 比较适合大宽表 对于星形或者雪花模型的兼容性更好
并发性 大量短查询,每秒不超过100次 数千用户同时分析查询,部分场景是万级
数据导入更新 相对比较慢,更适合静态数据 秒级的数据导入和实时更新,提供准实时的服务
mysql兼容性 不完全 完全兼容
内置函数 非常丰富。支持窗口和聚合函数,以及table function 支持窗口和聚合函数
部署 单机版无敌,分布式相对不友好 默认分布式,这就意味着需要的资源更多
分布式 需要代码实现部分布式的能力。例如,建表需要先本地表在分布式表,可以类比于物化视图。且数据分布,需要手动分发,不支持自动处理 正常的分布式系统

参考文档

数据仓库系列:StarRocks的简单试用及与clickhouse的对比_starrocks clickhouse对比-CSDN博客
ClickHouse vs StarRocks 选型对比

性能比对

Star Schema Benchmark(以下简称 SSB)是学术界和工业界广泛使用的一个星型模型测试集,通过这个测试集合可以方便的对比各种 OLAP 产品的基础性能指标。ClickHouse 通过改写 SSB,将星型模型打平转化成宽表 (flat table),改造成了一个单表测试 benchmark。本报告记录了 StarRocks、ClickHouse 和 Apache Druid 在 SSB 单表数据集上的性能对比结果,测试结论如下:

  • 在标准测试数据集的 13 个查询上,StarRocks 整体查询性能是 ClickHouse 的 2.1 倍,Apache Druid 的 8.7 倍。
  • StarRocks 启用 Bitmap Index 后整体查询性能是未启用的 1.3 倍,此时整体查询性能是 ClickHouse 的 2.8 倍,Apache Druid 的 11.4 倍。

参考文档

SSB Flat Table 性能测试 | StarRocks

相关推荐
字节跳动数据平台10 小时前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康16 小时前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
字节跳动数据平台2 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术2 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康2 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康3 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天3 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
武子康5 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
武子康6 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP6 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet