【StarRocks-1.简介】

一、简介:

starRocks起源于开源软件Doris,其相对Doris的社区环境,starRcoks有商业团队维护、快速版本迭代和dockerHub高支持,让我在生产环境中更加偏向于starRocks,而不是拥抱Doris开源社区。StarRocks的版本更新速度、学习文档和论坛都让小白更加容易入手。性能上StarRocks和Doris相差不大,功能性上还是有些差异,具体参照官网。

二、特性:

  • 1.MMP分布式执行
    通过分布式、分区、分桶将数据小粒度化,然后通过高并发的去并行计算相关小粒度分区或分桶文件。先分而治之存储,再通过多机资源高并发加速查询。(对高并发查询是否有和CK一样缺陷?)
  • 2.全面向量化执行引擎
    简单叙述下全面向量执行引擎的优势:
    • 向量化数据处理:就是列存储比行级存储更加高效
    • 批处理:批处理方式处理查询,而不是逐条处理,减少开销高效并行
    • 谓词下推和过滤:能将谓词下推到存储层,减少数据量
    • 内存策略,批量内存分配,减少了内存分配和释放的开销
  • 3.存算分离
  • 4.CBO 优化器

三、应用场景:

starRocks一般的定位都是实时数仓,它的应用场景和它的数据模型有着密不可分的关系。类似CK的引擎,starRocks也具备明细模型 (常用于存储历史数据,不更新数据业务场景)、聚合模型 (针对指标聚合的业务场景)、更新模型 (实时频繁更新业务场景)、主键模型(主键不重复,通过主键修改数据),四大模型使StarRocks支持更多的业务场景。

四、竞品对比:CK与starRocks

  • 1.性能:
    测试集:非官网的流量数据,上亿级别的单表与千万级的多张表。
    资源:非SSD磁盘、128g内存、32核CPU
    结果:
    大单表:CK的导入、查询速率都是超过StarRocks的,但是后期集群数量的增加,StarRocks的查询速率得到了提升(感觉StarRocks的分布式调度能力比CK强)。
    多表查询:starRocks的多表JOIN查询能力还是比CK有明显优势。
  • 2.功能:
    starRocks的功能还在迭代开发,其在函数与第三方组件支持上还有待进一步的发展。(更新速度还是可以的)
  • 3.运维:
    这个维度是StarRocks碾压CK,节点弹性扩展、数据自动负载、副本自动修复、优秀的web-ui、Mysql语法等,让我这种运维+开发人员很是受用。

五、选型

小集群非联表还是CK,反之StarRocks

相关推荐
鸿乃江边鸟3 天前
Starrocks的Bitmap索引和Bloom filter索引以及全局字典
大数据·starrocks·sql
StarRocks_labs7 天前
StarRocks 助力首汽约车精细化运营
大数据·数据库·starrocks·spark·数据查询·存算分离
不确定性确定你我7 天前
使用 kind 创建 K8s 集群并部署 StarRocks 的完整指南
starrocks·云原生·kubernetes·部署·kind
Double@加贝15 天前
StarRocks的执行计划和Profile
大数据·starrocks
ssxueyi15 天前
StarRocks 部署:依赖环境
服务器·数据库·starrocks·php
鸿乃江边鸟17 天前
StarRocks 中 CURRENT_TIMESTAMP 和 CURRENT_TIME 分区过滤问题
大数据·starrocks·sql
StarRocks_labs19 天前
【活动回顾】StarRocks Singapore Meetup #2 @Shopee
数据库·starrocks·数据分析·spark·olap·物化视图·apache druid
镜舟科技20 天前
Apache Iceberg 解析,一文了解Iceberg定义、应用及未来发展
starrocks·数据分析·apache·iceberg·数据湖·湖仓一体·元数据