【技术预研】StarRocks官方文档浅析(1)

背景说明

基于starRocks官方文档,对其内容进行一定解析,方便大家理解和使用。

若无特殊标注,startRocks版本是3.2。

下面的章节和官方文档保持一致。

参考文档

产品简介 | StarRocks

StarRocks

StarRocks 是一款高性能分析型数据仓库,使用向量化、MPP 架构、CBO、智能物化视图、可实时更新的列式存储引擎等技术实现多维、实时、高并发的数据分析。StarRocks 既支持从各类实时和离线的数据源高效导入数据,也支持直接分析数据湖上各种格式的数据。StarRocks 兼容 MySQL 协议,可使用 MySQL 客户端和常用 BI 工具对接。同时 StarRocks 具备水平扩展,高可用、高可靠、易运维等特性。广泛应用于实时数仓、OLAP 报表、数据湖分析等场景。

内容 说明
高性能分析型数据仓库 相比于oltp,更适合olap
向量化 基于CPU层级的优化(clickhouse有相关优化)
MPP 架构 相比于hadoop架构更适合olap
CBO 优化多表join的执行时,starRocks内部的执行先后顺序
智能物化视图 用于实现单表的实时数据转换,类似clickhouse的物化视图
可实时更新的列式存储引擎 可支持实时update
兼容 MySQL 可使用mysql相关语法和client工具

产品介绍

什么是 StarRocks

新一代极速全场景 MPP (Massively Parallel Processing) 数据库
数据分析变得更加简单和敏捷
查询速度(尤其是多表关联查询)远超同类产品

上述是描述中的关键词,可以看出来starRocks的定位。功能比较完成的MPP数据库,在多表关联有优势,其他方面至少持平。

适用场景:olap多维分析、实时数据仓库、高并发查询、统一分析

系统架构

这里暂时不展开说,就是两种模式。正常就是存算一体,就是starRocks还是标准的数据库。3.0以后支持存算分离,就是starRocks只是作为计算框架,已经不是正常的数据库了。

产品特性

这里的内容和最开始的说明差不多。多出来的数据湖分析,相当于存算分离的应用的场景。

  • MPP 分布式执行框架
  • 全面向量化执行引擎
  • 存储计算分离
  • CBO 优化器
  • 可实时更新的列式存储引擎
  • 智能的物化视图
  • 数据湖分析

快速开始

使用 Docker 部署 StarRocks

不是一个标准安装,只是入门使用,用于尝试下面的创建表、导入和查询数据。

只安装了一个FE和BE,简单说不是集群模式。

创建表

从登录、创建数据库、创建表、修改表等常用功能都包含,可以用来熟悉。

导入和查询数据

提供5种导入方式,以及简单查询。

项目协助

社区聊天

指向starrocks.slack.com

部署StarRocks

前期准备

说明需要的CPU、内存、存储、网络、操作系统等信息,以及FE、BE、CN的配置说明。

环境检查的相关的命令,以及如何获取部署文件。

存算一体模式部署

三种安装模式。一是手动自己安装,二是基于starRocks的管理工具,三是基于k8s的管理工具。

存算分离模式部署

基于不同存储介质的部署,包含S3、GCS、Blob、MinIO、HDFS等。

后期管理

部署后的设置信息。

如何升级和回滚版本。

相关推荐
Mr_Xuhhh8 分钟前
信号与槽的总结
java·开发语言·数据库·c++·qt·系统架构
Fireworkitte11 分钟前
Redis 源码 tar 包安装 Redis 哨兵模式(Sentinel)
数据库·redis·sentinel
qq_3392822344 分钟前
postgressql 如何修改模式的所有表的所有者
数据库
zskj_zhyl1 小时前
智慧养老丨从依赖式养老到自主式养老:如何重构晚年生活新范式
大数据·人工智能·物联网
西岭千秋雪_1 小时前
Redis性能优化
数据库·redis·笔记·学习·缓存·性能优化
极限实验室2 小时前
INFINI Labs 产品更新 | INFINI Console 1.29.6 发布 – 优化监控图表异常毛刺等
数据库·产品
先睡2 小时前
优化MySQL查询
数据库·sql
哲科软件2 小时前
从“电话催维修“到“手机看进度“——售后服务系统开发如何重构客户体验
大数据·智能手机·重构
zzywxc7872 小时前
AI 正在深度重构软件开发的底层逻辑和全生命周期,从技术演进、流程重构和未来趋势三个维度进行系统性分析
java·大数据·开发语言·人工智能·spring