【技术预研】StarRocks官方文档浅析(1)

背景说明

基于starRocks官方文档,对其内容进行一定解析,方便大家理解和使用。

若无特殊标注,startRocks版本是3.2。

下面的章节和官方文档保持一致。

参考文档

产品简介 | StarRocks

StarRocks

StarRocks 是一款高性能分析型数据仓库,使用向量化、MPP 架构、CBO、智能物化视图、可实时更新的列式存储引擎等技术实现多维、实时、高并发的数据分析。StarRocks 既支持从各类实时和离线的数据源高效导入数据,也支持直接分析数据湖上各种格式的数据。StarRocks 兼容 MySQL 协议,可使用 MySQL 客户端和常用 BI 工具对接。同时 StarRocks 具备水平扩展,高可用、高可靠、易运维等特性。广泛应用于实时数仓、OLAP 报表、数据湖分析等场景。

内容 说明
高性能分析型数据仓库 相比于oltp,更适合olap
向量化 基于CPU层级的优化(clickhouse有相关优化)
MPP 架构 相比于hadoop架构更适合olap
CBO 优化多表join的执行时,starRocks内部的执行先后顺序
智能物化视图 用于实现单表的实时数据转换,类似clickhouse的物化视图
可实时更新的列式存储引擎 可支持实时update
兼容 MySQL 可使用mysql相关语法和client工具

产品介绍

什么是 StarRocks

新一代极速全场景 MPP (Massively Parallel Processing) 数据库
数据分析变得更加简单和敏捷
查询速度(尤其是多表关联查询)远超同类产品

上述是描述中的关键词,可以看出来starRocks的定位。功能比较完成的MPP数据库,在多表关联有优势,其他方面至少持平。

适用场景:olap多维分析、实时数据仓库、高并发查询、统一分析

系统架构

这里暂时不展开说,就是两种模式。正常就是存算一体,就是starRocks还是标准的数据库。3.0以后支持存算分离,就是starRocks只是作为计算框架,已经不是正常的数据库了。

产品特性

这里的内容和最开始的说明差不多。多出来的数据湖分析,相当于存算分离的应用的场景。

  • MPP 分布式执行框架
  • 全面向量化执行引擎
  • 存储计算分离
  • CBO 优化器
  • 可实时更新的列式存储引擎
  • 智能的物化视图
  • 数据湖分析

快速开始

使用 Docker 部署 StarRocks

不是一个标准安装,只是入门使用,用于尝试下面的创建表、导入和查询数据。

只安装了一个FE和BE,简单说不是集群模式。

创建表

从登录、创建数据库、创建表、修改表等常用功能都包含,可以用来熟悉。

导入和查询数据

提供5种导入方式,以及简单查询。

项目协助

社区聊天

指向starrocks.slack.com

部署StarRocks

前期准备

说明需要的CPU、内存、存储、网络、操作系统等信息,以及FE、BE、CN的配置说明。

环境检查的相关的命令,以及如何获取部署文件。

存算一体模式部署

三种安装模式。一是手动自己安装,二是基于starRocks的管理工具,三是基于k8s的管理工具。

存算分离模式部署

基于不同存储介质的部署,包含S3、GCS、Blob、MinIO、HDFS等。

后期管理

部署后的设置信息。

如何升级和回滚版本。

相关推荐
一只数据集7 小时前
全尺寸人形机器人灵巧手力觉触觉数据集-2908条ROSbag数据覆盖14大应用场景深度解析
大数据·人工智能·算法·机器人
杨云龙UP7 小时前
SQL Server2022部署:Windows Server 2016下安装、SSMS配置、备份还原与1433端口放通全流程_20260508
运维·服务器·数据库·sql·sqlserver·2022
扑兔AI8 小时前
B2B销售线索挖掘效率提升的技术实践:基于工商公开数据的客源筛选与竞品分析架构
大数据·人工智能·架构
墨染天姬9 小时前
【AI】cursor提示词小技巧
前端·数据库·人工智能
古月-一个C++方向的小白9 小时前
MySQL数据库——数据类型
android·数据库·mysql
小羊Yveesss10 小时前
从自动化到自主协同:2026年AIOps 2.0赋能DevOps的变革之路
大数据·自动化·devops
qq_4135020210 小时前
如何创建CDB公共用户_C##前缀强制规则与CONTAINER=ALL
jvm·数据库·python
逸Y 仙X10 小时前
文章二十七:ElasticSearch ES查询模板(Search Template)高效复用实战
java·大数据·数据库·elasticsearch·搜索引擎·全文检索
m0_7381207210 小时前
应急响应(重点)——记一次某公司流量应急溯源分析(附带下载链接)
服务器·前端·数据库·安全·web安全·网络安全