StarRocks 巧用 Storage Volume,强大又便捷

前言

StarRocks 存算分离支持使用各种外部独立存储系统来存储业务数据。在早期 3.0 版本中,用户需要在 fe.conf 中配置存储相关信息(如 endpoint 等),这种静态配置模式也给用户使用带来了很多的不便性。

为此,StarRocks 存算分离从 3.1.0 版本后推出了 Storage Volume 能力,支持用户动态地为集群创建存储资源。需要说明的是,Storage Volume 仅限于在存算分离集群中使用。

解释

Storage Volume 代表的是存储资源,例如在 S3 兼容类存储系统上可以是一个 Bucket,在 HDFS 上可以是一个存储目录。

基本用法

创建 Storage Volume

具体可以参考文档

CREATE STORAGE VOLUME | StarRocksdocs.starrocks.io/zh/docs/sql-reference/sql-statements/Administration/CREATE_STORAGE_VOLUME/

删除 Storage Volume

具体可以参考文档

DROP STORAGE VOLUME | StarRocksdocs.starrocks.io/zh/docs/sql-reference/sql-statements/Administration/DROP_STORAGE_VOLUME/

显示所有 Storage Volume

可参考下面链接的命令来展示系统中所有的 Storage Volumes

SHOW STORAGE VOLUMES | StarRocksdocs.starrocks.io/zh/docs/sql-reference/sql-statements/Administration/SHOW_STORAGE_VOLUMES/

展示 Storage Volume 属性

具体可以参考文档

DESC STORAGE VOLUME | StarRocksdocs.starrocks.io/zh/docs/sql-reference/sql-statements/Administration/DESC_STORAGE_VOLUME/

修改 Storage Volume 属性

具体可以参考文档

ALTER STORAGE VOLUME | StarRocksdocs.starrocks.io/zh/docs/sql-reference/sql-statements/Administration/ALTER_STORAGE_VOLUME/

创建表

我们可以为存算分离表每个表指定特定的 Storage Volume,可以在建表时通过属性设置,具体可参考文档 https://docs.starrocks.io/zh/docs/sql-reference/sql-statements/data-definition/CREATE_TABLE/。

具体的写法如下:

CREATE TABLE table_name (column_1, column_2, ...) PROPERTIES ("storage_volume" = "<volume_name>" )

设置默认 Storage Volume

我们可以为系统创建一个 Storage Volume 并将其设置为系统默认值,避免需要每次建表时指定,如果我们建表时不指定,就使用该默认 Volume 存储数据。具体可参考文档

SET DEFAULT STORAGE VOLUME | StarRocksdocs.starrocks.io/zh/docs/sql-reference/sql-statements/Administration/SET_DEFAULT_STORAGE_VOLUME/

关于 builtin_storage_volume

Storage Volume 概念从 3.1 版本开始引入,在 3.0 版本中并没有,为了处理升级兼容性问题,如果用户从 3.0 升级至 3.1 版本,且在 fe.conf 中配置了 enable_load_volume_from_conf 为 true,系统会兼容 3.0 行为,根据 fe.conf 里配置的存储信息自动创建一个 builtin_storage_volume,且该 volume 会自动被设置为 default。

基于 AWS S3 部署 | StarRocksdocs.starrocks.io/zh/docs/deployment/shared_data/s3/#enable_load_volume_from_conf

举个例子,如果 fe.conf 里配置了如下内容:

cloud_native_storage_type = S3

例如 testbucket/subpath

aws_s3_path = <s3_path>

例如 us-west-2

aws_s3_region = <region>

例如 https://s3.us-west-2.amazonaws.com

aws_s3_endpoint = <endpoint_url>

enable_load_volume_from_conf = true

系统会使用上面的配置信息自动创建一个 S3 类型的 builtin_storage_volume。需要注意的是,该配置只会第一次加载。

优势

灵活使用 Storage Volume,可以给我们带来以下好处:

  1. 无需提前配置,随配随用,使用起来更方便

  2. 如果发现 Storage Volume 配置错误,可以随时使用命令修改,无需停服,可用性更高

  3. 可以在单个集群内创建多个 Storage Volume(数量无限制),且为不同的表指定不同的 Storage Volume,这样不同的表数据可以存储在不同的地方,可带来更好的数据隔离性

  4. 不同的 Storage Volume 还可以使用不同的存储系统(如 Volume A 使用 S3,Volume B 使用 HDFS),带来更多的灵活性

注意事项

  1. 强烈建议不要在 fe.conf 中配置存储信息,均通过 Storage Volume 来配置系统的存储资源,后续我们也会将静态配置的方式禁用

  2. 删除 Storage Volume 前需要将引用它的 Table 或者 Database 先删除(注意使用 drop table xxx force)

  3. 为某个表切换 Storage Volume 的功能不支持,这涉及数据迁移

相关推荐
倔强的石头_1 小时前
kingbase备份与恢复实战(二)—— sys_dump库级逻辑备份与恢复(Windows详细步骤)
数据库
jiayou641 天前
KingbaseES 实战:深度解析数据库对象访问权限管理
数据库
李广坤2 天前
MySQL 大表字段变更实践(改名 + 改类型 + 改长度)
数据库
爱可生开源社区3 天前
2026 年,优秀的 DBA 需要具备哪些素质?
数据库·人工智能·dba
随逸1773 天前
《从零搭建NestJS项目》
数据库·typescript
加号34 天前
windows系统下mysql多源数据库同步部署
数据库·windows·mysql
シ風箏4 天前
MySQL【部署 04】Docker部署 MySQL8.0.32 版本(网盘镜像及启动命令分享)
数据库·mysql·docker
李慕婉学姐4 天前
Springboot智慧社区系统设计与开发6n99s526(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
数据库·spring boot·后端
百锦再4 天前
Django实现接口token检测的实现方案
数据库·python·django·sqlite·flask·fastapi·pip
tryCbest4 天前
数据库SQL学习
数据库·sql