第2.6章 StarRocks表设计——数据压缩

注:本篇文章阐述的是StarRocks-3.2版本的数据压缩机制

1.数据压缩概述

StarRocks支持对表,索引数据进行压缩(compression)。数据压缩不仅有助于节省存储空间,还能提高I/O密集型任务的性能,但是压缩和解压数据需要额外的cpu资源。

2.选择数据压缩算法

StarRocks支持四种数据压缩算法:LZ4,Snappy,Zstandard(或 zstd)、zlib。每种压缩算法在压缩率和压缩/解压缩性能上有所不同。压缩率排名如下:zlib > Zstandard > LZ4 > Snappy 。由于数据高度压缩,使用zlib算法的表,其导入和查询性能会受到一定程度的影响。LZ4 和 Zstandard算法具有较为均衡的压缩比和解压缩性能。如果对存储空间占用没有特殊需求,建议使用LZ4 或Zstandard算法。除此之外,不同的数据类型也会影响算法的压缩率。

3.设置数据压缩算法

只能在建表时通过增加属性 compression 为其设置数据压缩算法且后续无法修改。如不指定数据压缩算法,StarRocks 默认使用 LZ4

compression 有效值包括:

  • LZ4:LZ4 算法。
  • ZSTD:Zstandard 算法。
  • ZLIB:zlib 算法。
  • SNAPPY:Snappy 算法。
sql 复制代码
#对表data_compression指定算法 Zstandard
create table `data_compression` (
  `id`      int(11)     not null     comment "",
  `name`    char(200)   null         comment ""
)
engine=olap 
unique key(`id`)
comment "olap"
distributed by hash(`id`)
properties (
"compression" = "zstd"
);

参考文章:

数据压缩 | StarRocks

相关推荐
塔能物联运维9 分钟前
隧道照明“智能进化”:PLC 通信 + AI 调光守护夜间通行生命线
大数据·人工智能
lang2015092818 分钟前
Jackson 1.x到2.x的演进与Spring集成
数据库·sql·spring
我星期八休息19 分钟前
MySQL数据可视化实战指南
数据库·人工智能·mysql·算法·信息可视化
highly200920 分钟前
Gitflow
大数据·elasticsearch·搜索引擎
humors2211 小时前
韩秀云老师谈买黄金
大数据·程序人生
码农幻想梦1 小时前
实验四 mybatis动态sql及逆向工程
sql·性能优化·mybatis
五阿哥永琪1 小时前
MySQL面试题 事务的隔离级别
数据库·mysql
重生之绝世牛码1 小时前
Linux软件安装 —— SSH免密登录
大数据·linux·运维·ssh·软件安装·免密登录
DK.千殇1 小时前
前四天总结
数据库
Red丶哞1 小时前
[Django Message超全总结教程](武沛齐老师)
数据库·django·sqlite