一款 StarRocks 可视化建表和数据编辑的神器

什么是 StarRocks?

StarRocks 是新一代极速全场景 MPP (Massively Parallel Processing) 数据库 。StarRocks 的愿景是能够让用户的数据分析变得更加简单和敏捷。用户无需经过复杂的预处理,就可以用 StarRocks 来支持多种数据分析场景的极速分析。

为了满足业务上的分析需求 StarRocks 设计了四种数据模型(明细模型、聚合模型、更新模型、主键模型),它们有各自的特点以适配不同的业务场景。本文将从创建数据模型表开始,配合简洁的案例,来讲解明细模型的用法和特点。

明细模型究竟是啥?

首先我们来看 StarRocks 官方的定义:

明细模型是默认的建表模型。如果在建表时未指定任何模型,默认创建的是明细类型的表

创建表时,支持定义排序键。如果查询的过滤条件包含排序键,则 StarRocks 能够快速地过滤数据 ,提高查询效率。明细模型适用于日志数据分析等场景,支持追加新数据,不支持修改历史数据

其次我们来看下 StarRocks 明细模型的标准建表语句与 MySQL 的差异:

可以看到除了 StarRocks 特有的关键字之外,两者语法大致是相同的。通过上述内容,我们可以总结以下关于 StarRocks 明细模型的信息:

  • 如果在建表语句中不指定具体模型,也就是省略不写,默认就是 DUPLICATE KEY 明细模型,并且会自动选取前三列作为排序键
  • 指定排序键的作用类似于 MySQL 给列设置普通索引,目的是为了提高查询效率
  • 写入的数据无论是否完全一致,都会插入到数据库中而且不支持 Update 语法

以上信息就是明细模型的特点,我们从对比的角度讲,明细模型大致相当于:

MySQL 具有普通索引的无主键表,并且不支持 Update 操作

怎么建表?

  • 使用 CloudDM,添加完 StarRocks 数据源之后,在表视图中右键方式开始新建表操作:
  • 配置表名等基本信息
  • 添加列信息,在结构设计器中选择列,然后点击增加按钮新建一个列,在右侧可以配置列的信息
  • 设置表的数据模型,点击数据模型,点击添加类型选择 "明细模型",接着在下方选择排序键
  • 配置排序键,在右方具体选择列,多个排序键列需要多次点击增加。
  • 点击保存,生成建表语句,可选择立即执行或者复制 SQL 语句

怎么写数据?

  • 右键点击新建表,并选择 编辑数据
  • 准备三行数据,前两行数据完全相同,点击 "+" 符号,填写完成后点击提交,保存这三条数据
  • 查看插入的数据,发现三条都已写入,验证明细模型的特点: 写入的数据无论是否完全一致,都会插入到数据库中。如果选择的是 StarRocks 聚合模型,上面三条数据插入之后就会变为 2 条
  • 验证是否支持 Update,双击 "SR_TEST" 库打开新的查询窗口,针对这个表尝试做一次 UPDATE 操作,结果执行报错:
  • CloudDM 可视化数据编辑会直接禁用更改,和 StarRocks 数据库约束保持一致

总结

本文我们使用 CloudDM 可视化的方式创建了 StarRocks 明细模型表,并且同样可视化的方式对明细模型表进行了数据编辑操作。

以下是这款小工具的下载链接,感兴趣的小伙伴可以下载试用一下:www.clougence.com/clouddm-per...

相关推荐
FIT2CLOUD飞致云19 小时前
在线地图交互优化,查询组件选项值支持过滤条件,DataEase开源BI工具v2.10.19 LTS版本发布
开源·数据可视化·dataease·bi·数据大屏
kuankeTech1 天前
解决内外贸双轨制难题,外贸ERP智能引擎同步管理国内外合规与标准
大数据·人工智能·数据可视化·软件开发·erp
isNotNullX3 天前
什么是数字脱敏?一文讲透数字脱敏概念
大数据·数据安全·数据可视化·数字脱敏
余丁,微生信4 天前
在线绘制特殊形状(三角行,菱形,五边形,六边形,椭圆,圆形)聚类热图
数据挖掘·数据可视化·生信分析·科研绘图·科学科普·临床分析·聚类热图
farewell-Calm7 天前
1、地理信息系统(GIS)简介
数据可视化
漂视数字孪生世界8 天前
如何选择合适的数字孪生三维可视化开发工具?
3d·数字孪生·三维可视化·数据可视化·大屏可视化
牛猫Data8 天前
Power BI为什么不能完全取代Excel?
microsoft·数据分析·excel·database·数据可视化·powerbi
阳哥赚钱很牛8 天前
数据可视化项目
信息可视化·ai编程·数据可视化
Aloudata技术团队9 天前
完美应对千亿级明细数据计算:Aloudata CAN 双引擎架构详解
数据库·数据分析·数据可视化
韩立学长9 天前
【开题答辩实录分享】以《兴趣班预约管理系统的设计与实现》为例进行选题答辩实录分享
java·mysql·intellij idea