StarRocks的执行计划和Profile

文章目录

  • 一、执行计划和Profile相关脚本
  • 二、如何分析查询
    • 1、概念了解
    • [2、Query Plan](#2、Query Plan)
      • [①查看 Query Plan](#①查看 Query Plan)
      • [②分析 Query Plan](#②分析 Query Plan)
    • [3、Query hint](#3、Query hint)
    • [4、Query Profile](#4、Query Profile)
      • [①启用 Query Profile](#①启用 Query Profile)
      • [②查看 Query Profile](#②查看 Query Profile)
      • [③分析 Query Profile](#③分析 Query Profile)

一、执行计划和Profile相关脚本

命令 功能
ANALYZE PROFILE 以 Fragment 为单位分析指定 Query Profile,并以树形结构展示。更多信息,参考 Query Profile 概述
EXPLAIN 显示输入查询语句的逻辑或物理执行计划。关于如何分析查询计划,请参考 分析 Query Plan
EXPLAIN ANALYZE 执行指定 SQL,并显示相应的 Query Profile 文件。更多信息,参考 Query Profile 概述
SHOW PROFILELIST 列出 StarRocks 集群中缓存的 Query Profile 记录。更多信息,参考 Query Profile 概述

更多详情点击进入官网学习查看: https://docs.mirrorship.cn/zh/docs/category/sql-statements/

二、如何分析查询

1、概念了解

StarRocks 每个查询对应一个 QueryID。您可以在日志或者页面中查找到查询对应的 Query Plan 和 Profile。Query Plan 是 FE 通过解析 SQL 生成的执行计划,而 Profile 是 BE 执行查询后的结果,包含了每一步的耗时和数据处理量等数据。

2、Query Plan

SQL 语句在 StarRocks 中的生命周期可以分为查询解析(Query Parsing)、规划(Query Plan)、执行(Query Execution)三个阶段。

决定 StarRocks 中查询性能的关键就在于查询规划(Query Plan)和查询执行(Query Execution),二者的关系可以描述为 Query Plan 负责组织算子(Join/Order/Aggregation)之间的关系,Query Execution 负责执行具体算子。

Query Plan 可以为数据库管理者提供一个宏观的视角,从而获取查询执行的相关信息。优秀的 Query Plan 很大程度上决定了查询的性能,所以数据库管理者需要频繁查看 Query Plan,以确保其是否生成得当。

①查看 Query Plan

sql 复制代码
EXPLAIN sql_statement;
sql 复制代码
"Explain String"
"PLAN FRAGMENT 0"
" OUTPUT EXPRS:3: store_id | 6: sum"
"  PARTITION: UNPARTITIONED"
""
"  RESULT SINK"
""
"  4:EXCHANGE"
""
"PLAN FRAGMENT 1"
" OUTPUT EXPRS:"
"  PARTITION: HASH_PARTITIONED: 3: store_id"
""
"  STREAM DATA SINK"
"    EXCHANGE ID: 04"
"    UNPARTITIONED"
""
"  3:AGGREGATE (merge finalize)"
"  |  output: sum(6: sum)"
"  |  group by: 3: store_id"
"  |  "
"  2:EXCHANGE"
""
"PLAN FRAGMENT 2"
" OUTPUT EXPRS:"
"  colocate exec groups: ExecGroup{groupId=1, nodeIds=[0, 1]}"
"  PARTITION: RANDOM"
""
"  STREAM DATA SINK"
"    EXCHANGE ID: 02"
"    HASH_PARTITIONED: 3: store_id"
""
"  1:AGGREGATE (update serialize)"
"  |  STREAMING"
"  |  output: sum(5: sale_amt)"
"  |  group by: 3: store_id"
"  |  "
"  0:OlapScanNode"
"     TABLE: sales_records"
"     PREAGGREGATION: ON"
"     partitions=1/1"
"     rollup: sales_records"
"     tabletRatio=16/16"
"     tabletList=16197,16201,16205,16209,16213,16217,16221,16225,16229,16233 ..."
"     cardinality=16"
"     avgRowSize=12.0"

②分析 Query Plan

名称 解释
avgRowSize 扫描数据行的平均大小。
cardinality 扫描表的数据总行数。
colocate 表是否采用了 Colocate 形式。
numNodes 扫描涉及的节点数。
rollup 物化视图。
preaggregation 预聚合。
predicates 谓词,也就是查询过滤条件。
partitions 分区。
table 表。

3、Query hint

如果需要指定创建物化视图的子查询执行超时时间,可以在 SELECT 子句中使用 SET_VAR hint 设置系统变量 query_timeout。

sql 复制代码
CREATE MATERIALIZED VIEW mv 
    PARTITION BY dt 
    DISTRIBUTED BY HASH(`key`) 
    BUCKETS 10 
    REFRESH ASYNC 
    AS SELECT /*+ SET_VAR(query_timeout=500) */ * from dual;

4、Query Profile

①启用 Query Profile

sql 复制代码
SET enable_profile = true;

通过设置变量 big_query_profile_threshold 设置超过 30 秒的查询会启用 Query Profile 功能。这样既保证了系统性能,又能有效监控到慢查询。

sql 复制代码
-- 30 seconds
SET global big_query_profile_threshold = '30s';

-- 500 milliseconds
SET global big_query_profile_threshold = '500ms';

-- 60 minutes
SET global big_query_profile_threshold = '60m';

Query Profile 启用时,Runtime Query Profile会自动启用,默认的上报时间间隔为 10 秒。您可以通过修改变量 runtime_profile_report_interval 来调整对应的时间间隔:

sql 复制代码
SET runtime_profile_report_interval = 30;

②查看 Query Profile

sql 复制代码
SHOW PROFILELIST;
SHOW PROFILELIST LIMIT 5;

取得 Query ID 后,您可以通过 ANALYZE PROFILE 语句对 Query Profile 进行下一步的分析,其语法如下:

sql 复制代码
ANALYZE PROFILE FROM '<Query_ID>' [, <Node_ID> [, ...] ]

ANALYZE PROFILE FROM '762befbf-0d9e-11f0-95b5-0648ec1d9f38';

③分析 Query Profile

Query Profile 结构与详细指标

相关推荐
Guheyunyi3 小时前
智能守护:视频安全监测系统的演进与未来
大数据·人工智能·科技·安全·信息可视化
发哥来了4 小时前
主流AI视频生成商用方案选型评测:五大核心维度对比分析
大数据·人工智能
数研小生5 小时前
做京东评论分析系统11年,京东评论数据接口解析
大数据
金融小师妹5 小时前
基于LSTM-GARCH-EVT混合模型的贵金属极端波动解析:黄金白银双双反弹的逻辑验证
大数据·人工智能·深度学习·机器学习
yumgpkpm7 小时前
2026软件:白嫖,开源,外包,招标,晚进场(2025年下半年),数科,AI...中国的企业软件产业出路
大数据·人工智能·hadoop·算法·kafka·开源·cloudera
xixixi777777 小时前
今日 AI 、通信、安全行业前沿日报(2026 年 2 月 4 日,星期三)
大数据·人工智能·安全·ai·大模型·通信·卫星通信
珠海西格9 小时前
1MW光伏项目“四可”装置改造:逆变器兼容性评估方法详解
大数据·运维·服务器·云计算·能源
迎仔9 小时前
13-云原生大数据架构介绍:大数据世界的“弹性城市”
大数据·云原生·架构
产品人卫朋9 小时前
卫朋:IPD流程落地 - 市场地图拆解篇
大数据·人工智能·物联网
TDengine (老段)10 小时前
通过云服务 快速体验 TDengine
大数据·数据库·物联网·时序数据库·tdengine·涛思数据·iotdb