Hive企业级调优[3]—— Explain 查看执行计划

Explain 查看执行计划

Explain 执行计划概述

EXPLAIN 命令呈现的执行计划由一系列 Stage 组成。这些 Stage 之间存在依赖关系,每一个 Stage 可能对应一个 MapReduce Job 或者一个文件系统的操作等。如果某 Stage 对应了一个 MapReduce Job,则该 Job 在 Map 端和 Reduce 端的计算逻辑分别由 Map Operator Tree 和 Reduce Operator Tree 描述。Operator Tree 包含了一系列 Operator,每个 Operator 表示 Map 或 Reduce 阶段中的一个单独逻辑操作,如 TableScan Operator、Select Operator、Join Operator 等。

常见的 Operator 及其作用如下:

  • TableScan:表扫描操作,通常在 Map 端的第一个操作是表扫描。
  • Select Operator:选取操作。
  • Group By Operator:分组聚合操作。
  • Reduce Output Operator:输出到 Reduce 操作。
  • Filter Operator:过滤操作。
  • Join Operator:Join 操作。
  • File Output Operator:文件输出操作。
  • Fetch Operator:客户端获取数据操作。
基本语法
sql 复制代码
EXPLAIN [FORMATTED | EXTENDED | DEPENDENCY] query-sql

其中,FORMATTEDEXTENDEDDEPENDENCY 是可选关键字,各自的作用如下:

  • FORMATTED:将以 JSON 字符串形式输出执行计划。
  • EXTENDED:输出执行计划中的额外信息,通常是读写文件名等信息。
  • DEPENDENCY:输出执行计划中读取的表及分区。
案例实操

1)查看以下 SQL 语句的执行计划:

sql 复制代码
hive (default)> explain
select
    user_id,
    count(*)
from order_detail
group by user_id;

2 )执行计划如下图

相关推荐
老蒋新思维9 小时前
创客匠人启示:破解知识交付的“认知摩擦”——IP、AI与数据的三角解耦模型
大数据·人工智能·网络协议·tcp/ip·重构·创客匠人·知识变现
爱埋珊瑚海~~9 小时前
基于MediaCrawler爬取热点视频
大数据·python
工程师丶佛爷9 小时前
从零到一MCP集成:让模型实现从“想法”到“实践”的跃迁
大数据·人工智能·python
2021_fc10 小时前
Flink笔记
大数据·笔记·flink
Light6010 小时前
数据要素与数据知识产权交易中心建设专项方案——以领码 SPARK 融合平台为技术底座,构建可评估、可验证、可交易、可监管的数据要素工程体系
大数据·分布式·spark
zyxzyx4911 小时前
AI 实战:从零搭建轻量型文本分类系统
大数据·人工智能·分类
五阿哥永琪11 小时前
SQL中的函数--开窗函数
大数据·数据库·sql
程序员小羊!11 小时前
数仓数据基线,在不借助平台下要怎么做?
大数据·数据仓库
火山引擎开发者社区13 小时前
两大模型发布!豆包大模型日均使用量突破 50 万亿 Tokens
大数据·人工智能
Hello.Reader14 小时前
Flink SQL 的 UNLOAD MODULE 模块卸载、会话隔离与常见坑
大数据·sql·flink