Spark专题-第三部分:性能监控与实战优化(1)-认识spark ui

Spark专题-第三部分:性能监控与实战优化(1)-spark ui

Spark UI 概述

Spark UI 是 Spark 提供的 Web 监控界面,用于实时查看应用程序的执行状态、性能指标和资源配置。

各模块详细解析

1. Jobs 页面

核心信息区域
复制代码
**User:** inno                    # 提交作业的用户
**Total Uptime:** 34 min         # 应用总运行时间
**Scheduling Mode:** FIFO        # 调度模式(FIFO/FAIR)
**Completed Jobs:** 48           # 已完成的作业数量
主要功能区域
  • Event Timeline:作业执行时间线可视化
  • Completed Jobs:已完成作业列表,显示执行详情

2. SQL/DataFrame 页面

表格字段说明
sql 复制代码
-- 各列含义解析
ID *           : SQL查询的唯一标识符
Description    : 查询描述(通常显示触发查询的代码位置)
Submitted      : 查询提交时间
Duration       : 查询执行耗时
Job IDs        : 关联的Spark Job ID列表
性能分析要点
  • 查询38:执行仅10ms,属于高效查询
  • 查询37:耗时4.5分钟,可能存在性能瓶颈
  • 查询34:关联多个Job(39484142),涉及复杂计算

3. Environment 页面

配置分类
复制代码
Spark Properties    : Spark核心配置参数
Runtime Information : 运行时环境信息
关键配置参数
python 复制代码
# 内存相关配置
spark.buffer.pageSize     = 65536      # 内存页大小
spark.broadcast.blockSize = 65536      # 广播变量块大小

# 动态分配配置
spark.dynamicAllocation.enabled = true  # 启用动态资源分配

# 序列化配置
spark.serializer = ...                 # 序列化器设置

实际SQL执行案例解析

案例:用户行为分析查询

sql 复制代码
-- 实际执行的Spark SQL
SELECT 
    user_id,
    COUNT(*) as action_count,
    AVG(duration) as avg_duration
FROM user_actions 
WHERE event_date = '2025-09-04'
  AND action_type IN ('click', 'view')
GROUP BY user_id
HAVING COUNT(*) > 10
ORDER BY action_count DESC
LIMIT 100;

在Spark UI中的对应显示

SQL提交 SQL/DataFrame页面-记录查询信息 生成执行计划-拆分为多个Jobs Jobs页面-显示Job执行详情 Stage页面-显示任务阶段划分 Storage页面-显示数据缓存情况 Environment页面-显示配置参数

性能优化洞察

  1. 查询37耗时分析

    • 4.5分钟执行时间表明可能存在数据倾斜
    • 关联Job4846需要进一步分析Stage详情
  2. 配置优化建议

    python 复制代码
    # 针对大数据集的优化配置
    spark.conf.set("spark.sql.adaptive.enabled", "true")           # 启用自适应查询
    spark.conf.set("spark.sql.adaptive.coalescePartitions.enabled", "true")  # 自动合并分区
    spark.conf.set("spark.sql.adaptive.skew.enabled", "true")      # 处理数据倾斜

这一篇主要是对spark ui的界面熟悉一下,后面会举出实际的案例进行性能优化

相关推荐
段一凡-华北理工大学5 小时前
2026 高炉炼铁智能化技术全景与演进路径~系列文章11:演进路径与行业未来
大数据·网络·人工智能·算法·工业智能体·高炉炼铁智能化
狒狒热知识6 小时前
合规筑基专业赋能178软文网引领软文营销行业规范化发展
大数据
ZGi.ai8 小时前
企业AI资产管理体系:提示词、工作流、知识库应该怎么管
大数据·知识库·工作流编排·ai资产·提示词管理
爱分享的康康9 小时前
低成本自动驾驶数据采集设备理性分析:康谋入门套装适配性解析
大数据·人工智能
我是一颗柠檬9 小时前
【MySQL全面教学】MySQL性能优化实战Day13(2026年)
数据库·后端·sql·mysql·性能优化·database
程序鉴定师10 小时前
上海小程序开发的坚实保障与行业优势解析
大数据·小程序
Elastic 中国社区官方博客10 小时前
我们如何在 Elasticsearch Serverless 上将向量搜索吞吐量提升一倍
大数据·数据库·人工智能·elasticsearch·搜索引擎·云原生·serverless
weelinking10 小时前
【产品】11_实现后端接口——数据在背后如何流动
java·人工智能·python·sql·oracle·json·ai编程
zgl_2005377911 小时前
源代码:跨数据库通用SQL语法解析与标注拆解
大数据·数据库·数据仓库·sql·etl·源代码管理
Ajie'Blog12 小时前
Claude 大模型深度评测:从参数架构到实战边界
大数据·人工智能·架构