Flink性能指标详解MetricsAnalysis

文章目录

1.JobManager

管理任务

  • 作业调度:负责接收和调度作业,分配任务到 TaskManager。
  • 资源管理:管理集群资源,协调 TaskManager 的启动和停止。
  • 故障恢复:负责作业的故障恢复,重新调度失败的任务。

JobManager 相关参数:

  • jobmanager.memory.process.size:JobManager 进程的总内存大小。
  • jobmanager.rpc.address:JobManager 的 RPC 通信地址。
  • jobmanager.rpc.port:JobManager 的 RPC 通信端口。

2.TaskManager

执行任务

  • 任务执行:负责执行分配给它的任务(如数据处理、计算等)。
  • 资源管理:管理分配给它的资源(如 CPU、内存等)。
  • 心跳机制:定期向 JobManager 发送心跳,报告自身状态。

TaskManager 相关参数:

  • taskmanager.numberOfTaskSlots:每个 TaskManager 提供的任务槽数量。
  • taskmanager.memory.process.size:TaskManager 进程的总内存大小。
  • taskmanager.network.memory.fraction:TaskManager 分配给网络缓冲区的内存比例。

3.ResourceManager

资源管理

  • 资源分配:管理集群资源,分配资源给 TaskManager。
  • 资源回收:回收不再使用的资源,优化资源利用。
  • 资源监控:监控集群资源的使用情况,确保资源的合理分配。

4.Dispatcher

分发器

  • 作业分发:接收客户端提交的作业,分发给 JobManager。
  • 作业管理:管理作业的生命周期,包括提交、调度和完成。
  • 作业监控:提供作业的监控信息,如进度、日志等。

Dispatcher 相关参数:

  • dispatcher.address:Dispatcher 的地址。
  • dispatcher.port:Dispatcher 的端口。

5.Client

提交任务

  • 作业提交:负责将作业提交到 Flink 集群。
  • 作业配置:配置作业的参数和资源需求。
  • 作业监控:监控作业的执行状态,提供日志和性能指标。

6. Env

环境

  • 执行环境配置:配置作业的执行环境,包括并行度、资源需求等。
  • 作业执行:执行作业的逻辑,包括数据源、转换和数据汇出。

环境参数

  • parallelism.default:默认的并行度。
  • execution.batch.speculative.enabled:是否启用推测执行。

JobManager Metrics

TaskManager Metrics

堆内存计算:

相关推荐
企鹅侠客20 分钟前
ElasticSearch-提高篇
大数据·elasticsearch·jenkins
工业互联网专业1 小时前
基于大数据hive的银行信用卡用户的数仓系统的设计与实现_django
大数据·hive·django·毕业设计·源码·课程设计·数仓系统
优秘智能UMI9 小时前
UMI企业智脑智能营销:多平台视频矩阵引领营销新潮流
大数据·运维·人工智能·ai·矩阵·aigc
李昊哲小课10 小时前
Spring Boot 基础教程
java·大数据·spring boot·后端
百胜软件@百胜软件11 小时前
新零售模式下仓储变化与发展趋势
大数据·零售
lisw0512 小时前
编程语言top5对比分析!
大数据·人工智能·程序人生·机器学习·软件工程
打码人的日常分享12 小时前
信息化系统安全建设方案
大数据·数据库·人工智能·安全·系统安全
幂简集成12 小时前
需求从0到1:AI提示词助力客户画像→功能脑暴→PRD→价值主张
大数据·人工智能
lifallen13 小时前
Flink TCP Channel复用:NettyServer、NettyProtocol详解
大数据·flink·nio
Hello.Reader13 小时前
用 Flink 打造事件驱动流式应用从 DataStream 到 ProcessFunction
大数据·flink