Flink性能指标详解MetricsAnalysis

月亮给我抄代码2025-03-04 14:50

文章目录

- [Flink 组成](#Flink 组成)
- - 1.JobManager
  - 2.TaskManager
  - 3.ResourceManager
  - 4.Dispatcher
  - 5.Client
  - [6. Env](#6. Env)
- [JobManager Metrics](#JobManager Metrics)
- [TaskManager Metrics](#TaskManager Metrics)

Flink 组成

1.JobManager

管理任务

作业调度：负责接收和调度作业，分配任务到 TaskManager。
资源管理：管理集群资源，协调 TaskManager 的启动和停止。
故障恢复：负责作业的故障恢复，重新调度失败的任务。

JobManager 相关参数：

jobmanager.memory.process.size：JobManager 进程的总内存大小。
jobmanager.rpc.address：JobManager 的 RPC 通信地址。
jobmanager.rpc.port：JobManager 的 RPC 通信端口。

2.TaskManager

执行任务

任务执行：负责执行分配给它的任务（如数据处理、计算等）。
资源管理：管理分配给它的资源（如 CPU、内存等）。
心跳机制：定期向 JobManager 发送心跳，报告自身状态。

TaskManager 相关参数：

taskmanager.numberOfTaskSlots：每个 TaskManager 提供的任务槽数量。
taskmanager.memory.process.size：TaskManager 进程的总内存大小。
taskmanager.network.memory.fraction：TaskManager 分配给网络缓冲区的内存比例。

3.ResourceManager

资源管理

资源分配：管理集群资源，分配资源给 TaskManager。
资源回收：回收不再使用的资源，优化资源利用。
资源监控：监控集群资源的使用情况，确保资源的合理分配。

4.Dispatcher

分发器

作业分发：接收客户端提交的作业，分发给 JobManager。
作业管理：管理作业的生命周期，包括提交、调度和完成。
作业监控：提供作业的监控信息，如进度、日志等。

Dispatcher 相关参数：

dispatcher.address：Dispatcher 的地址。
dispatcher.port：Dispatcher 的端口。

5.Client

提交任务

作业提交：负责将作业提交到 Flink 集群。
作业配置：配置作业的参数和资源需求。
作业监控：监控作业的执行状态，提供日志和性能指标。

6. Env

环境

执行环境配置：配置作业的执行环境，包括并行度、资源需求等。
作业执行：执行作业的逻辑，包括数据源、转换和数据汇出。

环境参数

parallelism.default：默认的并行度。
execution.batch.speculative.enabled：是否启用推测执行。

JobManager Metrics

TaskManager Metrics

堆内存计算：

上一篇：C++小课堂——变量的声明，赋值和初始化

下一篇：【Linux】之【Bug】VMware 虚拟机开机一直卡在黑屏左上角下划线闪烁界面

热门推荐

01GitHub 镜像站点 02Codex 接入 DeepSeek API 完整配置文档 03【踩坑记录 | 第一篇】微软商店无法使用时，如何手动安装 OpenAI Codex？附`.msix`文件系统错误解决方法 04装上就回不去了：CodeGraph 让 AI 编程效率飙升 92%，它到底做了什么？05裂开！ChatGPT 居然开始要手机号验证，附详细解决方法 06CC-Switch & Claude 基于 Linux 服务器安装使用指南 07【AI】2026 年具身智能模型和世界模型总结 08几个好用的ip纯净度检测网站 09codex app每次打开重连5次Reconnecting问题解决 10用了半年 OpenRouter，我换到了 Ofox.ai — 两个 AI API 聚合平台的真实对比