K8S环境中通过prometheus实现flink服务监控并给flink设置服务监测自动重启

prometheus实现flink服务监控

通过flink自带的**PrometheusReporter去监控flink服务**

修改flink-configmap.yaml,添加红框内的三行内容

执行kubectl apply -f flink-configmap.yaml 更新配置文件

flink镜像中可能没有相关的jar包,没有的话**PrometheusReporter就不存在,可以手动添加相关jar包,具体操作如下,比如我是flink1.16.3**

wget https://repo1.maven.org/maven2/org/apache/flink/flink-metrics-prometheus/1.16.3/flink-metrics-prometheus-1.16.3.jar

vim Dockerfile

FROM 你的flink镜像名称

COPY flink-metrics-prometheus-1.16.3.jar /opt/flink/lib/

执行命令打包镜像

docker build -t 你的flink镜像名称-prometheus .

最后在jobManager和taskManager deplotment的yaml文件里修改相关镜像即可

需要在jobManager和taskManager deplotment的yaml文件配置configmap挂载,因为容器内/opt/flink/conf/是只读目录,某些 Flink 启动脚本(如 /docker-entrypoint.sh)会 修改或写入 flink-conf.yaml(例如动态注入环境变量),所以ConfigMap 不能直接挂载到/opt/flink/conf,可以把ConfigMap 到 /tmp/flink-conf,再用启动命令复制。

启动jobManager即可

修改Prometheus的配置,ip是service的地址,也可以写域名

重载配置即可生效。

service的yaml附图:

注意事项:

从 Flink 1.14 开始,官方 弃用了 metrics.reporter.X.class 的配置方式,转而推荐使用 Reporter Factory。如果用​metrics.reporter.prom.class: org.apache.flink.metrics.prometheus.PrometheusReporter ​

那么 Flink 会尝试通过 反射调用无参构造函数 来实例化 PrometheusReporter。但在 Flink 1.16+ 中,PrometheusReporter 不再提供 public 无参构造函数

正确方式(Flink 1.14+ 推荐) metrics.reporter.prom.factory.class: org.apache.flink.metrics.prometheus.PrometheusReporterFactory

flink设置服务监测自动重启

在现有 Standalone 架构下实现"自动提交 + 自愈"

sidecar 容器 + 循环提交脚本 实现高可用。

为 JobManager Pod 添加一个 submitter sidecar 容器,原理是监控启动的作业名称

启动flink

相关推荐
福尔摩斯张21 分钟前
Linux信号捕捉特性详解:从基础到高级实践(超详细)
linux·运维·服务器·c语言·前端·驱动开发·microsoft
Empty_77734 分钟前
K8S-中的优先级
云原生·容器·kubernetes
looking_for__1 小时前
【Linux】进程控制
linux
Xの哲學1 小时前
Linux电源管理深度剖析
linux·服务器·算法·架构·边缘计算
cypking1 小时前
Nuxt项目内网服务器域名代理访问故障排查
运维·服务器·php
破刺不会编程1 小时前
socket编程TCP
linux·运维·服务器·开发语言·网络·网络协议·tcp/ip
CILMY231 小时前
【Linux】进度条实践教程:使用Makefile构建项目
linux·进度条·make和makefile
沉在嵌入式的鱼2 小时前
linux串口对0X0D、0X0A等特殊字符的处理
linux·stm32·单片机·特殊字符·串口配置
gxh19922 小时前
4步将HTTP请求升级为HTTPS
运维·服务器·网络协议·http·https
云和数据.ChenGuang2 小时前
运维工程师技术之nfs共享文件系统
运维·服务器·运维技术·数据库运维工程师·运维教程