K8S环境中通过prometheus实现flink服务监控并给flink设置服务监测自动重启

prometheus实现flink服务监控

通过flink自带的**PrometheusReporter去监控flink服务**

修改flink-configmap.yaml,添加红框内的三行内容

执行kubectl apply -f flink-configmap.yaml 更新配置文件

flink镜像中可能没有相关的jar包,没有的话**PrometheusReporter就不存在,可以手动添加相关jar包,具体操作如下,比如我是flink1.16.3**

wget https://repo1.maven.org/maven2/org/apache/flink/flink-metrics-prometheus/1.16.3/flink-metrics-prometheus-1.16.3.jar

vim Dockerfile

FROM 你的flink镜像名称

COPY flink-metrics-prometheus-1.16.3.jar /opt/flink/lib/

执行命令打包镜像

docker build -t 你的flink镜像名称-prometheus .

最后在jobManager和taskManager deplotment的yaml文件里修改相关镜像即可

需要在jobManager和taskManager deplotment的yaml文件配置configmap挂载,因为容器内/opt/flink/conf/是只读目录,某些 Flink 启动脚本(如 /docker-entrypoint.sh)会 修改或写入 flink-conf.yaml(例如动态注入环境变量),所以ConfigMap 不能直接挂载到/opt/flink/conf,可以把ConfigMap 到 /tmp/flink-conf,再用启动命令复制。

启动jobManager即可

修改Prometheus的配置,ip是service的地址,也可以写域名

重载配置即可生效。

service的yaml附图:

注意事项:

从 Flink 1.14 开始,官方 弃用了 metrics.reporter.X.class 的配置方式,转而推荐使用 Reporter Factory。如果用​metrics.reporter.prom.class: org.apache.flink.metrics.prometheus.PrometheusReporter ​

那么 Flink 会尝试通过 反射调用无参构造函数 来实例化 PrometheusReporter。但在 Flink 1.16+ 中,PrometheusReporter 不再提供 public 无参构造函数

正确方式(Flink 1.14+ 推荐) metrics.reporter.prom.factory.class: org.apache.flink.metrics.prometheus.PrometheusReporterFactory

flink设置服务监测自动重启

在现有 Standalone 架构下实现"自动提交 + 自愈"

sidecar 容器 + 循环提交脚本 实现高可用。

为 JobManager Pod 添加一个 submitter sidecar 容器,原理是监控启动的作业名称

启动flink

相关推荐
取经蜗牛3 小时前
Ubuntu 国内镜像源配置指南(多版本常用镜像地址都有)
linux·运维·ubuntu
实心儿儿4 小时前
Linux —— 线程控制(1)
linux·运维·服务器
网宿安全演武实验室4 小时前
当AI跑进容器:全链路容器安全检测与智能运营实
人工智能·安全·容器·k8s
筠筠喵呜喵4 小时前
Linux软件开发性能优化
linux·c++·性能优化
Bruce_kaizy4 小时前
c++ linux环境编程——文件io介绍以及open 、write 、read 三剑客深度详解
linux·服务器·c++·ubuntu·操作系统·文件io
亦良Cool5 小时前
VMware虚拟机ubuntu瘦身,解决虚拟机越用越大
linux·运维·ubuntu
星辰&与海6 小时前
KVM + QEMU虚拟化方案
linux·运维
宋浮檀s6 小时前
应急响应——恶意流量&攻击行为识别
linux·运维·网络·网络安全·应急响应
REDcker6 小时前
Linux OverlayFS详解
java·linux·运维
zizle_lin7 小时前
WSL的系统安装和部分环境配置(按需操作)
运维