Flink从ck拉起任务脚本

bash 复制代码
#!/bin/bash

APP_NAME="orderTest"

CHECKPOINT_BASE_PATH="hdfs:///jobs/flink/checkpoints/aaa-test/"


is_running=$(yarn application -list | grep -w "$APP_NAME" | grep -c "RUNNING")

if [ $is_running -gt 0 ]; then
    echo "应用程序 '$APP_NAME' 在运行中,退出脚本"
    exit 1
else
    echo "应用程序 '$APP_NAME' 不在运行中,准备拉起任务"
fi



get_latest_checkpoint() {
    latest_checkpoint=$(hdfs dfs -ls -t -R $CHECKPOINT_BASE_PATH  | grep '_metadata' | sort -k6,7r | head -n 1 | awk '{print $8}'  )
    if [ -z "$latest_checkpoint" ]; then
        echo "没有找到适合的ck,退出执行"
        exit 1
    fi

    checkpoint_dir=$(dirname "$latest_checkpoint")
    echo $checkpoint_dir
}

LATEST_CHECKPOINT=$(get_latest_checkpoint)
echo " '$APP_NAME' 任务将从 '$LATEST_CHECKPOINT' 启动"


flink run \
 -t yarn-per-job \
 -d \
 -p 1 \
 -Dyarn.application.queue=realtime \
 -Dyarn.application.name=$APP_NAME\
 -Djobmanager.memory.process.size=1024mb \
 -Dtaskmanager.memory.process.size=1000mb \
 -Dtaskmanager.memory.managed.size=0mb \
 -Dtaskmanager.memory.network.max=64mb \
 -Dtaskmanager.numberOfTaskSlots=1 \
 -c com.test.Main\
 -s $LATEST_CHECKPOINT \
 ./ds-test-1.0.jar

备注:由于Flink checkpoint 个别情况下,不一定能保证落地的checkpoint文件一定有效,所以需要人工介入支持。

相关推荐
代码在改了2 小时前
【2025】基于Hadoop短视频流量数据分析与可视化(源码+文档+调试+答疑)
大数据·hadoop·数据分析
2301_786964363 小时前
4、MapReduce编程实践
大数据·ubuntu·hdfs·mapreduce
互联网资讯3 小时前
本地生活服务项目有哪些:如何利用本地生活市场,打开线下流量!
大数据·运维·人工智能·产品运营·生活
天冬忘忧4 小时前
Flume实战--Flume中的拦截器详解与操作
大数据·负载均衡·flume
Qyt-Coding4 小时前
flink设置保存点和恢复保存点
大数据·flink
好看资源平台5 小时前
深入探讨分布式数据库:技术架构、应用案例与性能优化
大数据·数据库·分布式·架构
GIS工具-gistools20216 小时前
地图资源下载工具(geodatatool)下载全球哥白尼 DSM 30 米 高程数据
大数据·gis·高程
冬至喵喵7 小时前
SPARK调优:AQE特性(含脑图总结)
大数据·ajax·spark
涛思数据(TDengine)15 小时前
TDengine 签约国家电投旗下四大火力发电厂,助力汽轮机振动数据的有效管理
大数据·时序数据库·tdengine