获取Flink作业在HDFS上保存的最新的savepoint文件路径

获取Flink作业在HDFS上保存的最新的savepoint文件路径

代码:

c 复制代码
savepoint=$(hadoop fs -ls hdfs://xxxApp/flink-checkpoints/xxxflinkjob/*/chk-*/_metadata |grep -vw Found |sort -k6,7 -r |head -n 1 |awk '{print $8}')
    

上面的代码是一个Shell命令,用于获取Flink作业在HDFS上保存的最新的savepoint文件路径。让我们逐步解释这段代码:

  1. savepoint=$(...) :这是一个Shell变量赋值语句,将命令的输出赋值给变量 savepoint 。
  2. hadoop fs -ls hdfs://xxxApp/flink-checkpoints/xxxflinkjob//chk- /_metadata :这部分命令使用 hadoop fs -ls 列出指定HDFS路径下的文件和目录,路径为 hdfs://xxxApp/flink-checkpoints/xxxflinkjob//chk-/_metadata 。这个路径通常是Flink作业的检查点目录,其中包含savepoint文件的元数据信息。
  3. grep -vw Found : grep 命令用于过滤输出, -v 选项表示显示不匹配的行, -w 选项表示精确匹配整个单词。这里过滤掉包含"Found"的行。
  4. sort -k6,7 -r : sort 命令按照第6和第7列的内容进行逆序排序,以便找到最新的savepoint文件。
  5. head -n 1 : head 命令用于显示输出的前n行,这里只显示排序后的第一行,即最新的savepoint文件。
  6. awk '{print $8}' : awk 命令用于处理文本数据,这里提取排序后结果的第8列,即最新的savepoint文件的路径。

综合起来,这段代码的作用是获取Flink作业在HDFS上保存的最新savepoint文件的路径,并将路径赋值给变量 savepoint 。

相关推荐
wyzqhhhh10 小时前
组件库打包工具选型(npm/pnpm/yarn)的区别和技术考量
前端·npm·node.js
csdn_aspnet12 小时前
使用nvm管理node多版本(安装、卸载nvm,配置环境变量,更换npm淘宝镜像)
npm·node.js
王蛋11114 小时前
前端工作问题或知识记录
前端·npm·node.js
朝阳3920 小时前
vue3图标终极方案【npm包推荐】vue3-icon-sui(含源码详解)
npm·vue3·图标组件
BillKu20 小时前
npm 安装命令中关于 @ 的讲解,如:npm install @vue-office/docx vue-demi
前端·vue.js·npm
若无_21 小时前
npm 与 pnpm 深度对比:从依赖管理到实际选型
npm·node.js
BillKu21 小时前
vue3 中 npm install mammoth 与 npm install --save mammoth 的主要区别说明
前端·npm·node.js
Apache Flink21 小时前
Flink Agents:基于Apache Flink的事件驱动AI智能体框架
人工智能·flink·apache
索迪迈科技1 天前
Flink Task线程处理模型:Mailbox
java·大数据·开发语言·数据结构·算法·flink
jiedaodezhuti1 天前
Flink通讯超时问题深度解析:Akka AskTimeoutException解决方案
大数据·flink