大数据flink篇之三-flink运行环境安装后续一yarn-session安装

前提:

Hadoop 必須保证在 2.2 以上,且必須裝有 hdfs 服务。Hadoop安装后续会有相关说明。

具体的,在生产环境中,flink一般会交由yarn、k8s等资源管理平台来处理。本章主要讲解yarn模式下的session cluster模式。

flink Session-Cluster

复制代码
 在yarn中初始化一个flink集群,开辟指定的资源,以后提交任务都向这里提交。这个flink集群会驻在yarn集群中,除非手工停止。

首先确保在/etc/profile中添加了配置项

powershell 复制代码
export HADOOP_CLASSPATH=`hadoop classpath`

初始化启动

powershell 复制代码
./bin/yarn-session.sh --detached

提交作业

powershell 复制代码
./bin/flink run ./examples/streaming/TopSpeedWindowing.jar

停止作业

powershell 复制代码
echo "stop" | ./bin/yarn-session.sh -id application_XXXXX_XXX

这种模式所有的job都共享一个jobmanager,启动的集群只有一个jobmanager。

后续继续补充另外两种:Per-Job和Application Mode

相关推荐
KeepSeek7 分钟前
大数据运维(1)
大数据·运维
黄焖鸡能干四碗33 分钟前
业务数据中台技术方案(PPT)
大数据·数据库·人工智能·安全·需求分析
潘达斯奈基~41 分钟前
Spark踩坑:如何优化pandas_udf中的多维数组传输效率
大数据·spark·pandas
AI_Auto3 小时前
【人工智能】- OpenClaw本地化安装
大数据·人工智能·机器学习·数据挖掘
我爱学习好爱好爱3 小时前
Logstash 数据管道测试案例:从 Filebeat 接收日志并输出至黑屏幕与 Elasticsearch(基于Rocky Linux 9.6)
大数据·linux·elasticsearch
互联网江湖3 小时前
鹿客科技IPO,陈彬不想“站在门外”
大数据·人工智能·物联网
AI-小柒4 小时前
开发者一站式数据解决方案:通过 DataEyes API 一键配置智能数据采集与分析工具
大数据·人工智能·windows·http·macos
cxr8285 小时前
BMAD-METHOD 54个高级引导方法深度研究简报
大数据·人工智能
Crazy CodeCrafter5 小时前
租金要交,但客流为零,要关店了?
大数据·运维·经验分享·自动化·开源软件
最初的↘那颗心5 小时前
Spark Job 调度机制拆解:从 Action 算子到 Task 执行
大数据·spark·分布式计算