flink集群部署

虚拟机配置

bigdata-hmaster 192.168.135.112 4核心 32GB

bigdata-hnode1 192.168.135.113 4核心 16GB

bigdata-hnode2 192.168.135.114 4核心 16GB

安装包:https://dlcdn.apache.org/flink/flink-1.17.1/flink-1.17.1-bin-scala_2.12.tgz

放到/usr/lcoal/lib目录下,并解压

tar -zxvf flink-1.17.1-bin-scala_2.12.tgz

1、配置文件

masters、workers、flink-conf.yaml

flink-conf.yaml

具体配置

yaml 复制代码
jobmanager.rpc.address: bigdata-hmaster
jobmanager.rpc.port: 6123
jobmanager.bind-host: 0.0.0.0
jobmanager.memory.process.size: 1600m
taskmanager.bind-host: 0.0.0.0
taskmanager.memory.process.size: 8192m
taskmanager.numberOfTaskSlots: 4
parallelism.default: 1
state.savepoints.dir: file:///tmp/flink/savepoint
jobmanager.execution.failover-strategy: region
rest.port: 8181
rest.address: 0.0.0.0
rest.bind-address: 0.0.0.0

参数解释

yaml 复制代码
jobmanager.rpc.address:JobManager的RPC(远程过程调用)地址,用于与客户端和TaskManager通信。
jobmanager.rpc.port:JobManager的RPC端口,用于与客户端和TaskManager通信。
taskmanager.numberOfTaskSlots:每个TaskManager上可用的任务槽数量,用于并行执行任务。
taskmanager.memory.process.size:TaskManager进程的总共可用内存大小,可以设置为"2g"、"1g"等形式。
taskmanager.memory.task.heap.size:每个任务的堆内存大小,用于存储任务的对象。
taskmanager.memory.task.off-heap.size:每个任务的堆外内存大小,用于存储非堆对象。
parallelism.default:默认并行度,用于指定未明确设置并行度的任务的并行执行数量。
state.checkpoints.dir:检查点存储路径,用于持久化任务的状态,以便在发生故障时进行恢复。
state.backend:状态后端,用于决定如何管理和存储任务的状态数据。
metrics.reporters:指定要使用的度量报告器的列表,用于收集和展示任务运行过程中的度量数据。

master

bash 复制代码
bigdata-hmaster:8181

workers

bash 复制代码
bigdata-hnode1
bigdata-hnode2

2、配置环境变量并启动

bash 复制代码
vim /etc/profile

export FLINK_HOME=/usr/local/lib/flink-1.17.1
export PATH=$PATH:$FLINK_HOME/bin

source /etc/profile

start-cluster.sh

stop-cluster.sh

相关推荐
TDengine (老段)29 分钟前
TDengine IDMP 工业数据建模 —— 数据标准化
大数据·数据库·物联网·ai·时序数据库·tdengine·涛思数据
AI先驱体验官1 小时前
AI智能体赛道新机遇:2026机会与挑战深度解析
大数据·人工智能·深度学习·重构·aigc
被摘下的星星1 小时前
Hadoop伪分布式集群搭建实验原理概要
大数据·hadoop·分布式
ggabb1 小时前
以色列的科技实力与全球格局分析
大数据·人工智能
Ujimatsu2 小时前
数据分析相关面试题-Python部分
大数据·python·数据分析
Omics Pro2 小时前
空间组学下一代机器学习与深度学习
大数据·人工智能·深度学习·算法·机器学习·语言模型·自然语言处理
北京软秦科技有限公司2 小时前
AI报告文档审核深度赋能化工行业质量管理:IACheck驱动报告质量跃升与合规风险精准管控新范式
大数据·人工智能
TDengine (老段)3 小时前
TDengine IDMP 工业数据建模 —— 数据情景化
大数据·数据库·人工智能·时序数据库·iot·tdengine·涛思数据
Omics Pro3 小时前
端到端单细胞空间组学数据分析
大数据·数据库·人工智能·算法·数据挖掘·数据分析·aigc
武子康3 小时前
大数据-258 离线数仓 - Livy与Griffin编译安装指南:大数据环境配置实战
大数据·hadoop·后端