Flink集群部署

Flink集群部署

快速上手

创建maven工程,JDK1.8,导入相关依赖

xml 复制代码
   <properties>
        <flink.version>1.17.0</flink.version>
   </properties>


    <dependencies>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-streaming-java</artifactId>
            <version>${flink.version}</version>
        </dependency>

     <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-clients</artifactId>
            <version>${flink.version}</version>
     </dependency>
</dependencies>

Flink集群搭建

需要保证大数据集群三台虚拟机CentOS7(hadoop102,hadoop103,hadoop104)已经完成了ssh免密登录、hadoop集群搭建,配置好host变量为hadoop102,hadoop103,hadoop104等相关工作。未完成的请先看:

https://blog.csdn.net/weixin_73195042/article/details/135886619

集群规划&集群角色分配

节点服务器 hadoop102 hadoop103 hadoop104
角色 JobManagerTaskManager TaskManager TaskManager

部署

从官网下载flink安装包:flink.apache.org/zh/downloads/,本文使用1.17版本。

将安装包上传到/opt/software.,在/opt/software路径上解压flink-1.17.0-bin-scala_2.12.tgz到/opt/module路径上。

复制代码
tar -zxvf flink-1.17.0-bin-scala_2.12.tgz -C /opt/module/

修改集群配置

进入conf路径,修改flink-conf.yaml文件,指定hadoop102节点服务器为JobManager

复制代码
# JobManager节点地址.
jobmanager.rpc.address: hadoop102
jobmanager.bind-host: 0.0.0.0
rest.address: hadoop102
rest.bind-address: 0.0.0.0
# TaskManager节点地址.需要配置为当前机器名
taskmanager.bind-host: 0.0.0.0
taskmanager.host: hadoop102

修改workers文件,指定hadoop102、hadoop103和hadoop104为TaskManager

复制代码
hadoop102
hadoop103
hadoop104

修改masters文件

复制代码
hadoop102:8081

分发安装目录

可以使用scp命令(注意三台虚拟机需要提前配置好免密登录)分发flink文件夹到hadoop103,hadoop104

修改hadoop103的 taskmanager.host

复制代码
 vim flink-conf.yaml

修改如下内容:

复制代码
# TaskManager节点地址.需要配置为当前机器名
taskmanager.host: hadoop103

hadoop104也要修改这个文件,并且配置对应的机器名

启动集群

hadoop102节点服务器上执行start-cluster.sh启动Flink集群。

复制代码
bin/start-cluster.sh

查看进程情况:

复制代码
=============== hadoop102 ===============
81655 TaskManagerRunner
81242 StandaloneSessionClusterEntrypoint
82398 Jps
=============== hadoop103 ===============
74112 Jps
73420 TaskManagerRunner
=============== hadoop104 ===============
74882 Jps
74251 TaskManagerRunner

访问Web UI

启动成功后,同样可以访问http://hadoop102:8081对flink集群和任务进行监控管理。我们能看到当前集群的TaskManager数量为3;由于默认每个TaskManager的Slot数量为1,所以总Slot数和可用Slot数都为3。至此,flink集群搭建成功!

快速删除输错命令

bash 复制代码
esc+删除键(backspace)
ctrl+u

如果用退格删除可能会出现^H,此时我们可以用ctrl+退格键来删除内容。

相关推荐
项目整合库3 小时前
Coinstore B.KU 数字金融与 RWA 主题活动圆满举行
大数据·金融
kekekka4 小时前
2026年软文营销平台深度甄选指南:破解选择困境,聚焦长效价值
大数据·媒体
华奥系科技4 小时前
老旧社区适老化智能改造,两个系统成社区标配项目
大数据·人工智能
Jackyzhe4 小时前
Flink源码阅读:Netty通信
大数据·flink
反向跟单策略4 小时前
期货反向跟单—高频换人能够提高跟单效率?
大数据·人工智能·学习·数据分析·区块链
Java 码农4 小时前
RabbitMQ集群部署方案及配置指南08--电商业务延迟队列定制化方案
大数据·分布式·rabbitmq
艾莉丝努力练剑4 小时前
【优选算法必刷100题:专题五】(位运算算法)第033~38题:判断字符是否唯一、丢失的数字、两整数之和、只出现一次的数字 II、消失的两个数字
java·大数据·运维·c++·人工智能·算法·位运算
渡我白衣5 小时前
计算机组成原理(14):算术逻辑单元ALU
大数据·人工智能·算法·机器学习·计组·数电·alu
韶关亿宏科技-光纤通信小易5 小时前
光模块-数字时代的算力传输纽带
大数据·网络
武子康5 小时前
大数据-208 岭回归与Lasso回归:区别、应用与选择指南
大数据·后端·机器学习