Flink集群部署

Flink集群部署

快速上手

创建maven工程,JDK1.8,导入相关依赖

xml 复制代码
   <properties>
        <flink.version>1.17.0</flink.version>
   </properties>


    <dependencies>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-streaming-java</artifactId>
            <version>${flink.version}</version>
        </dependency>

     <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-clients</artifactId>
            <version>${flink.version}</version>
     </dependency>
</dependencies>

Flink集群搭建

需要保证大数据集群三台虚拟机CentOS7(hadoop102,hadoop103,hadoop104)已经完成了ssh免密登录、hadoop集群搭建,配置好host变量为hadoop102,hadoop103,hadoop104等相关工作。未完成的请先看:

https://blog.csdn.net/weixin_73195042/article/details/135886619

集群规划&集群角色分配

节点服务器 hadoop102 hadoop103 hadoop104
角色 JobManagerTaskManager TaskManager TaskManager

部署

从官网下载flink安装包:flink.apache.org/zh/downloads/,本文使用1.17版本。

将安装包上传到/opt/software.,在/opt/software路径上解压flink-1.17.0-bin-scala_2.12.tgz到/opt/module路径上。

复制代码
tar -zxvf flink-1.17.0-bin-scala_2.12.tgz -C /opt/module/

修改集群配置

进入conf路径,修改flink-conf.yaml文件,指定hadoop102节点服务器为JobManager

复制代码
# JobManager节点地址.
jobmanager.rpc.address: hadoop102
jobmanager.bind-host: 0.0.0.0
rest.address: hadoop102
rest.bind-address: 0.0.0.0
# TaskManager节点地址.需要配置为当前机器名
taskmanager.bind-host: 0.0.0.0
taskmanager.host: hadoop102

修改workers文件,指定hadoop102、hadoop103和hadoop104为TaskManager

复制代码
hadoop102
hadoop103
hadoop104

修改masters文件

复制代码
hadoop102:8081

分发安装目录

可以使用scp命令(注意三台虚拟机需要提前配置好免密登录)分发flink文件夹到hadoop103,hadoop104

修改hadoop103的 taskmanager.host

复制代码
 vim flink-conf.yaml

修改如下内容:

复制代码
# TaskManager节点地址.需要配置为当前机器名
taskmanager.host: hadoop103

hadoop104也要修改这个文件,并且配置对应的机器名

启动集群

hadoop102节点服务器上执行start-cluster.sh启动Flink集群。

复制代码
bin/start-cluster.sh

查看进程情况:

复制代码
=============== hadoop102 ===============
81655 TaskManagerRunner
81242 StandaloneSessionClusterEntrypoint
82398 Jps
=============== hadoop103 ===============
74112 Jps
73420 TaskManagerRunner
=============== hadoop104 ===============
74882 Jps
74251 TaskManagerRunner

访问Web UI

启动成功后,同样可以访问http://hadoop102:8081对flink集群和任务进行监控管理。我们能看到当前集群的TaskManager数量为3;由于默认每个TaskManager的Slot数量为1,所以总Slot数和可用Slot数都为3。至此,flink集群搭建成功!

快速删除输错命令

bash 复制代码
esc+删除键(backspace)
ctrl+u

如果用退格删除可能会出现^H,此时我们可以用ctrl+退格键来删除内容。

相关推荐
TDengine (老段)1 小时前
TDengine 使用最佳实践(2)
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
Deng9452013142 小时前
基于大数据的电力系统故障诊断技术研究
大数据·matplotlib·深度特征提取·随机森林分类算法·标签编码
Jackyzhe3 小时前
Flink学习笔记:整体架构
笔记·flink
小菜鸡06265 小时前
FlinkSQL通解
大数据·flink
寅鸷5 小时前
es里为什么node和shard不是一对一的关系
大数据·elasticsearch
码字的字节7 小时前
深入解析Hadoop架构设计:原理、组件与应用
大数据·hadoop·分布式·hadoop架构设计
渣渣盟8 小时前
Flink数据流高效写入MySQL实战
mysql·flink·scala
阿里云大数据AI技术9 小时前
云上AI推理平台全掌握 (3):服务接入与全球调度
大数据·人工智能·深度学习
时序数据说10 小时前
如何选择时序数据库:关键因素与实用指南
大数据·数据库·物联网·时序数据库·iotdb
金牌服务刘10 小时前
选择一个系统作为主数据源的优势与考量
大数据·数据分析·连续集成