Flink集群部署

Flink集群部署

快速上手

创建maven工程,JDK1.8,导入相关依赖

xml 复制代码
   <properties>
        <flink.version>1.17.0</flink.version>
   </properties>


    <dependencies>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-streaming-java</artifactId>
            <version>${flink.version}</version>
        </dependency>

     <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-clients</artifactId>
            <version>${flink.version}</version>
     </dependency>
</dependencies>

Flink集群搭建

需要保证大数据集群三台虚拟机CentOS7(hadoop102,hadoop103,hadoop104)已经完成了ssh免密登录、hadoop集群搭建,配置好host变量为hadoop102,hadoop103,hadoop104等相关工作。未完成的请先看:

https://blog.csdn.net/weixin_73195042/article/details/135886619

集群规划&集群角色分配

节点服务器 hadoop102 hadoop103 hadoop104
角色 JobManagerTaskManager TaskManager TaskManager

部署

从官网下载flink安装包:flink.apache.org/zh/downloads/,本文使用1.17版本。

将安装包上传到/opt/software.,在/opt/software路径上解压flink-1.17.0-bin-scala_2.12.tgz到/opt/module路径上。

复制代码
tar -zxvf flink-1.17.0-bin-scala_2.12.tgz -C /opt/module/

修改集群配置

进入conf路径,修改flink-conf.yaml文件,指定hadoop102节点服务器为JobManager

复制代码
# JobManager节点地址.
jobmanager.rpc.address: hadoop102
jobmanager.bind-host: 0.0.0.0
rest.address: hadoop102
rest.bind-address: 0.0.0.0
# TaskManager节点地址.需要配置为当前机器名
taskmanager.bind-host: 0.0.0.0
taskmanager.host: hadoop102

修改workers文件,指定hadoop102、hadoop103和hadoop104为TaskManager

复制代码
hadoop102
hadoop103
hadoop104

修改masters文件

复制代码
hadoop102:8081

分发安装目录

可以使用scp命令(注意三台虚拟机需要提前配置好免密登录)分发flink文件夹到hadoop103,hadoop104

修改hadoop103的 taskmanager.host

复制代码
 vim flink-conf.yaml

修改如下内容:

复制代码
# TaskManager节点地址.需要配置为当前机器名
taskmanager.host: hadoop103

hadoop104也要修改这个文件,并且配置对应的机器名

启动集群

hadoop102节点服务器上执行start-cluster.sh启动Flink集群。

复制代码
bin/start-cluster.sh

查看进程情况:

复制代码
=============== hadoop102 ===============
81655 TaskManagerRunner
81242 StandaloneSessionClusterEntrypoint
82398 Jps
=============== hadoop103 ===============
74112 Jps
73420 TaskManagerRunner
=============== hadoop104 ===============
74882 Jps
74251 TaskManagerRunner

访问Web UI

启动成功后,同样可以访问http://hadoop102:8081对flink集群和任务进行监控管理。我们能看到当前集群的TaskManager数量为3;由于默认每个TaskManager的Slot数量为1,所以总Slot数和可用Slot数都为3。至此,flink集群搭建成功!

快速删除输错命令

bash 复制代码
esc+删除键(backspace)
ctrl+u

如果用退格删除可能会出现^H,此时我们可以用ctrl+退格键来删除内容。

相关推荐
tebukaopu1489 分钟前
官方 Elasticsearch SQL NLPChina Elasticsearch SQL
大数据·sql·elasticsearch
jiedaodezhuti8 小时前
为什么elasticsearch配置文件JVM配置31G最佳
大数据·jvm·elasticsearch
思通数据8 小时前
AI全域智能监控系统重构商业清洁管理范式——从被动响应到主动预防的监控效能革命
大数据·人工智能·目标检测·机器学习·计算机视觉·数据挖掘·ocr
lilye669 小时前
精益数据分析(55/126):双边市场模式的挑战、策略与创业阶段关联
大数据·人工智能·数据分析
码上地球9 小时前
因子分析基础指南:原理、步骤与地球化学数据分析应用解析
大数据·数据挖掘·数据分析
胡小禾9 小时前
ES常识7:ES8.X集群允许4个 master 节点吗
大数据·elasticsearch·搜索引擎
火龙谷10 小时前
【hadoop】Kafka 安装部署
大数据·hadoop·kafka
强哥叨逼叨10 小时前
没经过我同意,flink window就把数据存到state里的了?
大数据·flink
胡小禾11 小时前
ES常识8:ES8.X如何实现热词统计
大数据·elasticsearch·jenkins
appsvip12 小时前
用短说社区搭建的沉浸式生活方式分享平台
大数据·生活