openEuler24.03 LTS下安装Flink

- Flink的安装模式
- 下载Flink
- 安装Local模式
- - 前提条件
  - 解压安装包
  - 启动集群
  - 查看进程
  - 提交作业
  - - 文件WordCount
    - 持续流WordCount
  - [查看Web UI](#查看Web UI)
  - - 配置flink-conf.yaml
    - 简单使用
  - 关闭集群
- [Standalone Session模式](#Standalone Session模式)
- - 前提条件
  - Flink集群规划
  - 解压安装包
  - 配置flink
  - 分发到其他机器
  - - 分发安装目录
    - 修改node3和node4的配置
  - 启动flink集群
  - 查看进程
  - [Web UI](#Web UI)
  - 提交应用测试
  - - 文件WordCount
    - 持续流WordCount
  - 关闭flink集群
- YARN模式

Flink的安装模式

（1）Local模式：所有Flink 组件（JobManager、TaskManager）都会在同一个 JVM 进程中运行，用于本地开发调试。

（2）Standalone Session模式：独立集群部署，需预先启动Flink进程，测试环境或小规模生产场景‌。

（3）Yarn模式：基于Hadoop YARN资源管理器，支持动态资源分配和自动容错‌，适合与Hadoop生态整合（如HDFS、YARN）的大规模生产环境‌。提供三种子模式：

**会话模式（Session Mode）**‌：创建并长期保持一个JobManager，当需要有作业提交，则动态创建TaskManager，作业完成回收TaskManager资源，多个作业共享一个JobManager集群资源。
**单作业模式（Per-Job Mode）**‌：每个作业单独启动一个集群，按作业隔离资源，避免资源竞争‌，作业完成后回收集群资源，应用代码在客户端节点运行。
**应用模式（Application Mode）**‌：与单作业模式类似，也是一个作业单独启动一个集群，作业完成后回收集群资源，但将应用代码提交至JobManager执行，减少客户端负载‌。

（4）K8S模式：基于容器化技术，支持自动扩缩容和弹性伸缩‌，每个JobManager/TaskManager以Pod形式运行，资源隔离性强‌，适合云原生环境‌，被认为是未来主流部署方式。

下载Flink

下载Flink，并上传到Linux /opt/software目录

复制代码

# 国内下载
https://mirrors.tuna.tsinghua.edu.cn/apache/flink/flink-1.17.2/flink-1.17.2-bin-scala_2.12.tgz

# 或者官网下载
https://archive.apache.org/dist/flink/flink-1.17.2/flink-1.17.2-bin-scala_2.12.tgz

安装Local模式

在node2机器上进行，解压后无需任何配置即可直接使用。

前提条件

有1台Linux机器，且安装好jdk，这里是jdk8，可参考：openEuler24.03 LTS下安装Hadoop3完全分布式-安装Java

解压安装包

解压并重命名

复制代码

[liang@node2 spark-yarn]$ cd /opt/software/
[liang@node2 software]$ ls | grep flink
flink-1.17.2-bin-scala_2.12.tgz
[liang@node2 software]$ tar -zxvf flink-1.17.2-bin-scala_2.12.tgz -C /opt/module
[liang@node2 software]$ cd /opt/module
[liang@node2 software]$ mv flink-1.17.2 flink-local

启动集群

复制代码

[liang@node2 software]$ cd /opt/module/flink-local
[liang@node2 flink-local]$ ls
bin  conf  examples  lib  LICENSE  licenses  log  NOTICE  opt  plugins  README.txt
[liang@node2 flink-local]$ ls bin/
bash-java-utils.jar  kubernetes-jobmanager.sh   start-zookeeper-quorum.sh
config.sh            kubernetes-session.sh      stop-cluster.sh
find-flink-home.sh   kubernetes-taskmanager.sh  stop-zookeeper-quorum.sh
flink                pyflink-shell.sh           taskmanager.sh
flink-console.sh     sql-client.sh              yarn-session.sh
flink-daemon.sh      sql-gateway.sh             zookeeper.sh
historyserver.sh     standalone-job.sh
jobmanager.sh        start-cluster.sh
[liang@node2 flink-local]$ bin/start-cluster.sh

查看进程

复制代码

[liang@node2 flink-local]$ jps
7717 StandaloneSessionClusterEntrypoint
8006 TaskManagerRunner
8121 Jps

提交作业

文件WordCount

复制代码

$ bin/flink run examples/streaming/WordCount.jar

输出过程

复制代码

[liang@node2 flink-local]$ bin/flink run examples/streaming/WordCount.jar
Executing example with default input data.
Use --input to specify file input.
Printing result to stdout. Use --output to specify output path.
Job has been submitted with JobID b4f0874e1e377c83fc830baf1767413a
Program execution finished
Job with JobID b4f0874e1e377c83fc830baf1767413a has finished.
Job Runtime: 886 ms

查看结果

查看输出的WordCount结果的末尾10行数据

复制代码

[liang@node2 flink-local]$ ls log/
flink-liang-client-node2.log
flink-liang-standalonesession-0-node2.log
flink-liang-standalonesession-0-node2.log.1
flink-liang-standalonesession-0-node2.out
flink-liang-taskexecutor-0-node2.log
flink-liang-taskexecutor-0-node2.out
[liang@node2 flink-local]$ tail log/flink-*-taskexecutor-*.out

执行过程

复制代码

[liang@node2 flink-local]$ tail log/flink-*-taskexecutor-*.out
(nymph,1)
(in,3)
(thy,1)
(orisons,1)
(be,4)
(all,2)
(my,1)
(sins,1)
(remember,1)
(d,4)

持续流WordCount

使用 SocketWindowWordCount 示例实时接收 Socket 输入

终端1：发送数据终端

复制代码

$ nc -lk 9999

终端2：打开新的终端，提交作业

复制代码

$ cd /opt/module/flink-local
$ bin/flink run examples/streaming/SocketWindowWordCount.jar --hostname localhost --port 9999

在发送数据终端发送数据

查看结果

打开新的终端，命令行查看结果，每行计算一次结果

复制代码

[liang@node2 ~]$ cd /opt/module/flink-local
[liang@node2 flink-local]$ tail -f log/flink-liang-taskexecutor-0-node2.out

查看Web UI

local模式仅支持命令行查看，不支持浏览器访问。

复制代码

[liang@node2 flink-local]$ curl localhost:8081

浏览器查看

复制代码

node2:8081

要能查看到Web UI还需要配置Flink。

配置flink-conf.yaml

复制代码

[liang@node2 flink-local]$ cd conf
[liang@node2 conf]$ vim flink-conf.yaml

找到相关配置项并修改，如下

复制代码

jobmanager.rpc.address: node2
jobmanager.bind-host: 0.0.0.0
taskmanager.bind-host: 0.0.0.0
taskmanager.host: node2
rest.address: node2
rest.bind-address: 0.0.0.0

这样配置支持Web UI访问，也支持远程提交作业。

注意：配置flink-conf.yaml后，local模式就变成Flink伪分布了。

特性‌	‌Local模式‌	‌伪分布模式（Standalone模式）‌
‌适用场景‌	单机本地快速测试，验证代码逻辑或简单性能‌	单机模拟集群环境，用于开发调试或学习多组件交互（如JobManager与TaskManager）‌
‌资源管理‌	无需启动独立进程，由本地JVM线程模拟所有组件（JobManager + TaskManager）‌	需启动独立进程：JobManager（主节点）和至少1个TaskManager（工作节点）‌
‌Web UI‌	默认不启用Web界面‌	提供Web UI（默认端口8081），可监控任务状态、日志和资源配置‌
‌网络配置‌	仅本地回环地址（127.0.0.1），无法远程访问‌	可绑定真实IP地址（如0.0.0.0），支持远程提交作业和访问Web UI‌
‌容错性‌	无高可用机制，进程崩溃则任务终止‌	支持高可用配置（需依赖ZooKeeper），但单机伪分布下通常不启用‌

重启集群

bash 复制代码

[liang@node2 conf]$ cd ..
[liang@node2 flink-local]$ ls bin/
bash-java-utils.jar  kubernetes-jobmanager.sh   start-zookeeper-quorum.sh
config.sh            kubernetes-session.sh      stop-cluster.sh
find-flink-home.sh   kubernetes-taskmanager.sh  stop-zookeeper-quorum.sh
flink                pyflink-shell.sh           taskmanager.sh
flink-console.sh     sql-client.sh              yarn-session.sh
flink-daemon.sh      sql-gateway.sh             zookeeper.sh
historyserver.sh     standalone-job.sh
jobmanager.sh        start-cluster.sh
[liang@node2 flink-local]$ bin/stop-cluster.sh
Stopping taskexecutor daemon (pid: 8006) on host node2.
Stopping standalonesession daemon (pid: 7717) on host node2.
[liang@node2 flink-local]$
[liang@node2 flink-local]$ bin/start-cluster.sh
Starting cluster.
Starting standalonesession daemon on host node2.
Starting taskexecutor daemon on host node2.
[liang@node2 flink-local]$ jps
9220 StandaloneSessionClusterEntrypoint
9509 TaskManagerRunner
9595 Jps

浏览器访问

复制代码

node2:8081

简单使用

文件的WordCount

测试提交WordCount作业

复制代码

$ bin/flink run examples/streaming/WordCount.jar

执行过程

复制代码

[liang@node2 flink-local]$ bin/flink run examples/streaming/WordCount.jar
Executing example with default input data.
Use --input to specify file input.
Printing result to stdout. Use --output to specify output path.
Job has been submitted with JobID 3f939fb4b8d4c2dab4d47d7b5f4cc389
Program execution finished
Job with JobID 3f939fb4b8d4c2dab4d47d7b5f4cc389 has finished.
Job Runtime: 913 ms

查看输出的WordCount结果的末尾10行数据

复制代码

$ tail log/flink-*-taskexecutor-*.out

执行过程

复制代码

[liang@node2 flink-local]$ tail log/flink-*-taskexecutor-*.out
(nymph,1)
(in,3)
(thy,1)
(orisons,1)
(be,4)
(all,2)
(my,1)
(sins,1)
(remember,1)
(d,4)

查看Web UI

输入数据有限，所以计算会完成。

持续流WordCount

使用 SocketWindowWordCount 示例实时接收 Socket 输入

终端1：发送数据终端

复制代码

$ nc -lk 9999

终端2：打开新的终端，提交作业

复制代码

$ cd /opt/module/flink-local
$ bin/flink run examples/streaming/SocketWindowWordCount.jar --hostname localhost --port 9999

在发送数据终端发送数据

提交作业终端

打开新的终端，命令行查看结果，每行计算一次结果

复制代码

[liang@node2 ~]$ cd /opt/module/flink-local/
[liang@node2 flink-local]$ ls
bin  conf  examples  lib  LICENSE  licenses  log  NOTICE  opt  plugins  README.txt
[liang@node2 flink-local]$ ls log/
flink-liang-client-node2.log                 flink-liang-taskexecutor-0-node2.log
flink-liang-standalonesession-0-node2.log    flink-liang-taskexecutor-0-node2.log.1
flink-liang-standalonesession-0-node2.log.1  flink-liang-taskexecutor-0-node2.log.2
flink-liang-standalonesession-0-node2.log.2  flink-liang-taskexecutor-0-node2.out
flink-liang-standalonesession-0-node2.out
[liang@node2 flink-local]$ tail -f log/flink-liang-taskexecutor-0-node2.out
hello : 1
flink : 1
hello : 1
hadoop : 1

Web UI查看结果

关闭集群

复制代码

$ bin/stop-cluster.sh

jps查看进程

复制代码

$ jps

执行过程

复制代码

[liang@node2 flink-local]$ bin/stop-cluster.sh
Stopping taskexecutor daemon (pid: 9509) on host node2.
Stopping standalonesession daemon (pid: 9220) on host node2.
[liang@node2 flink-local]$ jps
10579 Jps

Standalone Session模式

安装Flink Standalone 完全分布集群

前提条件

有三台Linux机器

三台机器均安装好jdk，这里使用jdk8，可参考：openEuler24.03 LTS下安装Hadoop3完全分布式-安装Java

Flink集群规划

node2	node3	node4
JobManager
TaskManager	TaskManager	TaskManager

解压安装包

解压并重命名

复制代码

[liang@node2 software]$ tar -zxvf flink-1.17.2-bin-scala_2.12.tgz -C /opt/module
[liang@node2 software]$ cd /opt/module
[liang@node2 module]$ mv flink-1.17.2 flink-standalone

进入到解压后的目录，查看包含的文件

复制代码

[liang@node2 module]$ cd flink-standalone
[liang@node2 flink-standalone]$ ls
bin  conf  examples  lib  LICENSE  licenses  log  NOTICE  opt  plugins  README.txt

配置flink

进入flink配置目录，查看配置文件

复制代码

[liang@node2 ~]$ cd conf
[liang@node2 conf]$ ls
flink-conf.yaml           log4j.properties          logback-session.xml  workers
log4j-cli.properties      log4j-session.properties  logback.xml          zoo.cfg
log4j-console.properties  logback-console.xml       masters

配置flink-conf.yaml

复制代码

[liang@node2 conf]$ vim flink-conf.yaml

找到相关配置项并修改，如下

复制代码

jobmanager.rpc.address: node2
jobmanager.bind-host: 0.0.0.0
taskmanager.bind-host: 0.0.0.0
taskmanager.host: node2
rest.address: node2
rest.bind-address: 0.0.0.0

配置workers

复制代码

[liang@node2 conf]$ vim workers

把原有内容删除，添加内容如下：

复制代码

node2
node3
node4

配置masters

复制代码

[liang@node2 conf]$ vim masters

修改后内容如下：

复制代码

node2:8081

分发到其他机器

分发安装目录

复制代码

[liang@node2 conf]$ xsync /opt/module/flink-standalone

修改node3和node4的配置

分别修改node3、node4机器的flink-conf.yaml文件，将taskmanager.host的值修改为所在机器的主机名。

node3机器

进入node3机器flink的配置目录

复制代码

[liang@node3 ~]$ cd /opt/module/flink-standalone/conf/

配置flinke-conf.yaml文件

复制代码

[liang@node3 conf]$ vim flink-conf.yaml

将taskmanager.host的值修改为node3

复制代码

taskmanager.host: node3

node4机器

进入node4机器flink的配置目录

复制代码

[liang@node4 ~]$ cd /opt/module/flink-standalone/conf/

配置flinke-conf.yaml文件

复制代码

[liang@node4 conf]$ vim flink-conf.yaml

将taskmanager.host的值修改为node4

复制代码

taskmanager.host: node4

启动flink集群

在node2机器，执行启动集群命令

复制代码

[liang@node2 conf]$ cd ..
[liang@node2 flink-standalone]$ bin/start-cluster.sh
Starting cluster.
Starting standalonesession daemon on host node2.
Starting taskexecutor daemon on host node2.
Starting taskexecutor daemon on host node3.
Starting taskexecutor daemon on host node4.

查看进程

jps查看进程

复制代码

[liang@node2 flink-standalone]$ jpsall
=============== node2 ===============
10116 Jps
9557 StandaloneSessionClusterEntrypoint
9977 TaskManagerRunner
=============== node3 ===============
2342 TaskManagerRunner
2431 Jps
=============== node4 ===============
2340 TaskManagerRunner
2430 Jps

注意：如果没有jpsall命令，就分别在node2、node3、node4执行jps命令

node2有StandaloneSessionClusterEntrypoint、TaskManagerRunner进程

node3有TaskManagerRunner进程

node4有TaskManagerRunner进程

看到如上进程，说明Flink Standalone集群配置成功。

Web UI

浏览器主机名:8081访问

复制代码

node2:8081

提交应用测试

文件WordCount

复制代码

[liang@node2 flink-standalone]$ bin/flink run examples/streaming/WordCount.jar
Executing example with default input data.
Use --input to specify file input.
Printing result to stdout. Use --output to specify output path.
Job has been submitted with JobID ee8f5d8b493be0ad1463a072b11c4586
Program execution finished
Job with JobID ee8f5d8b493be0ad1463a072b11c4586 has finished.
Job Runtime: 1080 ms

查看结果有两种方式：

命令行查看
Web UI查看

命令行查看结果

查看输出的wordcount结果的末尾10行数据

复制代码

[liang@node2 flink-standalone]$ tail log/flink-*-taskexecutor-*.out
(nymph,1)
(in,3)
(thy,1)
(orisons,1)
(be,4)
(all,2)
(my,1)
(sins,1)
(remember,1)
(d,4)

Web UI查看作业结果

复制代码

node2:8081

查看作业

查看作业结果

点击查看TaskManagers，点击其中一个TaskManager机器，点击Stdout能查看到作业结果

点击node2:38277-0fc879，点击Stdout

注意：如果node2查看不到，可以返回点击其他机器查看。

持续流WordCount

使用 SocketWindowWordCount 示例实时接收 Socket 输入

发送数据终端

复制代码

$ nc -lk 9999

打开新的终端，提交作业

复制代码

$ cd /opt/module/flink-standalone
$ bin/flink run examples/streaming/SocketWindowWordCount.jar --hostname node2 --port 9999

在发送数据终端发送数据

复制代码

hello flink standalone mode
hello world

Web UI查看作业结果

查看作业

查看结果

点击node3:38219-8077d2，点击stdout

在node3查看到结果，说明是使用node3的Task Manager进行计算的。

关闭flink集群

在node2机器，执行关闭集群命令

复制代码

[liang@node2 flink-standalone]$ bin/stop-cluster.sh
Stopping taskexecutor daemon (pid: 9977) on host node2.
Stopping taskexecutor daemon (pid: 2342) on host node3.
Stopping taskexecutor daemon (pid: 2340) on host node4.
Stopping standalonesession daemon (pid: 9557) on host node2.

jps查看进程

复制代码

[liang@node2 flink-standalone]$ jpsall
=============== node2 ===============
11575 Jps
=============== node3 ===============
2935 Jps
=============== node4 ===============
2914 Jps

YARN模式

Flink作为客户端，把作业提交到Yarn中计算

只需在node2机器安装Flink

前提条件

安装好Hadoop完全分布式集群，可参考：openEuler24.03 LTS下安装Hadoop3完全分布式

解压安装包

解压并重命名

复制代码

[liang@node2 ~]$ cd /opt/software
[liang@node2 software]$ tar -zxvf flink-1.17.2-bin-scala_2.12.tgz -C /opt/module
[liang@node2 software]$ cd /opt/module
[liang@node2 module]$ mv flink-1.17.2 flink-yarn

配置环境变量

复制代码

[liang@node2 module]$ sudo vim /etc/profile.d/my_env.sh

添加如下环境变量，让Flink能找到Hadoop

复制代码

#FLINK YARN MODE NEED
export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export HADOOP_CLASSPATH=`hadoop classpath`

让环境变量生效

复制代码

[liang@node2 module]$ source /etc/profile

分发环境变量

复制代码

[liang@node2 module]$ sudo /home/liang/bin/xsync /etc/profile.d/my_env.sh

根据提示输入node2机器root账号的密码

分别在node3、node4让环境变量生效

复制代码

[liang@node3 conf]$ source /etc/profile
[liang@node4 conf]$ source /etc/profile

启动Hadoop集群

复制代码

$ hdp.sh start

提交应用测试

会话模式

开启一个YARN会话来启动一个Flink session集群

复制代码

[liang@node2 module]$ cd flink-yarn
[liang@node2 flink-yarn]$ bin/yarn-session.sh -nm test

输入部分日志如下

可以看到JobManager的Web UI地址为

复制代码

http://node3:35665

注意：端口号是随机的

浏览器访问看到Web UI地址

说明在Yarn的Container中创建了一个Flink Session集群

提交应用集群

提交应用有两种方式：

命令行方式
Web UI方式

命令行方式

打开新的终端

复制代码

$ cd /opt/module/flink-yarn
$ bin/flink run examples/streaming/WordCount.jar

客户端可以自行确定JobManager的地址，也可以通过-m或者-jobmanager参数指定JobManager的地址，JobManager地址在YARN Session启动页面中找到。

Web UI查看作业

复制代码

node3:35665

查看结果

查看Task Managers没有任何信息，原因是因为运行完成后，为了节约资源，释放了Task Manager

要看到结果，重新执行一次作业，快速地查看Web UI 的Task Managers，看到如下结果。

Web UI方式

准备jar包

下载Flink自带的example jar包

打开新的终端，执行nc命令发送数据

复制代码

[liang@node3 module]$ nc -lk 9999

浏览器访问，基于Web UI提交应用jar包

复制代码

node3:35665

选择SocketWjarindowWordCount.jar后，点击如下界面jar包名称设置作业

填写如下参数，点击Submit提交

复制代码

--hostname node3 --port 9999

查看到正在运行的作业

在nc终端，发送数据，例如：

复制代码

hello flink hello world

返回Web UI查看结果

点击Task Managers，点击container_1742653773403_0001_01_000009

取消作业

点击作业名称

点击Cancel Job，点击Yes

计算文件作业

重新提交另外一个jar：WordCount.jar

不填写任何参数，直接点击Submit

查看结果

结束Yarn Session会话

返回执行Yarn Session命令的终端，按Ctrl + c 返回命令行

Yarn会话模式总结：

Yarn 会话模式，通过yarn-session.sh命令在Yarn Container创建一个JobManager，并保持这个JobManager。当有作业提交时，会动态创建TaskManager，当作业完后后，会回收TaskManager。

单作业模式

Yarn模式下，需要使用HDFS文件

创建输入测试文件

复制代码

[liang@node2 flink-yarn]$ ls
bin  conf  examples  lib  LICENSE  licenses  log  NOTICE  opt  plugins  README.txt
[liang@node2 flink-yarn]$ vim input.txt

内容如下

复制代码

hello yarn mode
hello flink
hello hadoop

将input.txt上传到HDFS

复制代码

$ hdfs dfs -put input.txt /

提交作业

使用单作业模式提交作业

复制代码

$ bin/flink run -d -t yarn-per-job -Dclassloader.check-leaked-classloader=false examples/streaming/WordCount.jar \
--input hdfs://node2:8020/input.txt \
--output hdfs://node2:8020/output

注意：yarn模式下，输入数据都为HDFS的路径，output是一个输出目录，执行命令之前，输出目录不能存在。

查看结果

执行命令后，等待运行作业结束，查看输出目录

复制代码

[liang@node2 flink-yarn]$ hdfs dfs -ls /
Found 8 items
-rw-r--r--   1 liang supergroup         25 2025-03-18 23:17 /1.txt
drwxr-xr-x   - liang supergroup          0 2025-03-21 23:21 /hbase
-rw-r--r--   1 liang supergroup         41 2025-03-22 23:54 /input.txt
drwxr-xr-x   - liang supergroup          0 2025-03-18 23:18 /out
drwxr-xr-x   - liang supergroup          0 2025-03-23 00:07 /output
drwxr-xr-x   - liang supergroup          0 2025-03-22 18:31 /spark-evenlog-directory
drwx------   - liang supergroup          0 2025-03-19 15:16 /tmp
drwxr-xr-x   - liang supergroup          0 2025-03-19 15:18 /user
[liang@node2 flink-yarn]$ hdfs dfs -ls /output
Found 1 items
drwxr-xr-x   - liang supergroup          0 2025-03-23 00:07 /output/2025-03-23--00
[liang@node2 flink-yarn]$ hdfs dfs -ls /output/2025-03-23--00
Found 1 items
-rw-r--r--   1 liang supergroup         69 2025-03-23 00:07 /output/2025-03-23--00/part-0d077c9e-7a99-4eca-8c91-7c21ffaa1cec-0
[liang@node2 flink-yarn]$ hdfs dfs -cat /output/2025-03-23--00/part-0d077c9e-7a99-4eca-8c91-7c21ffaa1cec-0
(hello,1)
(yarn,1)
(mode,1)
(hello,2)
(flink,1)
(hello,3)
(hadoop,1)

应用模式

文件Wordcount

执行如下命令

复制代码

$ bin/flink run-application -t yarn-application -d examples/streaming/WordCount.jar \
--input hdfs://node2:8020/input.txt \
--output hdfs://node2:8020/output1

等待运行结束，查看结果

复制代码

[liang@node2 flink-yarn]$ hdfs dfs -ls /
Found 9 items
-rw-r--r--   1 liang supergroup         25 2025-03-18 23:17 /1.txt
drwxr-xr-x   - liang supergroup          0 2025-03-21 23:21 /hbase
-rw-r--r--   1 liang supergroup         41 2025-03-22 23:54 /input.txt
drwxr-xr-x   - liang supergroup          0 2025-03-18 23:18 /out
drwxr-xr-x   - liang supergroup          0 2025-03-23 00:07 /output
drwxr-xr-x   - liang supergroup          0 2025-03-23 00:12 /output1
drwxr-xr-x   - liang supergroup          0 2025-03-22 18:31 /spark-evenlog-directory
drwx------   - liang supergroup          0 2025-03-19 15:16 /tmp
drwxr-xr-x   - liang supergroup          0 2025-03-19 15:18 /user
[liang@node2 flink-yarn]$ hdfs dfs -ls /output1
Found 1 items
drwxr-xr-x   - liang supergroup          0 2025-03-23 00:12 /output1/2025-03-23--00
[liang@node2 flink-yarn]$ hdfs dfs -ls /output1/2025-03-23--00
Found 1 items
-rw-r--r--   1 liang supergroup         69 2025-03-23 00:12 /output1/2025-03-23--00/part-01662fc4-01e6-45a4-858c-5443fc2b31f0-0
[liang@node2 flink-yarn]$ hdfs dfs -cat /output1/2025-03-23--00/*
(hello,1)
(yarn,1)
(mode,1)
(hello,2)
(flink,1)
(hello,3)
(hadoop,1)

持续流WordCount

终端1：在node2 发送数据终端

复制代码

[liang@node2 flink-yarn]$ nc -lk 9999

终端2：打开新的终端，提交作业

复制代码

$ cd /opt/module/flink-yarn
$ bin/flink run-application -t yarn-application -d examples/streaming/SocketWindowWordCount.jar --hostname node2 --port 9999