大数据组件-Flume集群环境的启动与验证

🥇🥇【大数据学习记录篇】-持续更新中~🥇🥇


个人主页:beixi@

本文章收录于专栏(点击传送):【大数据学习】
💓💓持续更新中,感谢各位前辈朋友们支持学习~💓💓

上一篇文章写到了Flume集群环境的安装,这篇文章接着上篇文章延伸Flume集群环境的启动与验证,如果Flume集群环境没有搭建的小伙伴们可以参考我上一篇文章:大数据组件-Flume集群环境搭建

文章目录

1.环境介绍

本次用到的环境有:
Oracle Linux 7.4,三台虚拟机,分别为master,slave1,slave2
JDK1.8.0_144
Hadoop2.7.4集群环境
Flume1.6.0

2.Flume集群环境的启动与验证

1.在master机上启动flume

bash 复制代码
/opt/flume/bin/flume-ng agent -n a1 -c conf -f /opt/flume/conf/master.conf -Dflume.root.logger=INFO,console &

2.切换slave1,启动slave1上的flume

bash 复制代码
/opt/flume/bin/flume-ng agent -n a1 -c conf -f /opt/flume/conf/slave.conf -Dflume.root.logger=INFO,console &


3.切换至slave2,启动slave2上的flume

bash 复制代码
/opt/flume/bin/flume-ng agent -n a1 -c conf -f /opt/flume/conf/slave.conf -Dflume.root.logger=INFO,console &


4.切换至"从节点1,双击桌面上的"Xfce终端"图标重新打开一个命令窗口。
5.新建立文件slave1.txt,输入如下内容,拷贝至flume的logs目录。

bash 复制代码
vi slave1.txt
bash 复制代码
I'm slave1

6.按键Esc,按键":wq!"保存退出。
7.拷贝文件slave1.txt至flume的logs目录。

bash 复制代码
cp slave1.txt /root/flume/logs

8.切换至"主节点",查看master机的启动命令窗口,会看到写入描述。

9.在"主节点",双击桌面上的"Xfce终端"图标重新打开一个命令窗口。

10.在"主节点"新打开一个命令窗口中查看HDFS日志上传情况列表。

bash 复制代码
hadoop dfs -lsr /flume

11.查看HDFS列表中日志的内容,即上一步截图中红框中的文件内容。注意:这个日志文件每次上传名会不一样,本次查询文件名为上图红框所示。

bash 复制代码
hadoop dfs -cat /flume/events/root/events-.1553582353270

12.切换至"从节点2",双击桌面上的"Xfce终端"图标重新打开一个命令窗口。
13.新建立文件slave2.txt,输入如下内容,拷贝至flume的logs目录。

bash 复制代码
vi slave2.txt
bash 复制代码
I'm slave2

14.按键Esc,按键":wq!"保存退出。
15.拷贝文件slave2.txt至flume的logs目录。

bash 复制代码
cp slave2.txt /root/flume/logs

16.切换至"主节点",查看master机的启动命令窗口,会看到写入描述,此时表示新内容写入HDFS完成,然后可查看HDFS里新加的内容。

17.在"主节点",双击桌面上的"Xfce终端"图标重新打开一个命令窗口。

18.在"主节点"新打开一个命令窗口中查看HDFS日志上传情况列表。

bash 复制代码
hadoop dfs -lsr /flume

19.查看HDFS日志上传列表中日志的内容,即上一步截图中红框中的文件内容。注意:这个日志文件每次上传名会不一样,本次查询文件名为上图红框所示。

bash 复制代码
hadoop dfs -cat /flume/events/root/events-.1553583628068


至此,Flume集群环境的启动与验证就到此结束了,如果本篇文章对你有帮助记得点赞收藏+关注~

相关推荐
进击的小小学生4 分钟前
2024年第45周ETF周报
大数据·人工智能
陈yanyu20 分钟前
Linux - 弯路系列3:安装和编译libvirt-4.5.0及虚拟网卡virbr0(virbr0-nic)创建
linux·运维·服务器
青云交21 分钟前
大数据新视界 -- 大数据大厂之 Impala 性能优化:数据加载策略如何决定分析速度(上)(15/30)
大数据·impala·数据加载策略·分析速度·全量加载·增量加载·优化技巧
逃跑的羊1 小时前
jenkins提交gitee后自动部署
运维·gitee·jenkins
数据猿1 小时前
【金猿案例展】科技日报——大数据科技资讯服务平台
大数据·科技
学习向前冲1 小时前
安装一键式重置密码插件(Linux)-CloudResetPwdAgent
linux·运维·服务器
RobinDevNotes2 小时前
自动化构建镜像:Packer
运维·packer
fareast_mzh2 小时前
Setting Up a Simple Live Streaming Server on Debian 11
运维·debian·直播
CodingBrother3 小时前
Kafka简单实践
分布式·kafka
Matrix703 小时前
HBase理论_HBase架构组件介绍
大数据·数据库·hbase