2023_Spark_实验二十八:Flume部署及配置

实验目的:熟悉掌握Flume部署及配置

实验方法:通过在集群中部署Flume,掌握Flume配置

实验步骤:

一、Flume简介

Flume是一种分布式的、可靠的和可用的服务,用于有效地收集、聚合和移动大量日志数据。它有一个简单灵活的基于流数据流的体系结构。它具有健壮性和容错性,具有可调可靠性机制和多种故障转移和恢复机制。它使用了一个简单的可扩展数据模型,允许在线分析应用程序。其体系结构如下:

二、Flume安装与配置

下载Flume

https://archive.apache.org/dist/flume/1.9.0/apache-flume-1.9.0-bin.tar.gz

安装Flume

将下载好的Flume上传到集群中主节点,解压【注意改成自己的安装部署路径】

bash 复制代码
tar -zvxf apache-flume-1.9.0-bin.tar.gz -C /opt/module

配置Flume环境变量,在~/.bash_profile 或 ~/.bashrc中配置

bash 复制代码
# FLUME_HOME
FLUEM_HOME=/opt/module/apache-flume-1.9.0-bin

PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$KAFKA_HOME/bin:$HIVE_HOME/bin:$FLUEM_HOME/bin:$SPARK_HOME/bin

export JAVA_HOME HADOOP_HOME KAFKA_HOME HIVE_HOME FLUEM_HOME SPARK_HOME PATH

让环境变量生效并检查效果

bash 复制代码
# 刷新环境变量
source ~/.bash_profile

# 检查flume效果
flume-ng version

三、Flume基本操作

Flume的基础操作教程资料:

Flume 1.9.0 User Guide --- Apache Flume

Flume入门案例

简单Flume使用案例:通过一个单节点Flume部署。此配置允许用户生成事件并随后将其记录到控制台。

在Flume的安装目录conf下,创建一个hello.conf配置文件

bash 复制代码
#声明三种组件 a1 = agent1
a1.sources = r1
a1.channels = c1
a1.sinks = k1
#定义source信息
a1.sources.r1.type=netcat
a1.sources.r1.bind=hd1
a1.sources.r1.port=9888
#定义sink信息
a1.sinks.k1.type=logger
#定义channel信息
a1.channels.c1.type=memory
a1.channels.c1.capacity=1000
a1.channels.c1.transactionCapacity=100
#绑定在一起
a1.sources.r1.channels=c1
a1.sinks.k1.channel=c1

启动flume

bash 复制代码
/opt/module/apache-flume-1.9.0-bin/bin/flume-ng agent -f /opt/module/apache-flume-1.9.0-bin/conf/hello.conf -n a1 -Dflume.root.logger=INFO,console

重新打开一个terminal 远程回话,启动nc,检查启动的flume是否收到消息。

bash 复制代码
nc hd1 9888

通过简单测试确定flume已经正常部署

实验结果:

本次实验通过在集群中单节点部署flume,并通过一个简单案例掌握flume使用方法。成功实现通过flume采集网络字节流数据。

相关推荐
Elastic 中国社区官方博客2 小时前
使用 Elastic Cloud Serverless 扩展批量索引
大数据·运维·数据库·elasticsearch·搜索引擎·云原生·serverless
Dxy12393102163 小时前
Elasticsearch 8.13.4 内存占用过大如何处理
大数据·elasticsearch·搜索引擎
qq_12498707536 小时前
基于深度学习的蘑菇种类识别系统的设计与实现(源码+论文+部署+安装)
java·大数据·人工智能·深度学习·cnn·cnn算法
泰迪智能科技6 小时前
新疆高校大数据人工智能实验室建设案例
大数据·人工智能
Light606 小时前
数据战争的星辰大海:从纷争到融合,五大核心架构的终局之战与AI新纪元
大数据·人工智能·数据治理·湖仓一体·数据中台·数据架构·选型策略
qq_348231856 小时前
市场快评 · 今日复盘20251231
大数据
小北方城市网6 小时前
Python + 前后端全栈进阶课程(共 10 节|完整版递进式|从技术深化→项目落地→就业进阶,无缝衔接基础课)
大数据·开发语言·网络·python·数据库架构
喜欢编程的小菜鸡7 小时前
2025:中国大数据行业的“价值觉醒”之年——从规模基建到效能释放的历史性转折
大数据
策知道7 小时前
从“抗旱保苗”到“修渠引水”:读懂五年财政政策的变奏曲
大数据·数据库·人工智能·搜索引擎·政务
XC131489082677 小时前
法律行业获客,如何用科技手段突破案源瓶颈的实操方法
大数据·人工智能·科技