Flume 安装与部署

目录

Flume 下载地址

(1)将 apache-flume-1.9.0-bin.tar.gz 上传到 linux 的 /opt/software 目录下

(2)解压 apache-flume-1.9.0-bin.tar.gz/opt/module/ 目录下

powershell 复制代码
huwei@hadoop101 ~]$ tar -zxvf /opt/software/apache-flume-1.9.0-bin.tar.gz -C /opt/module/

(3)修改 apache-flume-1.9.0-bin 的名称为 flume-1.9.0

powershell 复制代码
huwei@hadoop101 ~]$ cd /opt/module
[huwei@hadoop101 module]$ mv apache-flume-1.9.0-bin/ flume-1.9.0

(4)配置环境变量

powershell 复制代码
[huwei@hadoop101 module]$ sudo vim /etc/profile.d/my_env.sh

添加如下内容

复制代码
# Flume
export FLUME_HOME=/opt/module/flume-1.9.0
export PATH=$PATH:$FLUME_HOME/bin

保存退出,使环境变量生效

powershell 复制代码
[huwei@hadoop101 module]$ source /etc/profile

(5)将lib文件夹下的 guava-11.0.2.jar 删除以兼容Hadoop 3.1.3

由于前面 大数据技术学习笔记(二)------ Hadoop 运行环境的搭建,我安装的 Hadoop 版本是 3.1.3 ,这与 guava-11.0.2.jar 版本不兼容,删除以避免后续报错。

虽然删除了。但是这并不影响 Flume 的运行,因为系统会自动找到 Hadoop 中自带的兼容版本的 guava jar包。

powershell 复制代码
[huwei@hadoop101 lib]$ cd /opt/module/flume-1.9.0/lib/
[huwei@hadoop101 lib]$ rm guava-11.0.2.jar
相关推荐
SelectDB15 小时前
易车 × Apache Doris:构建湖仓一体新架构,加速 AI 业务融合实践
大数据·agent·mcp
武子康21 小时前
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
大数据·后端·mysql
IvanCodes1 天前
一、消息队列理论基础与Kafka架构价值解析
大数据·后端·kafka
武子康2 天前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
字节跳动数据平台3 天前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康3 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
字节跳动数据平台4 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术4 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康4 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康5 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive