Flume

Flume安装配置

使用的三台主机名称分别为bigdata1,bigdata2,bigdata3。所使用的安装包名称按自己的修改,安装包可去各大官网上下载

1.解压

将Master节点Flume安装包解压到/opt/module目录下

复制代码
 tar -zxvf /opt/software/apache-flume-1.9.0-bin.tar.gz -C /opt/module/

修改名称为:flume-1.9.0

在module下输入:

复制代码
mv /apache-flume-1.9.0-bin flume-1.9.0

2.配置

复制代码
vim /etc/profile

添加

复制代码
#FLUME
export FLUME_HOME=/opt/module/flume-1.9.0
export PATH=$PATH:$FLUME_HOME/bin
#hive
export HIVE_HOME=/opt/module/hive-3.1.2
export PATH=$PATH:$HIVE_HOME/bin

刷新

复制代码
source /etc/profile

输入检验环境变量:

复制代码
flume-ng version

将flume-env.sh.template改名为flume-env.sh, 并修改其配置

在flume/conf目录下

复制代码
mv flume-env.sh.template flume-env.sh

vim flume/conf/flume-env.sh 

增加

复制代码
export JAVA_HOME=/opt/jdk1.8

flume/conf目录下

复制代码
mv flume-conf.properties.template flume-conf.properties

vim flume-conf.properties

增加

复制代码
a1.sources = r1
a1.sinks = k1
a1.channels = c1
 
a1.sources.r1.type = exec
a1.sources.r1.command=tail-F/opt/module/hadoop-3.1.3/logs/hadoop-root-namenode-master.log
 
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path = hdfs://bigdata1:9000/tmp/flume/%Y%m%d
a1.sinks.k1.hdfs.filePrefix = log-
a1.sinks.k1.hdfs.fileType = DataStream
a1.sinks.k1.hdfs.useLocalTimeStamp = true
 
a1.channels.c1.type = memory
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

flume必须持有hadoop相关的包才能将数据输出到hdfs, 将如下包上传到flume/lib下

复制代码
cp $HADOOP_HOME/share/hadoop/common/hadoop-common-3.1.3.jar  /opt/flume/lib
cp $HADOOP_HOME/share/hadoop/common/lib/hadoop-auth-3.1.3.jar /opt/flume/lib
cp $HADOOP_HOME/share/hadoop/common/lib/commons-configuration2-2.1.1.jar /opt/flume/lib

将hadoop的hdfs-site.xml和core-site.xml 放到flume/conf下

复制代码
 rm /opt/flume-1.9.0/lib/guava-11.0.2.jar

3.启动

复制代码
flume-ng agent --conf conf/ --conf-file /opt/module/flume-1.9.0/conf/flume-conf.properties --name a1  -Dflume.root.logger=DEBUG,console

hdfs dfs -ls /tmp/flume
相关推荐
一切皆是因缘际会5 分钟前
AI数字分身的底层原理:破解意识、自我与人格复刻的核心难题
大数据·人工智能·ai·架构
上海光华专利事务所8 分钟前
跨境电商商标专利管理平台
大数据·产品运营
Elastic 中国社区官方博客1 小时前
ES|QL METRICS_INFO 和 TS_INFO:为你的时间序列数据建立目录
大数据·数据库·elasticsearch·搜索引擎·信息可视化·全文检索
jinanwuhuaguo2 小时前
(第二十七篇)OpenClaw四月的演化风暴:OpenClaw 2026年4月全版本更新的文明级解读
大数据·人工智能·架构·kotlin·openclaw
清晨0013 小时前
工业生产实时数据获取方案-TDengine
大数据·时序数据库·tdengine
极创信息3 小时前
信创产品认证怎么做?信创产品测试认证的主要流程
java·大数据·数据库·金融·软件工程
Elastic 中国社区官方博客4 小时前
Elastic 和 Cursor 合作 加速 上下文工程 与 coding agents
大数据·人工智能·elasticsearch·搜索引擎·全文检索
lzhdim4 小时前
SQL 入门 12:SQL 视图:创建、修改与可更新视图
java·大数据·服务器·数据库·sql
科研前沿4 小时前
镜像孪生VS视频孪生核心技术产品核心优势
大数据·人工智能·算法·重构·空间计算
lizhihai_995 小时前
股市学习心得-六张分时保命图
大数据·人工智能·学习