flume集成kafka

1.解压flume

生产环境中,可以设置flume的堆内存为4G或以上。 修改/opt/module/flume/conf/flume-env.sh文件,配置如下参数(虚拟机环境暂不配置)

ini 复制代码
# 修改JVM配置
export JAVA_OPTS="-Xms4096m -Xmx4096m -Dcom.sun.management.jmxremote"

2.配置job,编辑文件file_to_kafka.conf

ini 复制代码
# 定义组件
a1.sources = r1
a1.channels = c1

# 配置source
a1.sources.r1.type = TAILDIR
a1.sources.r1.filegroups = f1
# 日志(数据)文件
a1.sources.r1.filegroups.f1 = /opt/module/flume/data/test.log
a1.sources.r1.positionFile = /opt/module/flume/taildir_position.json

# 配置channel
# 采用Kafka Channel,省去了Sink,提高了效率
a1.channels.c1.type = org.apache.flume.channel.kafka.KafkaChannel
a1.channels.c1.kafka.bootstrap.servers = hadoop102:9092,hadoop103:9092,hadoop104:9092
a1.channels.c1.kafka.topic = test
a1.channels.c1.parseAsFlumeEvent = false

# 组装 
a1.sources.r1.channels = c1

3.启动job

bash 复制代码
bin/flume-ng agent -n a1 -c conf/ -f job/file_to_kafka.conf

4.其他集成

ruby 复制代码
https://gitee.com/arhi/cs-spring/tree/feature/snow/springboot/springboot-ai-coding/kafka-demo
相关推荐
陈随易5 小时前
有生之年系列,Nodejs进程管理pm2 v7.0发布
前端·后端·程序员
陈随易6 小时前
AI时代,你还在坚持手搓文章吗
前端·后端·程序员
大鱼七成饱7 小时前
VMware NAT模式下固定内网IP(附详细图文)
后端
IT_陈寒9 小时前
Vue的这个响应式陷阱,我debug了一整天才爬出来
前端·人工智能·后端
兔子零10249 小时前
手把手教你在 Claude Code 中接入 DeepSeek-V4
后端
phenhorlin10 小时前
我做了个工具,让切换 Homebrew 镜像像切 npm 源一样简单
后端·shell
69510 小时前
两周浅学 RAG
后端
AI人工智能+电脑小能手11 小时前
【大白话说Java面试题】【Java基础篇】第24题:Java面向对象有哪些特征
java·开发语言·后端·面试
AI人工智能+电脑小能手11 小时前
【大白话说Java面试题】【Java基础篇】第25题:JDK1.8的新特性有哪些
java·开发语言·后端·面试
fliter12 小时前
Wrangler:Cloudflare 给 Rust + WASM 开发者造的那把锤子
后端