flume集成kafka

1.解压flume

生产环境中,可以设置flume的堆内存为4G或以上。 修改/opt/module/flume/conf/flume-env.sh文件,配置如下参数(虚拟机环境暂不配置)

ini 复制代码
# 修改JVM配置
export JAVA_OPTS="-Xms4096m -Xmx4096m -Dcom.sun.management.jmxremote"

2.配置job,编辑文件file_to_kafka.conf

ini 复制代码
# 定义组件
a1.sources = r1
a1.channels = c1

# 配置source
a1.sources.r1.type = TAILDIR
a1.sources.r1.filegroups = f1
# 日志(数据)文件
a1.sources.r1.filegroups.f1 = /opt/module/flume/data/test.log
a1.sources.r1.positionFile = /opt/module/flume/taildir_position.json

# 配置channel
# 采用Kafka Channel,省去了Sink,提高了效率
a1.channels.c1.type = org.apache.flume.channel.kafka.KafkaChannel
a1.channels.c1.kafka.bootstrap.servers = hadoop102:9092,hadoop103:9092,hadoop104:9092
a1.channels.c1.kafka.topic = test
a1.channels.c1.parseAsFlumeEvent = false

# 组装 
a1.sources.r1.channels = c1

3.启动job

bash 复制代码
bin/flume-ng agent -n a1 -c conf/ -f job/file_to_kafka.conf

4.其他集成

ruby 复制代码
https://gitee.com/arhi/cs-spring/tree/feature/snow/springboot/springboot-ai-coding/kafka-demo
相关推荐
golang学习记16 分钟前
Go 嵌入结构体方法访问全解析:从基础到进阶陷阱
后端
NAGNIP33 分钟前
程序员效率翻倍的快捷键大全!
前端·后端·程序员
qq_2562470541 分钟前
从“人工智障”到“神经网络”:一口气看懂 AI 的核心原理
后端
无心水41 分钟前
分布式定时任务与SELECT FOR UPDATE:从致命陷阱到优雅解决方案(实战案例+架构演进)
服务器·人工智能·分布式·后端·spring·架构·wpf
用户4001883093743 分钟前
手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了“实时代码监控”
后端
用户3414081991251 小时前
/dev/binder 详解
后端
Gopher_HBo1 小时前
Go进阶之recover
后端
程序员布吉岛1 小时前
写了 10 年 MyBatis,一直以为“去 XML”=写注解,直到看到了这个项目
后端
却尘1 小时前
一篇小白也能看懂的 Go 字符串拼接 & Builder & cap 全家桶
后端·go
茶杯梦轩1 小时前
从零起步学习Redis || 第七章:Redis持久化方案的实现及底层原理解析(RDB快照与AOF日志)
redis·后端