flume集成kafka

1.解压flume

生产环境中,可以设置flume的堆内存为4G或以上。 修改/opt/module/flume/conf/flume-env.sh文件,配置如下参数(虚拟机环境暂不配置)

ini 复制代码
# 修改JVM配置
export JAVA_OPTS="-Xms4096m -Xmx4096m -Dcom.sun.management.jmxremote"

2.配置job,编辑文件file_to_kafka.conf

ini 复制代码
# 定义组件
a1.sources = r1
a1.channels = c1

# 配置source
a1.sources.r1.type = TAILDIR
a1.sources.r1.filegroups = f1
# 日志(数据)文件
a1.sources.r1.filegroups.f1 = /opt/module/flume/data/test.log
a1.sources.r1.positionFile = /opt/module/flume/taildir_position.json

# 配置channel
# 采用Kafka Channel,省去了Sink,提高了效率
a1.channels.c1.type = org.apache.flume.channel.kafka.KafkaChannel
a1.channels.c1.kafka.bootstrap.servers = hadoop102:9092,hadoop103:9092,hadoop104:9092
a1.channels.c1.kafka.topic = test
a1.channels.c1.parseAsFlumeEvent = false

# 组装 
a1.sources.r1.channels = c1

3.启动job

bash 复制代码
bin/flume-ng agent -n a1 -c conf/ -f job/file_to_kafka.conf

4.其他集成

ruby 复制代码
https://gitee.com/arhi/cs-spring/tree/feature/snow/springboot/springboot-ai-coding/kafka-demo
相关推荐
Sheep Shaun2 小时前
STL中的map和set:红黑树的优雅应用
开发语言·数据结构·c++·后端·c#
宁晓2 小时前
单表配置多级类型,按名称模糊筛选
java·后端
程序员爱钓鱼3 小时前
Node.js 编程实战:错误处理与安全防护
前端·后端·node.js
程序员爱钓鱼3 小时前
Node.js 编程实战:模板引擎与静态资源
前端·后端·node.js
quant_19863 小时前
外汇期货实时行情 API 使用教程
经验分享·后端·websocket·程序人生·金融·区块链
Andy工程师3 小时前
Netty 与 Spring Boot + HTTP 客户端(如 RestTemplate、WebClient)应用场景区别
spring boot·后端·http
短剑重铸之日4 小时前
《深入解析JVM》第五章:JDK 8之后版本的优化与JDK 25前瞻
java·开发语言·jvm·后端
java硕哥4 小时前
Spring源码debug方法
java·后端·spring
刘立军4 小时前
本地大模型编程实战(39)MCP实战演练
人工智能·后端·mcp