flume集成kafka

1.解压flume

生产环境中,可以设置flume的堆内存为4G或以上。 修改/opt/module/flume/conf/flume-env.sh文件,配置如下参数(虚拟机环境暂不配置)

ini 复制代码
# 修改JVM配置
export JAVA_OPTS="-Xms4096m -Xmx4096m -Dcom.sun.management.jmxremote"

2.配置job,编辑文件file_to_kafka.conf

ini 复制代码
# 定义组件
a1.sources = r1
a1.channels = c1

# 配置source
a1.sources.r1.type = TAILDIR
a1.sources.r1.filegroups = f1
# 日志(数据)文件
a1.sources.r1.filegroups.f1 = /opt/module/flume/data/test.log
a1.sources.r1.positionFile = /opt/module/flume/taildir_position.json

# 配置channel
# 采用Kafka Channel,省去了Sink,提高了效率
a1.channels.c1.type = org.apache.flume.channel.kafka.KafkaChannel
a1.channels.c1.kafka.bootstrap.servers = hadoop102:9092,hadoop103:9092,hadoop104:9092
a1.channels.c1.kafka.topic = test
a1.channels.c1.parseAsFlumeEvent = false

# 组装 
a1.sources.r1.channels = c1

3.启动job

bash 复制代码
bin/flume-ng agent -n a1 -c conf/ -f job/file_to_kafka.conf

4.其他集成

ruby 复制代码
https://gitee.com/arhi/cs-spring/tree/feature/snow/springboot/springboot-ai-coding/kafka-demo
相关推荐
码农BookSea1 小时前
ReAct:让大模型学会边想边做
后端·ai编程
码农BookSea1 小时前
10分钟掌握 JSON-RPC 协议,面试加分、设计不踩坑
后端
凤年徐1 小时前
C++手撕红黑树:从0到200行,拿下STL map底层核心
c++·后端·算法
IT_陈寒1 小时前
Python的列表推导式里藏了个坑,差点让我加班到凌晨
前端·人工智能·后端
卷无止境3 小时前
podman与docker的区别和生产环境最佳实践
后端
程途知微3 小时前
ConcurrentHashMap线程安全实现原理全解析
java·后端
Mars酱3 小时前
1分钟编写贪吃蛇 | JSnake贪吃蛇单机版
java·后端·开源
卷卷说风控3 小时前
养了10年风控,今年开始养「虾」了
后端
王码码20353 小时前
Go语言中的Elasticsearch操作:olivere实战
后端·golang·go·接口
小旭95273 小时前
Spring Security 实现权限控制(认证 + 授权全流程)
java·后端·spring