Flume和kafka的整合:使用Flume将日志数据抽取到Kafka中

文章目录


1、Kafka作为Source【数据进入到kafka中,抽取出来】

kafka源 --> memory --> 控制台:

bash 复制代码
a1.sources = r1
a1.sinks = k1
a1.channels = c1

# Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

a1.sources.r1.type = org.apache.flume.source.kafka.KafkaSource
a1.sources.r1.batchSize = 100
a1.sources.r1.batchDurationMillis = 2000
a1.sources.r1.kafka.bootstrap.servers = node01:9092,node02:9092,node03:9092
a1.sources.r1.kafka.topics = five
a1.sources.r1.kafka.consumer.group.id = donghu

# Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

a1.sinks.k1.type = logger
a1.sinks.k1.maxBytesToLog = 128

2、kafka作为Sink 【数据从别的地方抽取到kafka里面】

netcat --> memory -->kafka:

bash 复制代码
##a1就是flume agent的名称
## source r1
## channel c1
## sink k1
a1.sources = r1
a1.sinks = k1
a1.channels = c1

# Describe/configure the source
a1.sources.r1.type = netcat
a1.sources.r1.bind = bigdata01
a1.sources.r1.port = 44444

# 修改sink为kafka
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.kafka.bootstrap.servers = node01:9092
a1.sinks.k1.kafka.topic = five
a1.sinks.k1.kafka.producer.acks = 1
a1.sinks.k1.kafka.producer.linger.ms = 1

# Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

# Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1
相关推荐
小汤猿人类24 分钟前
ES关系映射(数据库中的表结构)
大数据·数据库·elasticsearch
煤烦恼36 分钟前
Spark-Sql编程(三)
大数据·sql·spark
塔能物联运维1 小时前
案例:塔能科技驱动河南某市政照明智慧升级
大数据·运维
镜舟科技1 小时前
镜舟科技助力某大型电网企业破解数据架构升级难题,打造国产化湖仓标杆
大数据·starrocks·数据分析·开源·lakehouse·分析型数据库·湖仓
中钧科技1 小时前
智能系统:中钧科技的秘密武器
大数据·人工智能·科技·ai·数字化转型
努力的搬砖人.1 小时前
Spring Boot整合Kafka的详细步骤
spring boot·后端·kafka
King.6241 小时前
SQL2API 核心理念:如何重构数据服务交付范式
大数据·开发语言·数据库·人工智能·sql·lua
lilye661 小时前
精益数据分析(3/126):用数据驱动企业发展的深度解析
大数据·数据挖掘·数据分析
MXsoft6181 小时前
美信监控易:揭秘高效数据采集和数据分析双引擎
大数据·运维
计算机毕设定制辅导-无忧学长2 小时前
TDengine 与其他时序数据库对比:InfluxDB/TimescaleDB 选型指南(一)
大数据·时序数据库·tdengine