2023_Spark_实验三十:测试Flume到Kafka

实验目的:测试Flume采集数据发送到Kafka

实验方法:通过centos7集群测试,将flume采集的数据放到kafka中

实验步骤:

一、 kafka可视化工具介绍

Kafka Tool是一个用于管理和使用Apache Kafka集群的GUI应用程序。 Kafka Tool提供了一个较为直观的UI可让用户快速查看Kafka集群中的对象以及存储在topic中的消息,提供了一些专门面向开发人员和管理员的功能,主要特性包括:

  • 快速查看所有Kafka集群信息,包括其brokers, topics and consumers

  • 查看分区中的消息内容并支持添加新消息

  • 查看消费者偏移量,支持查看Apache Storm Kafka Spout消费者偏移量

  • 以pretty-printed 格式显示JSON和XML消息

  • 添加和删除topic以及其他管理功能

  • 将单个消息从指定分区保存到本地硬盘驱动器

  • 支持用户编写自己的插件以查看自定义数据格式

  • 支持在Windows,Linux和Mac OS上运行

下载地址

这个软件的安装很简单,傻瓜式安装,直接下一步就可以,下载地址:Offset Explorer

下载并安装你对应的操作系统版本软件

二、启动zookeeper集群

bash 复制代码
zk.sh start  
# https://blog.csdn.net/pblh123/article/details/134730738  参考这个

三、启动kafka集群

bash 复制代码
kf.sh
# https://blog.csdn.net/pblh123/article/details/134730738  参考

通过kafkatools offset exploer 2.3 链接查看kafak

检查windows的hosts文件配置

四、启动flume

bash 复制代码
/opt/module/apache-flume-1.9.0-bin/bin/flume-ng agent -c conf -f /opt/module/apache-flume-1.9.0-bin/conf/kafka.conf -n a2 -Dflume.root.logger=INFO,console

五、启动消费者

bash 复制代码
# 创建kafka主题
/opt/module/kafka_2.12-3.0.0/bin/kafka-topics.sh --create --bootstrap-server hd1:9092 --replication-factor 3 --partitions 1 --topic RealDataTopic


# 启动消费者
/opt/module/kafka_2.12-3.0.0/bin/kafka-console-consumer.sh --bootstrap-server hd1:9092 --topic RealDataTopic --from-beginning

实验结果:flume采集数据到kafka链路跑通

相关推荐
2501_9418779811 小时前
Python在微服务高并发异步日志聚合与智能告警分析架构中的实践
kafka
最笨的羊羊14 小时前
Flink CDC系列之:Kafka CSV 序列化器CsvSerializationSchema
kafka·csv·schema·flink cdc系列·serialization·序列化器
最笨的羊羊15 小时前
Flink CDC系列之:Kafka的Debezium JSON 结构定义类DebeziumJsonStruct
kafka·debezium·flink cdc系列·debezium json·结构定义类·jsonstruct
青云交1 天前
Java 大视界 -- Java 大数据在智能物流无人配送车路径规划与协同调度中的应用
java·spark·路径规划·大数据分析·智能物流·无人配送车·协同调度
2501_941142132 天前
前端高性能优化与微前端架构设计在大型互联网系统中的实践经验分享
kafka
20岁30年经验的码农2 天前
Kafka 消息中间件实战指南
分布式·kafka·linq
yumgpkpm2 天前
腾讯云TBDS与CDH迁移常见问题有哪些?建议由CDH迁移到CMP 7.13 平台(类Cloudera CDP,如华为鲲鹏 ARM 版)
hive·hadoop·zookeeper·flink·spark·kafka·hbase
2501_941142133 天前
基于 Kotlin 构建移动端高并发后台服务与实时数据同步系统的架构设计与工程实践分享
kafka
bigdata-rookie3 天前
Spark 部署模式
大数据·分布式·spark
yumgpkpm4 天前
数据可视化AI、BI工具,开源适配 Cloudera CMP 7.3(或类 CDP 的 CMP 7.13 平台,如华为鲲鹏 ARM 版)值得推荐?
人工智能·hive·hadoop·信息可视化·kafka·开源·hbase