Kafka技术详解[3]: 生产与消费数据

目录

[Kafka 生产与消费数据详解](#Kafka 生产与消费数据详解)

生产数据

命令行操作

工具操作

[Java API](#Java API)

消费数据

命令行操作

[Java API](#Java API)


Kafka 生产与消费数据详解

生产数据

一旦消息主题创建完成,就可以通过Kafka客户端向Kafka服务器的主题中发送消息。Kafka生产者客户端是一套API接口,任何能够通过这些接口连接Kafka并发送数据的组件都可以称为Kafka生产者。以下是几种不同的生产数据方式:

命令行操作
  1. 打开DOS窗口,进入E:\kafka_2.12-3.6.1\bin\windows目录。

  2. 在DOS窗口输入指令,进入生产者控制台。Kafka通过kafka-console-producer.bat文件进行消息生产者操作。必须传递的参数包括:

    • --bootstrap-server: 连接Kafka服务器,默认端口为9092,参数值为localhost:9092
    • --topic: 已经创建好的主题名称。

    指令如下:

    复制代码
    kafka-console-producer.bat --bootstrap-server localhost:9092 --topic test
  3. 控制台生产数据时,每次输入的数据需要回车确认才能发送到Kafka服务器。

工具操作

对于需要更直观操作的情况,可以使用专门的工具进行快速访问,例如kafkatool_64bit.exe

  1. 安装该工具后,打开工具。
  2. 点击左上角按钮File -> Add New Connection...建立连接。
  3. 点击Test按钮测试连接。
  4. 增加连接后,按照工具中的步骤生产数据。
  5. 增加成功后,点击绿色箭头按钮进行查询,工具会显示当前数据。
Java API

通常,也可通过Java程序来生产数据。以下是在IDEA中使用Kafka Java API来生产数据的示例:

  1. 创建Kafka项目。

  2. 修改pom.xml文件,增加Maven依赖。

    XML 复制代码
    <dependencies>
        <dependency>
            <groupId>org.apache.kafka</groupId>
            <artifactId>kafka-clients</artifactId>
            <version>3.6.1</version>
        </dependency>
    </dependencies>
  3. 创建com.lzl.kafka.test.KafkaProducerTest类,并添加main方法以及生产者代码。

    java 复制代码
    package com.lzl.kafka.test;
    import org.apache.kafka.clients.producer.KafkaProducer;
    import org.apache.kafka.clients.producer.ProducerConfig;
    import org.apache.kafka.clients.producer.ProducerRecord;
    import java.util.HashMap;
    import java.util.Map;
    
    public class KafkaProducerTest {
        public static void main(String[] args) {
            // 配置属性集合
            Map<String, Object> configMap = new HashMap<>();
            // 配置属性:Kafka服务器集群地址
            configMap.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092");
            // 配置属性:Kafka生产的数据为KV对,所以在生产数据进行传输前需要分别对K,V进行对应的序列化操作
            configMap.put(
                    ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG,
                    "org.apache.kafka.common.serialization.StringSerializer");
            configMap.put(
                    ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG,
                    "org.apache.kafka.common.serialization.StringSerializer");
            // 创建Kafka生产者对象,建立Kafka连接
            KafkaProducer<String, String> producer = new KafkaProducer<>(configMap);
            // 准备数据,定义泛型
            // 构造对象时需要传递 【Topic主题名称】,【Key】,【Value】三个参数
            ProducerRecord<String, String> record = new ProducerRecord<>("test", "key1", "value1");
            // 生产(发送)数据
            producer.send(record);
            // 关闭生产者连接
            producer.close();
        }
    }

消费数据

一旦消息通过生产者客户端发送到了Kafka服务器,就可以通过消费者客户端对特定主题的消息进行消费。

命令行操作
  1. 打开DOS窗口,进入E:\kafka_2.12-3.6.1\bin\windows目录。

  2. 输入指令,进入消费者控制台。使用kafka-console-consumer.bat文件进行消息消费者操作。必需的参数包括:

    • --bootstrap-server: 连接Kafka服务器,默认端口为9092。
    • --topic: 主题名称。
    • --from-beginning: 标记参数,确保从第一条数据开始消费。

    指令如下:

    复制代码
    kafka-console-consumer.bat --bootstrap-server localhost:9092 --topic test --from-beginning
Java API

同样地,可以通过Java程序来消费数据。以下是在IDEA中使用Kafka Java API消费数据的示例:

  1. 创建Maven项目并增加Kafka依赖。

  2. 创建com.lzl.kafka.test.KafkaConsumerTest类,并添加main方法以及消费者代码。

    java 复制代码
    package com.lzl.kafka.test;
    import org.apache.kafka.clients.consumer.ConsumerConfig;
    import org.apache.kafka.clients.consumer.ConsumerRecord;
    import org.apache.kafka.clients.consumer.ConsumerRecords;
    import org.apache.kafka.clients.consumer.KafkaConsumer;
    import java.time.Duration;
    import java.util.Arrays;
    import java.util.Collections;
    import java.util.HashMap;
    import java.util.Map;
    
    public class KafkaConsumerTest {
        public static void main(String[] args) {
            // 配置属性集合
            Map<String, Object> configMap = new HashMap<String, Object>();
            // 配置属性:Kafka集群地址
            configMap.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092");
            // 配置属性: Kafka传输的数据为KV对,所以需要对获取的数据分别进行反序列化
            configMap.put(
                    ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG,
                    "org.apache.kafka.common.serialization.StringDeserializer");
            configMap.put(
                    ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG,
                    "org.apache.kafka.common.serialization.StringDeserializer");
            // 配置属性: 读取数据的位置 ,取值为earliest(最早),latest(最晚)
            configMap.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");
            // 配置属性: 消费者组
            configMap.put("group.id", "lzl");
            // 配置属性: 自动提交偏移量
            configMap.put("enable.auto.commit", "true");
            // 创建消费者对象
            KafkaConsumer<String, String> consumer = new KafkaConsumer<>(configMap);
            // 消费者订阅指定主题的数据
            consumer.subscribe(Collections.singletonList("test"));
            while (true) {
                // 每隔100毫秒,抓取一次数据
                ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
                // 打印抓取的数据
                for (ConsumerRecord<String, String> record : records) {
                    System.out.println("K = " + record.key() + ", V = " + record.value());
                }
            }
        }
    }
相关推荐
SeaTunnel2 小时前
(八)收官篇 | 数据平台最后一公里:数据集成开发设计与上线治理实战
java·大数据·开发语言·白鲸开源
IT研究所4 小时前
AI 时代下的知识管理:从 Claude 的“复盘”能力看生成式 AI价值
大数据·运维·数据库·人工智能·科技·低代码·自然语言处理
云边云科技_云网融合4 小时前
企业出海的 “数字丝绸之路“:SD-WAN 如何重构全球网络竞争力
大数据·运维·网络·人工智能
JZC_xiaozhong4 小时前
2026年深圳企业如何统一管理ERP、MES、OA权限?身份识别与访问管理高效方案
大数据·运维·自动化·企业数据安全·数据集成与应用集成·权限治理·多系统权限管理
189228048615 小时前
NV243美光MT29F32T08GWLBHD6-24QJES:B
大数据·服务器·人工智能·科技·缓存
2601_958548485 小时前
利川避暑民宿舒适化运营:客流增长策略深度解析
大数据
明明跟你说过5 小时前
Kafka 与 Elasticsearch 的集成应用案例深度解析
大数据·elk·elasticsearch·kafka·big data·bigdata
拾-光6 小时前
【Git】命令大全:从入门到高手,100 个最常用命令速查(2026 版)
java·大数据·人工智能·git·python·elasticsearch·设计模式
2301_816997886 小时前
性能调优(基于 Elasticsearch 8.x)
大数据·elasticsearch·搜索引擎
易知微EasyV数据可视化7 小时前
数序重构・智启新生|袋鼠云发布Data+AI智能飞轮战略,2026春季发布会圆满落幕
大数据·人工智能·经验分享·数字孪生·空间智能