Kafka技术详解[3]: 生产与消费数据

目录

[Kafka 生产与消费数据详解](#Kafka 生产与消费数据详解)

生产数据

命令行操作

工具操作

[Java API](#Java API)

消费数据

命令行操作

[Java API](#Java API)


Kafka 生产与消费数据详解

生产数据

一旦消息主题创建完成,就可以通过Kafka客户端向Kafka服务器的主题中发送消息。Kafka生产者客户端是一套API接口,任何能够通过这些接口连接Kafka并发送数据的组件都可以称为Kafka生产者。以下是几种不同的生产数据方式:

命令行操作
  1. 打开DOS窗口,进入E:\kafka_2.12-3.6.1\bin\windows目录。

  2. 在DOS窗口输入指令,进入生产者控制台。Kafka通过kafka-console-producer.bat文件进行消息生产者操作。必须传递的参数包括:

    • --bootstrap-server: 连接Kafka服务器,默认端口为9092,参数值为localhost:9092
    • --topic: 已经创建好的主题名称。

    指令如下:

    复制代码
    kafka-console-producer.bat --bootstrap-server localhost:9092 --topic test
  3. 控制台生产数据时,每次输入的数据需要回车确认才能发送到Kafka服务器。

工具操作

对于需要更直观操作的情况,可以使用专门的工具进行快速访问,例如kafkatool_64bit.exe

  1. 安装该工具后,打开工具。
  2. 点击左上角按钮File -> Add New Connection...建立连接。
  3. 点击Test按钮测试连接。
  4. 增加连接后,按照工具中的步骤生产数据。
  5. 增加成功后,点击绿色箭头按钮进行查询,工具会显示当前数据。
Java API

通常,也可通过Java程序来生产数据。以下是在IDEA中使用Kafka Java API来生产数据的示例:

  1. 创建Kafka项目。

  2. 修改pom.xml文件,增加Maven依赖。

    XML 复制代码
    <dependencies>
        <dependency>
            <groupId>org.apache.kafka</groupId>
            <artifactId>kafka-clients</artifactId>
            <version>3.6.1</version>
        </dependency>
    </dependencies>
  3. 创建com.lzl.kafka.test.KafkaProducerTest类,并添加main方法以及生产者代码。

    java 复制代码
    package com.lzl.kafka.test;
    import org.apache.kafka.clients.producer.KafkaProducer;
    import org.apache.kafka.clients.producer.ProducerConfig;
    import org.apache.kafka.clients.producer.ProducerRecord;
    import java.util.HashMap;
    import java.util.Map;
    
    public class KafkaProducerTest {
        public static void main(String[] args) {
            // 配置属性集合
            Map<String, Object> configMap = new HashMap<>();
            // 配置属性:Kafka服务器集群地址
            configMap.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092");
            // 配置属性:Kafka生产的数据为KV对,所以在生产数据进行传输前需要分别对K,V进行对应的序列化操作
            configMap.put(
                    ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG,
                    "org.apache.kafka.common.serialization.StringSerializer");
            configMap.put(
                    ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG,
                    "org.apache.kafka.common.serialization.StringSerializer");
            // 创建Kafka生产者对象,建立Kafka连接
            KafkaProducer<String, String> producer = new KafkaProducer<>(configMap);
            // 准备数据,定义泛型
            // 构造对象时需要传递 【Topic主题名称】,【Key】,【Value】三个参数
            ProducerRecord<String, String> record = new ProducerRecord<>("test", "key1", "value1");
            // 生产(发送)数据
            producer.send(record);
            // 关闭生产者连接
            producer.close();
        }
    }

消费数据

一旦消息通过生产者客户端发送到了Kafka服务器,就可以通过消费者客户端对特定主题的消息进行消费。

命令行操作
  1. 打开DOS窗口,进入E:\kafka_2.12-3.6.1\bin\windows目录。

  2. 输入指令,进入消费者控制台。使用kafka-console-consumer.bat文件进行消息消费者操作。必需的参数包括:

    • --bootstrap-server: 连接Kafka服务器,默认端口为9092。
    • --topic: 主题名称。
    • --from-beginning: 标记参数,确保从第一条数据开始消费。

    指令如下:

    复制代码
    kafka-console-consumer.bat --bootstrap-server localhost:9092 --topic test --from-beginning
Java API

同样地,可以通过Java程序来消费数据。以下是在IDEA中使用Kafka Java API消费数据的示例:

  1. 创建Maven项目并增加Kafka依赖。

  2. 创建com.lzl.kafka.test.KafkaConsumerTest类,并添加main方法以及消费者代码。

    java 复制代码
    package com.lzl.kafka.test;
    import org.apache.kafka.clients.consumer.ConsumerConfig;
    import org.apache.kafka.clients.consumer.ConsumerRecord;
    import org.apache.kafka.clients.consumer.ConsumerRecords;
    import org.apache.kafka.clients.consumer.KafkaConsumer;
    import java.time.Duration;
    import java.util.Arrays;
    import java.util.Collections;
    import java.util.HashMap;
    import java.util.Map;
    
    public class KafkaConsumerTest {
        public static void main(String[] args) {
            // 配置属性集合
            Map<String, Object> configMap = new HashMap<String, Object>();
            // 配置属性:Kafka集群地址
            configMap.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092");
            // 配置属性: Kafka传输的数据为KV对,所以需要对获取的数据分别进行反序列化
            configMap.put(
                    ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG,
                    "org.apache.kafka.common.serialization.StringDeserializer");
            configMap.put(
                    ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG,
                    "org.apache.kafka.common.serialization.StringDeserializer");
            // 配置属性: 读取数据的位置 ,取值为earliest(最早),latest(最晚)
            configMap.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");
            // 配置属性: 消费者组
            configMap.put("group.id", "lzl");
            // 配置属性: 自动提交偏移量
            configMap.put("enable.auto.commit", "true");
            // 创建消费者对象
            KafkaConsumer<String, String> consumer = new KafkaConsumer<>(configMap);
            // 消费者订阅指定主题的数据
            consumer.subscribe(Collections.singletonList("test"));
            while (true) {
                // 每隔100毫秒,抓取一次数据
                ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
                // 打印抓取的数据
                for (ConsumerRecord<String, String> record : records) {
                    System.out.println("K = " + record.key() + ", V = " + record.value());
                }
            }
        }
    }
相关推荐
Chasing__Dreams1 分钟前
kafka--基础知识点--17--如何保证顺序消费
分布式·kafka
Jackyzhe1 分钟前
Flink学习笔记:如何做容错
大数据·flink
北京盛世宏博2 分钟前
【物联网控制】档案库房八防智能监测系统 温湿度自动调控 + 防火防盗全联动
大数据·人工智能·档案八防·十防
en-route12 分钟前
Spring Boot 集成 Kafka 实践与最佳实践指南
spring boot·后端·kafka
第二只羽毛13 分钟前
基于Deep Web爬虫的当当网图书信息采集
大数据·开发语言·前端·爬虫·算法
yumgpkpm22 分钟前
Hadoop 与AI大模型实战:从Hive、Impala(Cloudera CDH、CDP)海量数据到 AI 决策的落地方法
arm开发·人工智能·hive·zookeeper·flink·kafka·cloudera
java_logo29 分钟前
Apache RocketMQ Docker 容器化部署指南
运维·docker·容器·kafka·kubernetes·apache·rocketmq
跨境卫士苏苏9 小时前
亚马逊AI广告革命:告别“猜心”,迎接“共创”时代
大数据·人工智能·算法·亚马逊·防关联
珠海西格电力9 小时前
零碳园区工业厂房光伏一体化(BIPV)基础规划
大数据·运维·人工智能·智慧城市·能源
HerayChen9 小时前
HbuilderX 内存溢出报错
java·大数据·linux