kafka基本概念以及用法

kafka基本概念以及用法目录


文章目录


提示:以下是本篇文章正文内容,下面案例可供参考

一、什么是kafka?

kafka是一个分布式流处理工具,被全球大量公司广泛应用在大数据处理领域

二、为什么要使用kafka?

众所周知,在微服务领域或者大数据领域,需要服务和服务之间进行数据交换,数据通信,大数据领域系统和系统之间可能还有海量的数据交换压力。

1.传统的线程和线程之间的数据交换方式

jvm中会有一块公共的区域叫做堆内存,线程和线程之间会推送数据到堆内存中,其他线程需要获取数据就去堆内存获取

2.传统的进程和进程之间的数据交换方式

进程和进程之间是通过网络传输数据(Http,或者socket等常见网络传输协议)

但是不管是进程还是线程,传统这种数据传输交换方式,如果在海量数据高并发的场景下,如果接受数据方的内存跟不上推送的速度,就会引起内存溢出,堆内存溢出等生产问题。而kafka就是为了解决这个问题,孕育而生的。他充当了交换数据中间的一个中间件,类似一个消息队列的缓冲区

三、kafka的基本概念

一般市面上面的消息队列都遵循了JMS(Java Message Service)的传输规范

1.P2P(point to point)

2.PS(publish and subscribe) 发布订阅模式

四、安装kafka(windows版本)

1.下载kafka

https://kafka.apache.org/downloads

解压目录:

启动kafka需要依赖zookeeper,我们可以使用kafka自带的zookeeper

在log文件夹下面新建zk文件夹区分日志文件

修改配置文件中zookeeper文件日志文件位置

修改kafka运行日志保存位置

启动zookeeper和kafka

cmd到bin目录下面windows执行下面的bat脚本
后面跟上刚才修改的配置文件

启动zookeeper成功 。

开始启动kafka

启动bat脚本 后面跟上刚才带上的配置文件

启动成功

tips:后续可能会出现kafka出现进程挂掉的报错

可以删除配置的两个文件夹下面的文件,重新启动zookeeper和kafka

五、命令行控制kafka生产消费数据,创建 删除topic

1.创建一个名为test的topic

kafka-topics.bat --bootstrap-server localhost:9092 --topic test --create

2.查看所有topic

kafka-topics.bat --bootstrap-server localhost:9092 --list

3.删除一个名为test的topic

kafka-topics.bat --bootstrap-server localhost:9092 --topic test --delete

4.生产数据

kafka-console-producer.bat --broker-list localhost:9092 --topic test

5.消费数据

kafka-console-consumer.bat --bootstrap-server localhost:9092 --topic test

tips:可以加--help查看每个脚本后面的参数的具体用法

六、java操作kafka消费生产

先引入maven依赖:

c 复制代码
<dependency>
    <groupId>org.apache.kafka</groupId>
    <artifactId>kafka-clients</artifactId>
    <version>2.8.0</version>
</dependency>

version根据自己的kafka版本做调整

生产者代码:

c 复制代码
   public static void main(String[] args) {
        // 配置Kafka生产者
        Properties props = new Properties();
        props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092"); // Kafka集群地址
        props.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringSerializer");
        props.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringSerializer");

        // 创建Kafka生产者
        Producer<String, String> producer = new KafkaProducer<>(props);

        // 发送消息
        try {
            producer.send(new ProducerRecord<>("test", "key", "Message to send"));
            System.out.println("Message sent");
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            // 关闭生产者
            producer.close();
        }
    }

命令行接受到了生产数据

消费者代码:

c 复制代码
 public static void main(String[] args) {
        // 配置Kafka消费者
        Properties properties = new Properties();
        properties.put("bootstrap.servers", "localhost:9092");
        properties.put("group.id", "test-group");
        properties.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        properties.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        // 创建Kafka消费者
        KafkaConsumer<String, String> consumer = new KafkaConsumer<>(properties);

        // 订阅主题
        consumer.subscribe(Arrays.asList("test"));

        // 轮询消费消息
        while (true) {
            ConsumerRecords<String, String> records = consumer.poll(100);
            for (ConsumerRecord<String, String> record : records) {
                System.out.printf("Offset: %d, Key: %s, Value: %s\n", record.offset(), record.key(), record.value());
            }
        }
    }

再运行生产者代码 控制台就会打印出来消费的数据

相关推荐
wclass-zhengge5 小时前
RabbitMQ篇(基本介绍)
分布式·rabbitmq
花千树-01013 小时前
分布式选举 - Paxos、Zab 和 Raft 选举协议的逐步优化与对比分析
分布式
Dylanioucn13 小时前
【分布式微服务云原生】OpenFeign:微服务通信的瑞士军刀
分布式·微服务·云原生
。。。。。。。。~16 小时前
RabbitMQ的高级特性-事务
分布式·rabbitmq
Dylanioucn17 小时前
【分布式微服务云原生】消息队列全解析:原理、应用场景与主流MQ对比
分布式·微服务·云原生
@技术无疆17 小时前
【Go语言】Ergo:构建分布式系统的现代化 Erlang 框架
开发语言·分布式·后端·golang·开源·erlang·开源软件
。。。。。。。。~18 小时前
RabbitMQ的高级特性-延迟队列
分布式·rabbitmq
小笨猪-18 小时前
Redis-哨兵
数据库·redis·分布式·缓存·sentinel
计算机学姐19 小时前
基于Hadoop的微博舆情监测分析系统
大数据·vue.js·hadoop·spring boot·分布式·mysql·数据可视化
Dylanioucn19 小时前
【分布式微服务云原生】详解Redis的主从模式,主服务器挂了如何从多个从服务器选出新的主服务器
分布式·微服务·云原生