Kafka安装与使用

Kafka是一种高吞吐量的分布式发布订阅消息系统,因为其高吞吐量、分布式可扩展性等等强大功能使得在目前互联网系统中广泛使用。该篇博客入门了解一下Kafka的安装及使用。

Kafka概念

Kafk是分布式消息队列。Kafka对消息保存时根据Topic进行归类,发送消息者称为Producer,消息接收者称为Consumer。此外kafka集群有多个kafka实例组成,每个实例(server)称为broker。其中每个Topic都由若干个partition组成,partition是topic物理上的分组,每个partition是一个有序的队列。Kafka的消费端有位移(offset)的概念,每条消息在某个partition的位移是固定的,相当于在分区当中的唯一编号。无论是kafka集群,还是consumer都依赖于Zookeeper集群保存一些meta信息,来保证系统可用性。

Kafka集群配置

因为本机是Windows系统,测试方便就单机配置Kafka的集群,但是配置都是共通的,在服务器上也基本一样。

配置版本

  • Kafka 2.2.0
  • Zookeeper 3.5.2
  • Windows 7
  • Java 8

配置Zookeeper

1、官网根据版本下载Zookeeper

2、解压Zookeeper的下载包,修改zoo.cfg中的dataDir地址,也可修改端口

3、点击zkServer.cmd,启动Zookeeper

配置Kafka

1、官网根据版本下载Kafka

2、解压Kafka的下载包,并复制三份,用于配置集群

本机的目录

复制代码
D:\kafka\KafkaCluster\kafka_9020
D:\kafka\KafkaCluster\kafka_9021
D:\kafka\KafkaCluster\kafka_9022

3、配置server.properties

broker.id三份都需要唯一,目前设置为0,1,2

复制代码
broker.id=0

配置服务器端口,因为是单机所以IP地址一样,需要端口不一样。分别设置9020、9021、9022

复制代码
listeners=PLAINTEXT://:9020

设置log地址,分别设置/kafka_9020/、/kafka_9021/、/kafka_9022/

复制代码
log.dirs=D:/kafka/KafkaCluster/kafka_9020/kafka-logs

并添加配置可删除Topic,如果不配置,Kafka只是标记删除

复制代码
delete.topic.enable=true

4、启动三个Kafka服务器

分别在主目录/kafka_9020/、/kafka_9021/、/kafka_9022/主目录CMD窗口运行

复制代码
.\bin\windows\kafka-server-start.bat .\config\server.properties

上述正常即可配置成功。

测试Kafka

配置是否成功,我们可以使用命令行操作查看。本机是Windows所以使用的都是bat文件,若到Linux则用sh文件。

创建Topic

复制代码
kafka-topics.bat --create --zookeeper [Zookeeper地址] --partitions [分区数] --replication-factor [副本集数] --topic [topic名称]

注意,副本集数不能大于不能大于Broker数,这里Broker数为3

测试

复制代码
D:\kafka\KafkaCluster\kafka_9020\bin\windows>kafka-topics.bat --create --zookeeper localhost:2181 --partitions 1 
--replication-factor 2 --topic kafka-topic-test

Created topic kafka_topic_test.

查看Topic列表

复制代码
kafka-topics.bat --list --zookeeper [Zookeeper地址]

测试

复制代码
D:\kafka\KafkaCluster\kafka_9020\bin\windows>kafka-topics.bat --list --zookeeper localhost:2181
kafka-topic-test

查看Topic详情

复制代码
kafka-topics.bat --zookeeper [Zookeeper地址] --describe --topic [topic名称]

测试

复制代码
D:\kafka\KafkaCluster\kafka_9020\bin\windows>kafka-topics.bat --zookeeper localh
ost:2181 --describe --topic kafka_topic_test
Topic:kafka_topic_test  PartitionCount:1        ReplicationFactor:2     Configs:
Topic:kafka_topic_test  Partition: 0    Leader: 1       Replicas: 1,2  Isr: 1,2

删除Topic

复制代码
kafka-topics.bat --delete --zookeeper [Zookeeper地址] --topic [topic名称]

测试

复制代码
D:\kafka\KafkaCluster\kafka_9020\bin\windows>kafka-topics.bat --delete --zookeeper localhost:2181 --topic kafka_topic_test
Topic kafka_topic_test is marked for deletion.
Note: This will have no impact if delete.topic.enable is not set to true.

D:\kafka\KafkaCluster\kafka_9020\bin\windows>kafka-topics.bat --list --zookeeper localhost:2181
__consumer_offsets
kafka_topic_test - marked for deletion

消息生产和消费

启动生产端

复制代码
kafka-console-producer.bat --broker-list [broker地址] --topic [topic名称]

启动消费端

复制代码
kafka-console-consumer.bat --zookeeper [Zookeeper地址] --from-beginning --topic [topic名称]

测试

生产端9020

复制代码
D:\kafka\KafkaCluster\kafka_9020\bin\windows>kafka-console-producer.bat --broker-list localhost:9020 --topic kafka_topic_test
>hello
>world
>kafka
>

消费端9021

复制代码
D:\kafka\KafkaCluster\kafka_9021\bin\windows>kafka-console-consumer.bat --bootstrap-server  localhost:9020 --from-beginning --topic kafka_topic_test
hello
world
kafka

消费端9022

复制代码
D:\kafka\KafkaCluster\kafka_9022\bin\windows>kafka-console-consumer.bat --bootstrap-server  localhost:9020 --from-beginning --topic kafka_topic_test
hello
world
kafka

Java操作Kafka

引入Jar

复制代码
<dependency>
	<groupId>org.apache.kafka</groupId>
	<artifactId>kafka-clients</artifactId>
	<version>2.2.0</version>
</dependency>

消费端

复制代码
import java.util.Properties;

import org.apache.kafka.clients.producer.Callback;
import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.ProducerRecord;
import org.apache.kafka.clients.producer.RecordMetadata;

public class CustomerProducer {

	public static void main(String[] args) {
		//http://kafka.apache.org/documentation/#producerconfigs 更多配置可以访问此地址
		//配置信息
		Properties props = new Properties();
		
		//设置kafka集群的地址 -- localhost:9020,localhost:9021,localhost:9022
        props.put("bootstrap.servers", "localhost:9020,localhost:9021,localhost:9022");
        
        //ack模式,all是最慢但最安全的
        // 0  不等待成功返回  
        // 1  等Leader写成功返回  
        //all 等Leader和所有ISR中的Follower写成功返回,all也可以用-1代替
        props.put("acks", "all");
        
        //失败重试次数
        props.put("retries", 0);
        
        //每个分区未发送消息总字节大小(单位:字节),超过设置的值就会提交数据到服务端
        props.put("batch.size", 16384);
        
        //请求的最大字节数,该值要比batch.size大
        //不建议去更改这个值,如果设置不好会导致程序不报错,但消息又没有发送成功
        //props.put("max.request.size",1048576);
        
        //消息在缓冲区保留的时间,超过设置的值就会被提交到服务端
        //数据在缓冲区中保留的时长,0表示立即发送
        //为了减少网络耗时,需要设置这个值,太大可能容易导致缓冲区满,阻塞消费者,太小容易频繁请求服务端
        props.put("linger.ms", 1);
        
        //整个Producer用到总内存的大小,如果缓冲区满了会提交数据到服务端
        //buffer.memory要大于batch.size,否则会报申请内存不足的错误
        //不要超过物理内存,根据实际情况调整
        props.put("buffer.memory", 33554432);
        //序列化器
        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        
        //创建生产者对象
        KafkaProducer<String,String> producer = new KafkaProducer<>(props);
        
        //循环发送消息
        for(int i=10;i<20;i++){
        	producer.send(new ProducerRecord<String, String>("kafka-topic-test", Integer.toString(i)),new Callback() {
				
				@Override
				public void onCompletion(RecordMetadata metadata, Exception exception) {
					if(exception == null){
						System.out.println(metadata.partition()+" - "+metadata.offset());
					}else{
						System.out.println("发送失败");
					}
				}
			});

        }
        //关闭资源
        producer.close();
	}

}

生产端

复制代码
import java.time.Duration;
import java.util.Collections;
import java.util.Properties;

import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;

public class CustomerConsumer {
	
	public static void main(String[] args) {
		Properties props = new Properties();
		
		//设置kafka集群的地址
		props.put("bootstrap.servers", "localhost:9020,localhost:9021,localhost:9022");
        
        //消费者组ID
		props.put("group.id", "test-consumer-group");
        
        //设置自动提交offset
		props.put("enable.auto.commit", "true");
        //自动提交间隔
		props.put("auto.commit.interval.ms", "1000");
        
        //earliest 
        //当各分区下有已提交的offset时,从提交的offset开始消费;无提交的offset时,从头开始消费
        //latest
        //当各分区下有已提交的offset时,从提交的offset开始消费;无提交的offset时,消费新产生的该分区下的数据
        //none
        //topic各分区都存在已提交的offset时,从offset后开始消费;只要有一个分区不存在已提交的offset,则抛出异常
        //默认建议用earliest。设置该参数后 kafka出错后重启,找到未消费的offset可以继续消费。
		props.put("auto.offset.reset", "earliest");
       
        //Consumer session 过期时间
		props.put("session.timeout.ms", "30000");
        
        //反序列化器
		props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
		props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
	
	
        //创建消费者对象
        @SuppressWarnings("resource")
		KafkaConsumer<Object, Object> consumer = new KafkaConsumer<>(props);
        
        //指定Topic
        //consumer.subscribe(Arrays.asList("first","second","third"));
        consumer.subscribe(Collections.singletonList("kafka-topic-test"));
        
        while (true) {
	        //获取数据
	        ConsumerRecords<Object, Object> consumerRecords = consumer.poll(Duration.ofMillis(100));
	        
	        for (ConsumerRecord<Object, Object> consumerRecord : consumerRecords) {
				System.out.println(consumerRecord.topic()+":"
						+consumerRecord.partition()+":"
						+consumerRecord.value());
			}
        }
        
 	}
}
相关推荐
qq_12498707536 小时前
基于Hadoop的信贷风险评估的数据可视化分析与预测系统的设计与实现(源码+论文+部署+安装)
大数据·人工智能·hadoop·分布式·信息可视化·毕业设计·计算机毕业设计
ask_baidu6 小时前
KafkaUtils
kafka·bigdata
洛豳枭薰8 小时前
消息队列关键问题描述
kafka·rabbitmq·rocketmq
lucky67078 小时前
Spring Boot集成Kafka:最佳实践与详细指南
spring boot·kafka·linq
Coder_Boy_9 小时前
基于Spring AI的分布式在线考试系统-事件处理架构实现方案
人工智能·spring boot·分布式·spring
袁煦丞 cpolar内网穿透实验室10 小时前
远程调试内网 Kafka 不再求运维!cpolar 内网穿透实验室第 791 个成功挑战
运维·分布式·kafka·远程工作·内网穿透·cpolar
岁岁种桃花儿10 小时前
CentOS7 彻底卸载所有JDK/JRE + 重新安装JDK8(实操完整版,解决kafka/jps报错)
java·开发语言·kafka
人间打气筒(Ada)10 小时前
GlusterFS实现KVM高可用及热迁移
分布式·虚拟化·kvm·高可用·glusterfs·热迁移
xu_yule10 小时前
Redis存储(15)Redis的应用_分布式锁_Lua脚本/Redlock算法
数据库·redis·分布式
難釋懷14 小时前
分布式锁的原子性问题
分布式