00_概览_kafka

kafka

概述

课程地址为 https://www.bilibili.com/video/BV1Gp421m7UN/

kafka版本

2.12-3.6.1

流程

启动zk

配置zk

需要启动zk,作为注册中心

kafka内置了zk,直接命令启动即可
在 kafka 的 config目录下,修改zookeeper.properties 配置文件

# 这里面配置的是有关数据存放的目录
dataDir=E:/kafka/kafka2.xxx/data/zk

启动命令

在 kafka/bin/windows 下,找到 zookeeper-server-start.bat,运行如下命令.../.../config/zookeeper.properties 文件

zookeeper-server-start.bat  ../../config/zookeeper.properties

这么一来,可以直接启动zk.出现如下图: 启动成功

启动kafka

修改server.properties

修改 log.dirs 的值

启动命令

kafka-server-start.bat config.properties

kafka脚本-命令行操作

提供了一定的脚本,通过脚本操作kafka
可以进行创建主题 发送消息等操作

命令行

创建主题脚本

相关脚本

kafka-topics.bat

kafka提供的主题脚本
创建 test 主题

kafka-topics.bat --bootstrap-server localhost:9092 --topic test --create

查看主题

kafka-topics.bat --bootstrap-server localhost:9092 --list

主题详情

kafka-topics.bat --bootstrap-server localhost:9092 --topic test --describe

修改主题

kafka-topics.bat --bootstrap-server localhost:9092 --topic test --alter --partitions

将红圈部分改为2

效果如下

删除主题

kafka-topics.bat --bootstrap-server localhost:9092 --topic test --delete

windows环境下会导致kafka停止运行的错误
由于权限或进程锁定,会导致kafka被关闭

大量日志

由于JDK版本问题导致

解决方案
  1. 切换JDK17
  2. 在kafka-run-class.bat 中设置 java_home

控制台生产者消费者

通过控制台控制生产
启动生产者脚本
消费者启动脚本
生产者发送消息,消费者自动获取消息

代码 生产者 消费者

只引入 kafka 的依赖.进行代码

生产者 创建 topic 以及 消息

消费者 订阅 topic 以及消费消息

pom 复制代码
<dependencies>
	<dependency>
	<groupId>org.apache.kafka</groupId>
	<artifactId>kafka-clients</artifactId>
	<version>3.6.1</version>
	</dependency>
</dependencies>

具体代码请百度.只引入 kafka-client即可.

kafka-tool


这里百度去学习

kafka数据文件

.log结尾的就是数据文件

因为 kafka 以前是做日志传输的.

扩展

横向扩展

增加机器

纵向扩展

增加内存 硬盘 宽带等...

分区

运行多个kafka实例. 对 kafkaBroker 的相同topic进行编号.

这叫做分区

生产者向不同分区传送数据

消费者组

消费者消费所有的分区topic

备份

可以对数据文件进行备份.
分区备份

同一 topic 的是数据文件备份到其他分区的broker上面

但是多个副本,只有一个副本能够提供数据的读写.其他是从节点,负责备份

分区

Leader Follower

Partition 分区

Broker 服务节点集群

Broker Controller: Broker 服务节点集群管理者

Broker Controller Standby : 服务集群管理者备份

Controller选举

BrokerController down之后,Standby启动.
BrokerStandbyController启动.
BrokerStandbyController出现问题,可以继续选择其他主体 Broker ,选举出来一个BrokerController

图解kafka架构

KogManager: 数据管理器

Windows集群

cluster目录

创建cluster目录在硬盘根目录.解压 kafka,复制到该目录.如图

zk

修改kafka自带的zkdata存放目录.然后启动

broker_1


broker_2

和 broker_1 一样

broker_3

和 broker_2 一样

kafka & zk启动脚本

略...

cluster.bat cluster-clear-data.bat

略...

znode节点

临时节点 持久化节点

watch 节点监听

监听kafka的客户端.

kafka在zookeeper中的组成

略...

zk选举kafka

假设一共三个kafka节点

brokerController1 down了.

剩下的两个节点,监听zk,发现broker1掉了之后,会发起请求,谁的请求先到.谁就是 新的 brokerController

副本分配

对副本进行分配,放到不同的broker中

副本分配策略

...

发送数据流程

总的就是这张图

生产数据

消费数据

拦截器

添加拦截器

实现自定义拦截器

java 复制代码
public class ValueInterceptorTest implements ProducerInterceptor<String>{
	
}

分区器 分区计算策略

发送消息.

自定义分区器

实现接口重写方法

java 复制代码
public class myKafkaParationer implements Partitioner{}

分区计算策略

略...

数据收集器

数据发送者

异步数据发送回调

java 复制代码
producer.send(msg,callBackMethod);

同步发送数据回调

这就同步操作了

应答处理级别

ack 的值

ack == 0
ack == 1
ack == all(-1)
ack == 0
ack == 1
ack == -1(all)

kafka幂等性

初始化事务

prodicer.initTransaction(); // 开启事务

prodicer.commit(); // 提交事务

prodicer.abortTranscation(); // 终止事务

存储文件类型

刷写数据条件

一条数据就从内存刷到硬盘上

存储数据

相关推荐
Data跳动3 小时前
Spark内存都消耗在哪里了?
大数据·分布式·spark
Java程序之猿5 小时前
微服务分布式(一、项目初始化)
分布式·微服务·架构
来一杯龙舌兰5 小时前
【RabbitMQ】RabbitMQ保证消息不丢失的N种策略的思想总结
分布式·rabbitmq·ruby·持久化·ack·消息确认
节点。csn7 小时前
Hadoop yarn安装
大数据·hadoop·分布式
saynaihe8 小时前
安全地使用 Docker 和 Systemctl 部署 Kafka 的综合指南
运维·安全·docker·容器·kafka
NiNg_1_2348 小时前
基于Hadoop的数据清洗
大数据·hadoop·分布式
隔着天花板看星星10 小时前
Spark-Streaming集成Kafka
大数据·分布式·中间件·spark·kafka
技术路上的苦行僧14 小时前
分布式专题(8)之MongoDB存储原理&多文档事务详解
数据库·分布式·mongodb
龙哥·三年风水14 小时前
workman服务端开发模式-应用开发-后端api推送修改二
分布式·gateway·php
小小工匠15 小时前
分布式协同 - 分布式事务_2PC & 3PC解决方案
分布式·分布式事务·2pc·3pc