Kafka-安装和配置(搭建环境)

在开始之前,我们先理清一个关键背景:Kafka 正在经历一个重要的架构演进------逐步移除对 ZooKeeper 的依赖,转向自研的 KRaft (Kafka Raft) 模式。这不仅是安装方式的差异,更代表了Kafka未来的架构方向,理解这一点对你后续的学习和选型很有帮助。

为适应新版本的变化,本文以KRaft (Kafka Raft) 模式进行讲解。

一、历史版本对比

二、安装

这里以KRaft模式为例,使用 Docker Compose 安装,展示Kafka 3.x+的快速启动过程:

1.前置条件:Linux服务器安装 Docker 和 Docker Compose。

2.文件目录:/apps/kafka

3.创建 docker-compose.yml

bash 复制代码
services:
  kafka:
    image: swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/apache/kafka:3.8.0
    container_name: kafka
    hostname: kafka
    ports:
      - "9092:9092"
      - "9093:9093"
    volumes:
      - /apps/kafka/data:/var/lib/kafka/data
      - /apps/kafka/logs:/opt/kafka/logs
    restart: always
    environment:
      TZ: Asia/Shanghai

      # KRaft 核心配置
      KAFKA_NODE_ID: 1
      KAFKA_PROCESS_ROLES: broker,controller
      KAFKA_CONTROLLER_QUORUM_VOTERS: 1@kafka:9093
      KAFKA_CONTROLLER_LISTENER_NAMES: CONTROLLER
      KAFKA_INTER_BROKER_LISTENER_NAME: PLAINTEXT

      # Listener 配置
      KAFKA_LISTENER_SECURITY_PROTOCOL_MAP: CONTROLLER:PLAINTEXT,PLAINTEXT:PLAINTEXT
      KAFKA_LISTENERS: PLAINTEXT://0.0.0.0:9092,CONTROLLER://0.0.0.0:9093
      KAFKA_ADVERTISED_LISTENERS: PLAINTEXT://你的服务器IP:9092

      # 其他必要配置
      KAFKA_OFFSETS_TOPIC_REPLICATION_FACTOR: 1
      KAFKA_TRANSACTION_STATE_LOG_REPLICATION_FACTOR: 1
      KAFKA_TRANSACTION_STATE_LOG_MIN_ISR: 1
      KAFKA_AUTO_CREATE_TOPICS_ENABLE: "true"
      KAFKA_DELETE_TOPIC_ENABLE: "true"

      # 生产优化
      KAFKA_HEAP_OPTS: -Xms1G -Xmx1G
      KAFKA_NUM_PARTITIONS: 3
      KAFKA_LOG_RETENTION_HOURS: 168
      KAFKA_LOG_SEGMENT_BYTES: 536870912

  kafka-ui:
    image: ghcr.io/kafbat/kafka-ui:latest
    container_name: kafka-ui
    ports:
      - "8088:8080"
    restart: always
    environment:
      TZ: Asia/Shanghai
      KAFKA_CLUSTERS_0_NAME: local-kafka
      KAFKA_CLUSTERS_0_BOOTSTRAPSERVERS: 你的服务器IP:9092
    depends_on:
      - kafka

networks:
  default:
    name: app-net
    external: true

4.启动:docker compose up -d

*注意*swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/apache/kafka:3.8.0,这个镜像仓库可能会拉取失败;需要手动拉取:命令:docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/apache/kafka:3.8.0;再执行:docker compose up -d

5.验证:docker compose logs -n 200 kafka

三、常用命令行操作 (CLI)

熟悉Kafka自带的命令行工具,是进行开发和运维的基础。

所有命令都在Kafka安装目录的/bin目录下。

1.主题管理:kafka-topics.sh

是管理Topic的核心工具,基本操作如下:

关键参数补充

  • --partitions:指定Topic的分区数,决定了数据的并行处理能力上限。

  • --replication-factor:指定Topic的副本数(必须 ≤ Broker数量),保障数据高可用。

  • --config:设置特定配置,如消息保留时间--config retention.ms=172800000

2.消息收发:kafka-console-producer.shkafka-console-consumer.sh

这两个工具是用于快速测试消息生产与消费的利器。

生产者示例

|-------------------------------------------------------------------------------------------------------------------------------|
| # 启动生产者,向 topic 为 'test' 发送消息 ./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test > 输入第一条消息 > 输入第二条消息 |

输入消息内容,每行是一条独立的Kafka消息。

常用参数--property parse.key=true让你可以按key:value格式发送带key的消息。

消费者示例

|-------------------------------------------------------------------------------------------------------------------------------|
| # 启动消费者,从 topic 为 'test' 读取消息 ./bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning |

该命令会实时打印从test主题拉取到的消息。

注意--from-beginning参数,它会让消费者从该主题的最起始位置开始消费。

📌 消费者组管理:kafka-consumer-groups.sh

消费者组是Kafka实现高吞吐和可扩展消费的核心,该命令用于监控和管理消费者组的状态。

核心监控指标:LAG (消息积压)

--describe 的输出中,LAG是最关键的指标之一。它表示生产者速度 > 消费者速度,即有多条消息尚未被消费,这是排查消费性能问题的首要入口。

相关推荐
阿里云云原生3 天前
告别冗长链路!Kafka × Table Bucket 实现开放表格式零 ETL 实时入湖
云原生·kafka
风吹夏回9 天前
RabbitMQ 核心术语 + Python pika 方法完整讲解
分布式·python·rabbitmq
风吹夏回9 天前
RabbitMQ 三种模式入门:HelloWorld、WorkQueue、PubSub
分布式·rabbitmq·ruby
霸道流氓气质9 天前
分布式追踪与 RequestId 传播完全指南
分布式
cheems95279 天前
[RabbitMQ高级特性] 消息确认机制:从 Ready / Unacked 到 basicAck、basicReject、basicNack 的底层拆解
分布式·rabbitmq·ruby
whaledown9 天前
Kafka 与 Java 消息队列入门:用订单场景理解核心机制
java·kafka·消息队列·springboot
枫华落尽9 天前
【Hadoop01-完全分布式运行模式】
分布式
隔壁阿布都9 天前
ShedLock 分布式定时任务锁框架介绍
spring boot·分布式
文艺倾年9 天前
【强化学习】数学推导专题,20W字总结(十五)
人工智能·分布式·大模型·强化学习·vibecoding
ACP广源盛139246256739 天前
GSV9001S@ACP#1080P 级视频处理芯片,物理 AI 普及终端的高性价比选择
大数据·人工智能·分布式·嵌入式硬件·spark