Kafka-安装和配置(搭建环境)

在开始之前,我们先理清一个关键背景:Kafka 正在经历一个重要的架构演进------逐步移除对 ZooKeeper 的依赖,转向自研的 KRaft (Kafka Raft) 模式。这不仅是安装方式的差异,更代表了Kafka未来的架构方向,理解这一点对你后续的学习和选型很有帮助。

为适应新版本的变化,本文以KRaft (Kafka Raft) 模式进行讲解。

一、历史版本对比

二、安装

这里以KRaft模式为例,使用 Docker Compose 安装,展示Kafka 3.x+的快速启动过程:

1.前置条件:Linux服务器安装 Docker 和 Docker Compose。

2.文件目录:/apps/kafka

3.创建 docker-compose.yml

bash 复制代码
services:
  kafka:
    image: swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/apache/kafka:3.8.0
    container_name: kafka
    hostname: kafka
    ports:
      - "9092:9092"
      - "9093:9093"
    volumes:
      - /apps/kafka/data:/var/lib/kafka/data
      - /apps/kafka/logs:/opt/kafka/logs
    restart: always
    environment:
      TZ: Asia/Shanghai

      # KRaft 核心配置
      KAFKA_NODE_ID: 1
      KAFKA_PROCESS_ROLES: broker,controller
      KAFKA_CONTROLLER_QUORUM_VOTERS: 1@kafka:9093
      KAFKA_CONTROLLER_LISTENER_NAMES: CONTROLLER
      KAFKA_INTER_BROKER_LISTENER_NAME: PLAINTEXT

      # Listener 配置
      KAFKA_LISTENER_SECURITY_PROTOCOL_MAP: CONTROLLER:PLAINTEXT,PLAINTEXT:PLAINTEXT
      KAFKA_LISTENERS: PLAINTEXT://0.0.0.0:9092,CONTROLLER://0.0.0.0:9093
      KAFKA_ADVERTISED_LISTENERS: PLAINTEXT://你的服务器IP:9092

      # 其他必要配置
      KAFKA_OFFSETS_TOPIC_REPLICATION_FACTOR: 1
      KAFKA_TRANSACTION_STATE_LOG_REPLICATION_FACTOR: 1
      KAFKA_TRANSACTION_STATE_LOG_MIN_ISR: 1
      KAFKA_AUTO_CREATE_TOPICS_ENABLE: "true"
      KAFKA_DELETE_TOPIC_ENABLE: "true"

      # 生产优化
      KAFKA_HEAP_OPTS: -Xms1G -Xmx1G
      KAFKA_NUM_PARTITIONS: 3
      KAFKA_LOG_RETENTION_HOURS: 168
      KAFKA_LOG_SEGMENT_BYTES: 536870912

  kafka-ui:
    image: ghcr.io/kafbat/kafka-ui:latest
    container_name: kafka-ui
    ports:
      - "8088:8080"
    restart: always
    environment:
      TZ: Asia/Shanghai
      KAFKA_CLUSTERS_0_NAME: local-kafka
      KAFKA_CLUSTERS_0_BOOTSTRAPSERVERS: 你的服务器IP:9092
    depends_on:
      - kafka

networks:
  default:
    name: app-net
    external: true

4.启动:docker compose up -d

*注意*swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/apache/kafka:3.8.0,这个镜像仓库可能会拉取失败;需要手动拉取:命令:docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/apache/kafka:3.8.0;再执行:docker compose up -d

5.验证:docker compose logs -n 200 kafka

三、常用命令行操作 (CLI)

熟悉Kafka自带的命令行工具,是进行开发和运维的基础。

所有命令都在Kafka安装目录的/bin目录下。

1.主题管理:kafka-topics.sh

是管理Topic的核心工具,基本操作如下:

关键参数补充

  • --partitions:指定Topic的分区数,决定了数据的并行处理能力上限。

  • --replication-factor:指定Topic的副本数(必须 ≤ Broker数量),保障数据高可用。

  • --config:设置特定配置,如消息保留时间--config retention.ms=172800000

2.消息收发:kafka-console-producer.shkafka-console-consumer.sh

这两个工具是用于快速测试消息生产与消费的利器。

生产者示例

|-------------------------------------------------------------------------------------------------------------------------------|
| # 启动生产者,向 topic 为 'test' 发送消息 ./bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test > 输入第一条消息 > 输入第二条消息 |

输入消息内容,每行是一条独立的Kafka消息。

常用参数--property parse.key=true让你可以按key:value格式发送带key的消息。

消费者示例

|-------------------------------------------------------------------------------------------------------------------------------|
| # 启动消费者,从 topic 为 'test' 读取消息 ./bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning |

该命令会实时打印从test主题拉取到的消息。

注意--from-beginning参数,它会让消费者从该主题的最起始位置开始消费。

📌 消费者组管理:kafka-consumer-groups.sh

消费者组是Kafka实现高吞吐和可扩展消费的核心,该命令用于监控和管理消费者组的状态。

核心监控指标:LAG (消息积压)

--describe 的输出中,LAG是最关键的指标之一。它表示生产者速度 > 消费者速度,即有多条消息尚未被消费,这是排查消费性能问题的首要入口。

相关推荐
逻极1 小时前
MongoDB 从入门到精通:文档数据库的灵活之道
分布式·mongodb·nosql·聚合框架
大G的笔记本2 小时前
分布式事务实战
分布式
AI浩2 小时前
梯度累积与 Micro-Batch 设计分层式精讲:有效批次、显存边界与分布式同步
开发语言·分布式·batch
l1t3 小时前
DeepSeek总结的从 DeepSeek 到 Quack:分布式 DuckDB 的梦想何时开始变得真实
数据库·分布式
钝挫力PROGRAMER3 小时前
BugFixed:etcd 单节点宕机后数据“消失”
分布式·etcd
小旭95273 小时前
Spring Cloud 集成分布式日志 ELK+Swagger 接口文档实战
java·分布式·后端·elk·spring cloud
SilentSamsara3 小时前
消息队列集成:Python + Kafka/RabbitMQ 生产实践
服务器·开发语言·分布式·python·kafka·rabbitmq
2601_957882243 小时前
分布式媒体中台的非阻塞I/O架构:高并发事件网关、熔断机制与跨域ETL管道流控实践
分布式·架构·媒体
2601_957879333 小时前
分布式媒体中台的多渠道协同架构:数据一致性、高并发调度与跨域路由容错实践
分布式·架构·媒体