基于Hadoop平台的电信客服数据的处理与分析③项目开发：搭建Kafka大数据运算环境---任务12：安装Kafka

我非夏日2024-07-06 23:04

任务描述

任务内容为安装和配置Kafka集群。

Kafka是大数据生态圈中常用的消息队列框架

具体安装步骤如下：

解压缩Kafka的压缩包

配置Kafka的环境变量

修改Kafka的配置文件，Kafka的配置文件存放在Kafka安装目录下的config中

验证Kafka

在【master1】上解压缩包

复制代码

[root@master1 ~]# cd /opt/software
[root@master1 software]# tar -xzf kafka_2.12-2.4.1.tgz -C /opt/app/

复制代码

[root@master1 ~]# vi /etc/profile

在文件末尾添加如下配置

复制代码

export KAFKA_HOME=/opt/app/kafka_2.12-2.4.1
export PATH=$PATH:$KAFKA_HOME/bin

执行【source /etc/profile】重新加载环境变量

为Kafka创建数据目录

复制代码

[root@master1 ~]# source /etc/profile
[root@master1 ~]# cd $KAFKA_HOME
[root@master1 kafka_2.12-2.4.1]# mkdir kafka-logs

然后打开config目录下的server.properties文件，修改日志目录为刚刚创建的目录:

复制代码

[root@master1 kafka_2.12-2.4.1]# cd $KAFKA_HOME/config
[root@master1 config]# vi server.properties

修改如下配置的值，其中broker.id的值需要保证在整个集群中是唯一的

复制代码

broker.id=1
listeners=PLAINTEXT://master1:9092
log.dirs=/opt/app/kafka_2.12-2.4.1/kafka-logs
zookeeper.connect=master1:2181,slave1:2181,slave2:2181

在【master1】启动Kafka的后台守护进程

复制代码

[root@master1 ~]# kafka-server-start.sh -daemon $KAFKA_HOME/config/server.properties

1）创建topic，创建名为test的topic，分区数1，副本1

复制代码

[root@master1 ~]# kafka-topics.sh --create --zookeeper master1:2181,slave1:2181,slave2:2181 --replication-factor 1 --partitions 1 --topic test

2）查看topic的状态

复制代码

[root@master1 ~]# kafka-topics.sh --describe --zookeeper master1:2181,slave1:2181,slave2:2181 --topic test

3）在【master1】开启一个生产者发送消息

复制代码

[root@master1 ~]# kafka-console-producer.sh --broker-list master1:9092 --topic test

4）在【master1】再打开一个消费者消费消息

复制代码

[root@master1 ~]# kafka-console-consumer.sh --bootstrap-server master1:9092 --from-beginning --topic test

参数from-beginning表示从第一条消息开始读取