kafka安装、spark安装

kafka简介

Kafka就是一个分布式的用于消息存储的消息队列。

kafka角色

Kafka中存储的消息,被消费后不会被删除,可以被重复消费,消息会保留多长,由kafka自己去配置。默认7天删除。背后的管理工作由zookeeper来管理。

kafka安装

版本匹配

(以下操作均在虚拟机中运行)

首先进入到 /opt/software 中,将kafka的安装包传入,进行解压并重命名

cd /opt/software

rz (选择压缩包进行传入)

tar -zxvf 压缩包 (进行解压)

mv 文件名 kafka

然后ll查看就可以展现出所解压并且已经成功重命名的文件

将文件传输到node02、node03中,并且修改配置

cd config

v i server.properties

0: node01

1: node02

2: node03

分发kafka的安装包,到其他的节点中:

|-----------------------------------------------------------------------------------------------------------------------------|
| scp -r kafka node02:PWD scp -r kafka node03:PWD 使用下面的 scp -r kafka node02:/opy/software scp -r kafka node03:/opt/software |

启动节点

先启动zookeeper集群

zkServer.sh start

启动脚本和停止脚本命令。

kafka-server-start.sh

kafka-server-stop.sh

以后台守护进程启动:(前面启动不行 使用该命令)三个节点都启动

kafka-server-start.sh -daemon /opt/software/kafka/config/server.properties

注意: 在启动kafka之前,必须先启动zookeeper

spark安装

选择与kafka、scala版本相匹配的spark文件进行

(以下操作均在虚拟机中运行)

将文件传输到node01、node02、node03中,并解压重命名

修改spark的配置文件

vi /opt/software/hadoop/hadoop-2.9.2/etc/hadoop/yarn-site.xm

添加如下两行

<property>

<name>yarn.nodemanager.vmem-check-enabled</name>

<value>false</value>

</property>

<property>

<name>yarn.nodemanager.pmem-check-enabled</name>

<value>false</value>

</property>

保存退出(esc+:+wq)

修改env文件,添加配置并保存刷新

可以测试是否安装成功

相关推荐
搞科研的小刘选手3 小时前
【EI稳定检索会议】第七届计算机信息和大数据应用国际学术会议(CIBDA 2026)
大数据·acm·学术会议·计算机工程·计算机信息·大数据应用·信息与技术
爆米花byh3 小时前
在RockyLinux9环境的Kafka4.1.1单机版安装(无ZK依赖)
中间件·kafka
成长之路5143 小时前
【数据集】地级市公共安全基建省内横向压力(2015-2025)
大数据
YangYang9YangYan4 小时前
2026中专大数据专业学习指南
大数据
yumgpkpm4 小时前
预测:2026年大数据软件+AI大模型的发展趋势
大数据·人工智能·算法·zookeeper·kafka·开源·cloudera
无级程序员4 小时前
大数据Hive之拉链表增量取数合并设计(主表加历史表合并成拉链表)
大数据·hive·hadoop
py小王子5 小时前
dy评论数据爬取实战:基于DrissionPage的自动化采集方案
大数据·开发语言·python·毕业设计
DemonAvenger5 小时前
Kafka消费者深度剖析:消费组与再平衡原理
性能优化·kafka·消息队列
龙山云仓5 小时前
MES系统超融合架构
大数据·数据库·人工智能·sql·机器学习·架构·全文检索
会算数的⑨6 小时前
Kafka知识点问题驱动式的回顾与复习——(一)
分布式·后端·中间件·kafka