kafka安装、spark安装

kafka简介

Kafka就是一个分布式的用于消息存储的消息队列。

kafka角色

Kafka中存储的消息,被消费后不会被删除,可以被重复消费,消息会保留多长,由kafka自己去配置。默认7天删除。背后的管理工作由zookeeper来管理。

kafka安装

版本匹配

(以下操作均在虚拟机中运行)

首先进入到 /opt/software 中,将kafka的安装包传入,进行解压并重命名

cd /opt/software

rz (选择压缩包进行传入)

tar -zxvf 压缩包 (进行解压)

mv 文件名 kafka

然后ll查看就可以展现出所解压并且已经成功重命名的文件

将文件传输到node02、node03中,并且修改配置

cd config

v i server.properties

0: node01

1: node02

2: node03

分发kafka的安装包,到其他的节点中:

|-----------------------------------------------------------------------------------------------------------------------------|
| scp -r kafka node02:PWD scp -r kafka node03:PWD 使用下面的 scp -r kafka node02:/opy/software scp -r kafka node03:/opt/software |

启动节点

先启动zookeeper集群

zkServer.sh start

启动脚本和停止脚本命令。

kafka-server-start.sh

kafka-server-stop.sh

以后台守护进程启动:(前面启动不行 使用该命令)三个节点都启动

kafka-server-start.sh -daemon /opt/software/kafka/config/server.properties

注意: 在启动kafka之前,必须先启动zookeeper

spark安装

选择与kafka、scala版本相匹配的spark文件进行

(以下操作均在虚拟机中运行)

将文件传输到node01、node02、node03中,并解压重命名

修改spark的配置文件

vi /opt/software/hadoop/hadoop-2.9.2/etc/hadoop/yarn-site.xm

添加如下两行

<property>

<name>yarn.nodemanager.vmem-check-enabled</name>

<value>false</value>

</property>

<property>

<name>yarn.nodemanager.pmem-check-enabled</name>

<value>false</value>

</property>

保存退出(esc+:+wq)

修改env文件,添加配置并保存刷新

可以测试是否安装成功

相关推荐
拓端研究室1 分钟前
2026中国游戏产业趋势及潜力分析报告:小游戏、AI应用、出海趋势|附160+份报告PDF、数据、可视化模板汇总下载
大数据·人工智能
萧曵 丶5 分钟前
Kafka 全面解析
分布式·kafka
APItesterCris6 分钟前
商品详情 API 的签名验证与安全接入技术要点
大数据·数据库·安全·架构
达瓦里氏12310 分钟前
一文厘清:医疗器械一类、二类、三类的划分逻辑
大数据·健康医疗
Lansonli23 分钟前
大数据Spark(七十六):Action行动算子reduce和take、takeSample使用案例
大数据·分布式·spark
鲨莎分不晴35 分钟前
HBase 基本使用详解
大数据·数据库·hbase
Sinokap39 分钟前
Gemini 3 Flash:在速度、成本与前沿智能之间的平衡
大数据·人工智能
SpaceAIGlobal41 分钟前
基于 Elasticsearch 实现排序沉底与前置的方法解析
大数据·elasticsearch·搜索引擎
Hello.Reader1 小时前
Hadoop Formats 在 Flink 里复用 Hadoop InputFormat(flink-hadoop-compatibility)
大数据·hadoop·flink
视***间1 小时前
视程空间AIR算力开发平台:以边缘智能之核,驱动机器人产业迈入全域自动化时代
大数据·人工智能·机器人·区块链·边缘计算·视程空间