kafka安装、spark安装

kafka简介

Kafka就是一个分布式的用于消息存储的消息队列。

kafka角色

Kafka中存储的消息,被消费后不会被删除,可以被重复消费,消息会保留多长,由kafka自己去配置。默认7天删除。背后的管理工作由zookeeper来管理。

kafka安装

版本匹配

(以下操作均在虚拟机中运行)

首先进入到 /opt/software 中,将kafka的安装包传入,进行解压并重命名

cd /opt/software

rz (选择压缩包进行传入)

tar -zxvf 压缩包 (进行解压)

mv 文件名 kafka

然后ll查看就可以展现出所解压并且已经成功重命名的文件

将文件传输到node02、node03中,并且修改配置

cd config

v i server.properties

0: node01

1: node02

2: node03

分发kafka的安装包,到其他的节点中:

|-----------------------------------------------------------------------------------------------------------------------------|
| scp -r kafka node02:PWD scp -r kafka node03:PWD 使用下面的 scp -r kafka node02:/opy/software scp -r kafka node03:/opt/software |

启动节点

先启动zookeeper集群

zkServer.sh start

启动脚本和停止脚本命令。

kafka-server-start.sh

kafka-server-stop.sh

以后台守护进程启动:(前面启动不行 使用该命令)三个节点都启动

kafka-server-start.sh -daemon /opt/software/kafka/config/server.properties

注意: 在启动kafka之前,必须先启动zookeeper

spark安装

选择与kafka、scala版本相匹配的spark文件进行

(以下操作均在虚拟机中运行)

将文件传输到node01、node02、node03中,并解压重命名

修改spark的配置文件

vi /opt/software/hadoop/hadoop-2.9.2/etc/hadoop/yarn-site.xm

添加如下两行

<property>

<name>yarn.nodemanager.vmem-check-enabled</name>

<value>false</value>

</property>

<property>

<name>yarn.nodemanager.pmem-check-enabled</name>

<value>false</value>

</property>

保存退出(esc+:+wq)

修改env文件,添加配置并保存刷新

可以测试是否安装成功

相关推荐
阿里云大数据AI技术15 小时前
StarRocks 助力数禾科技构建实时数仓:从数据孤岛到智能决策
大数据
深圳蔓延科技16 小时前
Kafka的高性能之路
后端·kafka
Lx35219 小时前
Hadoop数据处理优化:减少Shuffle阶段的性能损耗
大数据·hadoop
武子康1 天前
大数据-99 Spark Streaming 数据源全面总结:原理、应用 文件流、Socket、RDD队列流
大数据·后端·spark
阿里云大数据AI技术2 天前
大数据公有云市场第一,阿里云占比47%!
大数据
阿里云云原生2 天前
嘉银科技基于阿里云 Kafka Serverless 提升业务弹性能力,节省成本超过 20%
kafka·serverless
Lx3522 天前
Hadoop容错机制深度解析:保障作业稳定运行
大数据·hadoop
程序消消乐2 天前
Kafka 入门指南:从 0 到 1 构建你的 Kafka 知识基础入门体系
分布式·kafka
智能化咨询2 天前
Kafka架构:构建高吞吐量分布式消息系统的艺术——进阶优化与行业实践
分布式·架构·kafka