kafka安装、spark安装

kafka简介

Kafka就是一个分布式的用于消息存储的消息队列。

kafka角色

Kafka中存储的消息,被消费后不会被删除,可以被重复消费,消息会保留多长,由kafka自己去配置。默认7天删除。背后的管理工作由zookeeper来管理。

kafka安装

版本匹配

(以下操作均在虚拟机中运行)

首先进入到 /opt/software 中,将kafka的安装包传入,进行解压并重命名

cd /opt/software

rz (选择压缩包进行传入)

tar -zxvf 压缩包 (进行解压)

mv 文件名 kafka

然后ll查看就可以展现出所解压并且已经成功重命名的文件

将文件传输到node02、node03中,并且修改配置

cd config

v i server.properties

0: node01

1: node02

2: node03

分发kafka的安装包,到其他的节点中:

|-----------------------------------------------------------------------------------------------------------------------------|
| scp -r kafka node02:PWD scp -r kafka node03:PWD 使用下面的 scp -r kafka node02:/opy/software scp -r kafka node03:/opt/software |

启动节点

先启动zookeeper集群

zkServer.sh start

启动脚本和停止脚本命令。

kafka-server-start.sh

kafka-server-stop.sh

以后台守护进程启动:(前面启动不行 使用该命令)三个节点都启动

kafka-server-start.sh -daemon /opt/software/kafka/config/server.properties

注意: 在启动kafka之前,必须先启动zookeeper

spark安装

选择与kafka、scala版本相匹配的spark文件进行

(以下操作均在虚拟机中运行)

将文件传输到node01、node02、node03中,并解压重命名

修改spark的配置文件

vi /opt/software/hadoop/hadoop-2.9.2/etc/hadoop/yarn-site.xm

添加如下两行

<property>

<name>yarn.nodemanager.vmem-check-enabled</name>

<value>false</value>

</property>

<property>

<name>yarn.nodemanager.pmem-check-enabled</name>

<value>false</value>

</property>

保存退出(esc+:+wq)

修改env文件,添加配置并保存刷新

可以测试是否安装成功

相关推荐
武子康10 小时前
大数据-184 Elasticsearch Doc Values 机制详解:列式存储如何支撑排序/聚合/脚本
大数据·后端·elasticsearch
expect7g10 小时前
Paimon源码解读 -- Compaction-8.专用压缩任务
大数据·后端·flink
良策金宝AI13 小时前
从CAD插件到原生平台:工程AI的演进路径与智能协同新范式
大数据·人工智能
康实训13 小时前
智慧老年实训室建设核心方案
大数据·实训室·养老实训室·实训室建设
min18112345613 小时前
分公司组织架构图在线设计 总部分支管理模板
大数据·人工智能·信息可视化·架构·流程图
周杰伦_Jay13 小时前
【Elasticsearch】核心概念,倒排索引,数据操纵
大数据·elasticsearch·搜索引擎
cai_cai013 小时前
springAlibaba + ollama + es 完成RAG知识库功能
大数据·elasticsearch·搜索引擎
Cx330❀13 小时前
Git 分支管理完全指南:从基础到团队协作
大数据·git·搜索引擎·全文检索
nhdh13 小时前
ELK(elasticsearch-7.6.2,kibana-7-6-2,Logstash-7.6.2)单节点部署
大数据·elk·elasticsearch
新元代码14 小时前
Git在Windows环境下的安装与使用教程
大数据·elasticsearch·搜索引擎