Hadoop大集群配置文档-粗略版-3万字长文 (包括hive，zookeeper，hbase,flume等中间件和mysql等)

先填一下上次许诺的坑：（许诺的那篇文章链接如下）

如何用sql在1分钟从1T数据中精准定位查询？Hive离线数仓 Spark分析-CSDN博客文章浏览阅读1.2k次，点赞38次，收藏14次。在大数据-Hadoop体系中，spark批处理和hive离线数仓可以说是对立并行的两个大分支技术栈，，，建议主攻其一，另一个灵活使用就行。他们是2015出现在国内，2017年之后国外各大公司纷纷采用，国内2020采用的，目前属于很前沿，并且很主流，很顶层的技术。（注：19年国内云计算开始起势，大数据的发展与云计算和人工智能等密切相关，更离不开芯片，硬件存储技术等相关支撑，它们之间相辅相成https://blog.csdn.net/qq_61414097/article/details/140999898

我的许诺有点多，请容我慢慢填坑 "后续的话我会出一期关于大数据所有主流组件搭载在一个集群实验环境的运维配置文档。"此坑暂时填补嘿嘿这篇文章就是

先收藏，过几天我会对文章进行精修，

因为这是我两年前用的，实验集群配置不过作为参考文档也可有个约数，自己有个对照配置，方便排查一些，组件不兼容的坑。

它其实是.txt文档，所以放在这里有点粗放了哈哈哈，抱歉

还要整理spark，所以这篇就先到这里吧，我先在已经在磕云计算了，再不整理下就忘光了hhh

1 安装VMware和CentOS7系统

CentOS7.9.io镜像下载

建议阿里云下载cents镜像ios 链接如下

https://mirrors.aliyun.com/centos/7.9.2009/isos/x86_64/CentOS-7-x86_64-DVD-2207-02.iso

VMware安装

win7用 12

win10 用 15

win11用 16.2.4

别问为什么，问就是win和VMware不兼容导致虚拟机各种奇葩异常，重装集群了

这已经是我当年实验了20多次得出的结果，最佳兼容性搭配。

安装过程未完待续。。****。

**1.安装了VMware和CentOS7系统
2.设置了网络，使用Xshell进行连接
网络问题：
3.协助大家远程解决问题的软件：teamViewer、向日葵

/home 2g
/boot 目录用来存放文件内核0.5g
/ 根目录15g
/ swap为交换临时数据目录，最好不要用安装时少分配空间1.5g**

/必须掌握的linux命令：
1.文件和目录操作
cd：切换目录
ls -al ：列出所在目录的文件及文件夹
mkdir：创建文件夹
cat :查看文件
mv：移动文件或者修改名字

tar -zxvf ：解压文件，后面经常使用
vi或者vim ：编辑文件，后面经常使用

初学者完成 Linux 系统分区及安装之后，需熟练掌握 Linux 系统管理必备命令，
命令包括：cd、ls、pwd、clear、chmod、chown、chattr、useradd、userdel、
groupadd、vi、vim、cat、more、less、mv、cp、rm、rmdir、touch、ifconfig、
ip addr、ping、route、echo、wc、expr、bc、ln、head、tail、who、hostname、
top、df、du、netstat、ss、kill、alias、man、tar、zip、unzip、jar、fdisk、
free、uptime、lsof、lsmod、lsattr、dd、date、crontab、ps、find、awk、
sed、grep、sort、uniq 等，
每个命令至少练习 30 遍，逐步掌握每个命令的用法及应用场景；

1.1安装系统后的准备工作inux系统初始环境设置
1）配置服务器的IP地址
查看机器的网卡名称。
ip address show。
（2）设置服务器的主机名称
设置主机名称
hostnamectl set-hostname master (主机名)：修改以后永久生效
hostname master11 ：临时修改主机名为master111
查看当前服务器的名称。
hostname
（3）绑定主机名与IP地址

查看ip
ip addr
192.168.20.134
修改hosts文件
vi /etc/hosts
在其中增加相应内容（下面的内容表示主机名master对应的IP地址为192.168.1.1）：
192.168.20.134 master

（4）
临时关闭防火墙
关闭命令：
systemctl stop firewalld
查看防火墙的状态
systemctl status firewalld

我们此时永久关闭防火墙供后续使用，临时关闭后续容易无法连接外网

**[root@localhost ~]# systemctl disable firewalld.service
Removed symlink /etc/systemd/system/multi-user.target.wants/firewalld.service.
Removed symlink /etc/systemd/system/dbus-org.fedoraproject.FirewallD1.service.
查看防火墙的状态
systemctl status firewalld
配置 selinux

上一篇：实战｜uniapp模仿微信实现发送位置消息，解决滚动页面地图层级冲突

下一篇：mac如何查看shell是 zsh还是bash