1.安装Ubuntu虚拟机系统
参考教程:【图说】VMware & Ubuntu22.04 详细安装教程
Vmware:17.5
Ubuntu:22.04
2.远程连接
- 组合键"CTRL+ALT+T"新建一个终端
- 创建一个用户hadoop:
powershell
sudo useradd -m hadoop -s /bin/bash # 创建用户
sudo passwd hadoop # 修改用户密码
sudo adduser hadoop # 添加权限
jdk:https://www.oracle.com/java/technologies/downloads/#java8
eclipse:https://www.eclipse.org/downloads/
将jdk安装包和eclipse安装包通过filezilla远程连接传入虚拟机。
具体安装:ubuntu安装eclipse、jdk以及环境配置
3.安装hadoop(伪分布式)
Hadoop官网下载3.3.5:
https://archive.apache.org/dist/hadoop/common/hadoop-3.3.5/hadoop-3.3.5.tar.gz
3.1 配置ssh等
Hadoop伪分布式配置教程中的第二部分。
3.2 解压hadoop
ubuntu-22.04虚拟机环境下安装Hadoop3.3.5中
3.3 修改配置文件
参考3.2中链接的博客的如下目录部分。
3.4 启动hadoop命令
powershell
cd /usr/local/hadoop
./sbin/start-dfs.sh #start-dfs.sh是个完整的可执行文件,中间没有空格
jps
成功启动后,可以访问 Web 界面 http://localhost:9870 查看 NameNode 和 Datanode 信息,还可以在线查看 HDFS 中的文件