记录之Ubuntu22.4虚拟机及hadoop为分布式安装

1.安装Ubuntu虚拟机系统

参考教程:【图说】VMware & Ubuntu22.04 详细安装教程

Vmware:17.5

Ubuntu:22.04

2.远程连接

  1. 组合键"CTRL+ALT+T"新建一个终端
  2. 创建一个用户hadoop:
powershell 复制代码
sudo useradd -m hadoop -s /bin/bash  # 创建用户

sudo passwd hadoop  # 修改用户密码

sudo adduser hadoop # 添加权限

使用filezilla连接Ubuntu22.04虚拟机

jdk:https://www.oracle.com/java/technologies/downloads/#java8

eclipse:https://www.eclipse.org/downloads/

将jdk安装包和eclipse安装包通过filezilla远程连接传入虚拟机。

具体安装:ubuntu安装eclipse、jdk以及环境配置

3.安装hadoop(伪分布式)

Hadoop官网下载3.3.5:
https://archive.apache.org/dist/hadoop/common/hadoop-3.3.5/hadoop-3.3.5.tar.gz

或者阿里云镜像下载:
https://mirrors.aliyun.com/apache/hadoop/common/hadoop-3.3.5/hadoop-3.3.5.tar.gz?spm=a2c6h.25603864.0.0.1225a91eQScNgQ

3.1 配置ssh等
Hadoop伪分布式配置教程中的第二部分。

3.2 解压hadoop
ubuntu-22.04虚拟机环境下安装Hadoop3.3.5

3.3 修改配置文件

参考3.2中链接的博客的如下目录部分。

3.4 启动hadoop命令

powershell 复制代码
cd /usr/local/hadoop
./sbin/start-dfs.sh        #start-dfs.sh是个完整的可执行文件,中间没有空格

jps

成功启动后,可以访问 Web 界面 http://localhost:9870 查看 NameNode 和 Datanode 信息,还可以在线查看 HDFS 中的文件

相关推荐
xixixi7777715 小时前
基于零信任架构的通信
大数据·人工智能·架构·零信任·通信·个人隐私
Hello.Reader16 小时前
Flink 自适应批执行(Adaptive Batch Execution)让 Batch 作业“边跑边优化”
大数据·flink·batch
kobe_t16 小时前
分布式定时任务系列14:XXL-job的注册模型
分布式
Knight_AL17 小时前
线程池满了怎么办?用 RabbitMQ 做任务补偿不丢失
分布式·rabbitmq·ruby
LaughingZhu17 小时前
Product Hunt 每日热榜 | 2026-01-31
大数据·人工智能·经验分享·搜索引擎·产品运营
babe小鑫17 小时前
中专学历进入快消大厂终端销售岗位的可行性分析
大数据
samFuB17 小时前
【工具变量】区县5A级旅游景区DID数据集(2000-2025年)
大数据
百夜﹍悠ゼ18 小时前
数据治理DataHub安装部署
大数据·数据治理
wdfk_prog18 小时前
解决 `git cherry-pick` 引入大量新文件的问题
大数据·git·elasticsearch
難釋懷19 小时前
分布式锁-redission锁的MutiLock原理
分布式