记录之Ubuntu22.4虚拟机及hadoop为分布式安装

1.安装Ubuntu虚拟机系统

参考教程:【图说】VMware & Ubuntu22.04 详细安装教程

Vmware:17.5

Ubuntu:22.04

2.远程连接

  1. 组合键"CTRL+ALT+T"新建一个终端
  2. 创建一个用户hadoop:
powershell 复制代码
sudo useradd -m hadoop -s /bin/bash  # 创建用户

sudo passwd hadoop  # 修改用户密码

sudo adduser hadoop # 添加权限

使用filezilla连接Ubuntu22.04虚拟机

jdk:https://www.oracle.com/java/technologies/downloads/#java8

eclipse:https://www.eclipse.org/downloads/

将jdk安装包和eclipse安装包通过filezilla远程连接传入虚拟机。

具体安装:ubuntu安装eclipse、jdk以及环境配置

3.安装hadoop(伪分布式)

Hadoop官网下载3.3.5:
https://archive.apache.org/dist/hadoop/common/hadoop-3.3.5/hadoop-3.3.5.tar.gz

或者阿里云镜像下载:
https://mirrors.aliyun.com/apache/hadoop/common/hadoop-3.3.5/hadoop-3.3.5.tar.gz?spm=a2c6h.25603864.0.0.1225a91eQScNgQ

3.1 配置ssh等
Hadoop伪分布式配置教程中的第二部分。

3.2 解压hadoop
ubuntu-22.04虚拟机环境下安装Hadoop3.3.5

3.3 修改配置文件

参考3.2中链接的博客的如下目录部分。

3.4 启动hadoop命令

powershell 复制代码
cd /usr/local/hadoop
./sbin/start-dfs.sh        #start-dfs.sh是个完整的可执行文件,中间没有空格

jps

成功启动后,可以访问 Web 界面 http://localhost:9870 查看 NameNode 和 Datanode 信息,还可以在线查看 HDFS 中的文件

相关推荐
sakoba1 小时前
flink消费pulsar
大数据·flink·pulsar
云老大TG:@yunlaoda3603 小时前
如何进行华为云国际站代理商跨Region适配?
大数据·数据库·华为云·负载均衡
Wang's Blog3 小时前
Kafka: 消费者核心机制
分布式·kafka
字节数据平台4 小时前
刚刚,火山引擎多模态数据湖解决方案发布大数据运维Agent
大数据·运维·火山引擎
YangYang9YangYan5 小时前
2026高职会计电算化专业高价值技能证书
大数据·学习·区块链
老蒋新思维5 小时前
从「流量算法」到「增长算法」:AI智能体如何重构企业增长的内在逻辑
大数据·网络·人工智能·重构·创始人ip·创客匠人·知识变现
五度易链-区域产业数字化管理平台5 小时前
大数据与 AI 赋能招商全流程:五度易链平台的技术架构与实践应用解析
大数据·人工智能
学海_无涯_苦作舟5 小时前
分布式事务的解决方案
分布式
Moonbeam Community6 小时前
Polkadot 2025:从协议工程到可用的去中心化云平台
大数据·web3·去中心化·区块链·polkadot
阿里云大数据AI技术6 小时前
DataWorks 又又又升级了,这次我们通过 Arrow 列存格式让数据同步速度提升10倍!
大数据·人工智能