记录之Ubuntu22.4虚拟机及hadoop为分布式安装

1.安装Ubuntu虚拟机系统

参考教程:【图说】VMware & Ubuntu22.04 详细安装教程

Vmware:17.5

Ubuntu:22.04

2.远程连接

  1. 组合键"CTRL+ALT+T"新建一个终端
  2. 创建一个用户hadoop:
powershell 复制代码
sudo useradd -m hadoop -s /bin/bash  # 创建用户

sudo passwd hadoop  # 修改用户密码

sudo adduser hadoop # 添加权限

使用filezilla连接Ubuntu22.04虚拟机

jdk:https://www.oracle.com/java/technologies/downloads/#java8

eclipse:https://www.eclipse.org/downloads/

将jdk安装包和eclipse安装包通过filezilla远程连接传入虚拟机。

具体安装:ubuntu安装eclipse、jdk以及环境配置

3.安装hadoop(伪分布式)

Hadoop官网下载3.3.5:
https://archive.apache.org/dist/hadoop/common/hadoop-3.3.5/hadoop-3.3.5.tar.gz

或者阿里云镜像下载:
https://mirrors.aliyun.com/apache/hadoop/common/hadoop-3.3.5/hadoop-3.3.5.tar.gz?spm=a2c6h.25603864.0.0.1225a91eQScNgQ

3.1 配置ssh等
Hadoop伪分布式配置教程中的第二部分。

3.2 解压hadoop
ubuntu-22.04虚拟机环境下安装Hadoop3.3.5

3.3 修改配置文件

参考3.2中链接的博客的如下目录部分。

3.4 启动hadoop命令

powershell 复制代码
cd /usr/local/hadoop
./sbin/start-dfs.sh        #start-dfs.sh是个完整的可执行文件,中间没有空格

jps

成功启动后,可以访问 Web 界面 http://localhost:9870 查看 NameNode 和 Datanode 信息,还可以在线查看 HDFS 中的文件

相关推荐
lizhihai_991 小时前
股市学习心得-六张分时保命图
大数据·人工智能·学习
渣渣盟1 小时前
Flink 流处理那些事儿:状态、时间与容错
大数据·flink
CS创新实验室2 小时前
CS实验室行业报告:生物医药与生物工程行业就业分析报告
大数据·人工智能·生物医药
身如柳絮随风扬3 小时前
多数据源切换实战:从业务场景到3种实现方案全解析
java·分布式·微服务
隐于花海,等待花开4 小时前
40.RAND 函数深度解析
hive·hadoop
无忧智库4 小时前
跨行业数据要素可信流通体系建设:打破信任壁垒的完整工程方法论(WORD)
大数据·人工智能
小王毕业啦4 小时前
2007-2024年 省级-农林牧渔总产值、农业总产值数据(xlsx)
大数据·人工智能·数据挖掘·数据分析·社科数据·实证分析·经管数据
数据皮皮侠4 小时前
上市公司创新韧性数据(2000-2024)|顶刊同款 EIR 指数
大数据·人工智能·算法·智慧城市·制造
AIMath~4 小时前
雪花算法+ZooKeeper解决方案+RPC是什么
分布式·zookeeper·云原生
科研前沿4 小时前
纯视觉无感解算 + 动态数字孪生:室内外无感定位技术全新升级
大数据·人工智能·算法·重构·空间计算