记录之Ubuntu22.4虚拟机及hadoop为分布式安装

1.安装Ubuntu虚拟机系统

参考教程:【图说】VMware & Ubuntu22.04 详细安装教程

Vmware:17.5

Ubuntu:22.04

2.远程连接

  1. 组合键"CTRL+ALT+T"新建一个终端
  2. 创建一个用户hadoop:
powershell 复制代码
sudo useradd -m hadoop -s /bin/bash  # 创建用户

sudo passwd hadoop  # 修改用户密码

sudo adduser hadoop # 添加权限

使用filezilla连接Ubuntu22.04虚拟机

jdk:https://www.oracle.com/java/technologies/downloads/#java8

eclipse:https://www.eclipse.org/downloads/

将jdk安装包和eclipse安装包通过filezilla远程连接传入虚拟机。

具体安装:ubuntu安装eclipse、jdk以及环境配置

3.安装hadoop(伪分布式)

Hadoop官网下载3.3.5:
https://archive.apache.org/dist/hadoop/common/hadoop-3.3.5/hadoop-3.3.5.tar.gz

或者阿里云镜像下载:
https://mirrors.aliyun.com/apache/hadoop/common/hadoop-3.3.5/hadoop-3.3.5.tar.gz?spm=a2c6h.25603864.0.0.1225a91eQScNgQ

3.1 配置ssh等
Hadoop伪分布式配置教程中的第二部分。

3.2 解压hadoop
ubuntu-22.04虚拟机环境下安装Hadoop3.3.5

3.3 修改配置文件

参考3.2中链接的博客的如下目录部分。

3.4 启动hadoop命令

powershell 复制代码
cd /usr/local/hadoop
./sbin/start-dfs.sh        #start-dfs.sh是个完整的可执行文件,中间没有空格

jps

成功启动后,可以访问 Web 界面 http://localhost:9870 查看 NameNode 和 Datanode 信息,还可以在线查看 HDFS 中的文件

相关推荐
凌不了云1 天前
doris通过外部表同步数据
大数据
todoitbo1 天前
从大数据角度看时序数据库选型:Apache IoTDB的实战经验分享
大数据·apache·时序数据库·iotdb
大数据CLUB1 天前
酒店预订数据分析及预测可视化
大数据·hadoop·分布式·数据挖掘·数据分析·spark·mapreduce
huisheng_qaq1 天前
【ElasticSearch实用篇-05】基于脚本script打分
大数据·elasticsearch·script·匹配·社交·脚本打分
夜郎king1 天前
MapTalks:国产轻量化二三维一体化GIS引擎
大数据·国产二三维引擎·maptalks引擎
青鱼入云1 天前
ES脚本语言Painless介绍
大数据·elasticsearch·搜索引擎
Jonathan Star1 天前
嵌套 Git 仓库(Submodule/子模块)
大数据·git·elasticsearch
TDengine (老段)1 天前
从“数据堆场”到“智能底座”:TDengine IDMP如何统一数据语言
大数据·数据库·物联网·时序数据库·tdengine
liuyunshengsir1 天前
让 Elasticsearch Delete By Query 请求立即生效
大数据·elasticsearch·jenkins
武子康1 天前
大数据-148 Flink 写入 Kudu 实战:自定义 Sink 全流程(Flink 1.11/Kudu 1.17/Java 11)
大数据·后端·nosql