安装Hadoop:Hadoop的单机模式、伪分布式模式——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项

前言

Hadoop包括三种安装模式:

  1. 单机模式:只在一台机器上运行,存储是采用本地文件系统,没有采用分布式文件系统HDFS;
  2. 伪分布式模式:存储采用分布式文件系统HDFS,但是,HDFS的名称节点和数据节点都在同一台机器上;
  3. 分布式模式:存储采用分布式文件系统HDFS,而且,HDFS的名称节点和数据节点位于不同机器上。

这篇笔记适合于原生 Hadoop3.1.3 ,主要参考了官方安装教程,步骤详细,辅以适当说明,相信按照步骤来,都能顺利安装并运行Hadoop 。另外有Hadoop安装配置简略版方便有基础的读者快速完成安装。此外,小北希望友友们能多去了解一些 Linux 的知识,以后出现问题时才能自行解决。

为了方便学习,请友友们利用Linux系统中自带的firefox浏览器打开本指南进行学习。

Hadoop安装文件,可以到Hadoop官网下载hadoop-3.1.3.tar.gz。

也可以直接点击这里从百度云盘下载软件(提取码:ziyu),进入百度网盘后,进入"软件"目录,找到hadoop-3.1.3.tar.gz文件下载到本地。

可以参考小北之前的两篇博客哇~

Hadoop安装笔记1单机/伪分布式配置_Hadoop3.1.3------备赛笔记------2024全国职业院校技能大赛"大数据应用开发"赛项------任务2:离线数据处理-CSDN博客https://blog.csdn.net/Zhiyilang/article/details/135236893?spm=1001.2014.3001.5501Hadoop安装笔记2单机/伪分布式配置_Hadoop3.1.3------备赛笔记------2024全国职业院校技能大赛"大数据应用开发"赛项------任务2:离线数据处理-CSDN博客https://blog.csdn.net/Zhiyilang/article/details/135276305?spm=1001.2014.3001.5501

本章中小北只讲了前面两种"单机"和"伪分布式",第三种"分布式"打算后续单独写一篇,因为这个也是搭建HADOOP的集群了,所以希望这些也能帮助到友友们~

一、下载安装文件

前提: 下载好hadoop的3.1.3的安装包 并用PTF传送hadoop用户下下载目录

1,请使用hadoop用户登录虚拟机,并打开一个终端,执行一下命令:

复制代码
 sudo tar -zxf ~/下载/hadoop-3.1.3.tar.gz -C /usr/local    # 解压到/usr/local中
 cd /usr/local/
 sudo mv ./hadoop-3.1.3/ ./hadoop      # 将文件夹名改为hadoop
 sudo chown -R hadoop ./hadoop       # 修改文件权限

2,输入一下命令检测Hadoop解压是否可以用,成功会显示其版本:

复制代码
cd /usr/local/hadoop
./bin/hadoop version
相关推荐
释怀不想释怀4 分钟前
Linux环境变量
linux·运维·服务器
zzzsde10 分钟前
【Linux】进程(4):进程优先级&&调度队列
linux·运维·服务器
零售ERP菜鸟12 分钟前
范式革命:从“信息化”到“数字化”的本质跃迁
大数据·人工智能·职场和发展·创业创新·学习方法·业界资讯
半壶清水18 分钟前
[软考网规考点笔记]-软件开发、项目管理与知识产权核心知识与真题解析
网络·笔记·压力测试
凡人叶枫21 分钟前
C++中智能指针详解(Linux实战版)| 彻底解决内存泄漏,新手也能吃透
java·linux·c语言·开发语言·c++·嵌入式开发
Hello.Reader36 分钟前
Flink 对接 Google Cloud Storage(GCS)读写、Checkpoint、插件安装与生产配置指南
大数据·flink
tq108642 分钟前
先探索,后设计
笔记
yuanmenghao43 分钟前
Linux 性能实战 | 第 7 篇 CPU 核心负载与调度器概念
linux·网络·性能优化·unix
hnult1 小时前
2026 在线培训考试系统选型指南:核心功能拆解与选型逻辑
人工智能·笔记·课程设计
qq_297574671 小时前
Linux 服务器 Java 开发环境搭建保姆级教程
java·linux·服务器