Hadoop 实战笔记(一) -- Windows 安装 Hadoop 3.x

环境准备

  1. 安装 JAVA 1.8
    Java环境搭建之JDK下载及安装
  2. 下载 Hadoop 3.3.5 安装包
    Hadoop 下载:https://archive.apache.org/dist/hadoop/common/

一、JAVA JDK 环境检查

二、Hadoop(HDFS)环境搭建

1. 解压安装文件 hadoop-3.3.5.tar

2. 配置环境变量

bash 复制代码
HADOOP_HOME:D:\Development\Hadoop

HADOOP_USER_NAME:root

Path:%HADOOP_HOME%\bin;%HADOOP_HOME%\sbin;

3.配置Hadoop

检查 hadoop-3.3.5\etc\hadoop\hadoop-env.cmd 文件JDK的配置,通常无需改动

bash 复制代码
set JAVA_HOME=%JAVA_HOME%

如果报错的话配置为 JAVA 安装路径

bash 复制代码
set JAVA_HOME=C:\PROGRA~1\Java\jdk1.8.0_92

windowsd的cmd不允许设置变量路径带有空格,所以Java的安装目录需要不带空格

修改 hadoop/etc/hadoop/core-site.xml

bash 复制代码
<configuration>
	<!--指定 namenode 的 hdfs 协议文件系统的通信地址-->
	<property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
    <!--指定 hadoop 存储临时文件的目录-->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>D:\Development\Hadoop\data\tmp</value>
    </property>
</configuration>

修改 hadoop/etc/hadoop/hdfs-site.xml

bash 复制代码
<configuration>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>D:\Development\Hadoop\data\namenode</value>
    </property>
	<property>
        <name>dfs.datanode.data.dir</name>
        <value>D:\Development\Hadoop\data\datanode</value>
    </property>
     <!--由于我们这里搭建是单机版本,所以指定 dfs 的副本系数为 1-->	
	<property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
	   <name>dfs.permissions.enabled</name>
	   <value>false</value>
	</property>
</configuration>

4. 格式化NameNode :

第一次启动 Hadoop 时需要进行初始化,进入 ${HADOOP_HOME}/bin/ 目录下,执行以下命令:

进入 hadoop-3.3.5\bin 目录,执行 以下命令

bash 复制代码
hdfs namenode -format

5. 启动 HDFS

  • 进入 hadoop/sbin 目录,执行以下命令:
bash 复制代码
hadoop/sbin/start-dfs.cmd

hadoop/sbin/start-yarn.cmd
  • 验证是否启动成功
    方式一:执行 jps 查看 NameNode 和 DataNode 服务是否已经启动:
bash 复制代码
[../sbin]# jps
5988 Jps
1964 DataNode
4572 NameNode
  • 查看集群状态
    http://localhost:9870/

三、Hadoop(YARN)环境搭建

1. 修改配置

进入 ${HADOOP_HOME}/etc/hadoop/ 目录下,修改以下配置:

  • 修改 hadoop/etc/hadoop/mapred-site.xml
bash 复制代码
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>
  • 修改 hadoop/etc/hadoop/yarn-site.xml
bash 复制代码
<configuration>
 <!--配置 NodeManager 上运行的附属服务。需要配置成 mapreduce_shuffle 后才可以在 Yarn 上运行 MapReduce 程序。-->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
        <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>localhost</value>
    </property>
</configuration>

5. 启动服务

  • 进入 hadoop/sbin 目录,执行以下命令:
bash 复制代码
hadoop/sbin/start-yarn.cmd

6. 验证是否启动成功

  • 方式一:执行 jps 查看 ResourceManagerNodeManager 服务是否已经启动:
bash 复制代码
4112 Jps
2100 ResourceManager
1964 DataNode
4572 NameNode
4668 NodeManager
  • 方式二:查看 Web UI 界面,端口号为 8088,访问页面:http://localhost:8088/

参考:

相关推荐
萑澈6 小时前
Windows 7 运行 Electron 安装包报“不是有效的 Win32 应用程序”怎么办
javascript·windows·electron
BizViewStudio6 小时前
甄选 2026:AI 重构新媒体代运营行业的三大核心变革与落地路径
大数据·人工智能·新媒体运营·媒体
overmind7 小时前
oeasy Python 121[专业选修]列表_多维列表运算_列表相加_列表相乘
java·windows·python
Cx330❀8 小时前
Linux命名管道(FIFO)通信:从原理到实操,一文搞懂跨进程通信
大数据·linux·运维·服务器·elasticsearch·搜索引擎
汽车仪器仪表相关领域8 小时前
NHVOC-70系列固定污染源挥发性有机物监测系统:精准破局工业VOCs监测痛点,赋能环保合规升级
大数据·人工智能·安全性测试
Vanranrr8 小时前
Windows 环境下 SVN 命令行能力补齐:一次工程化排障与标准化实践
windows·svn
xiaotao1319 小时前
01-编程基础与数学基石: Python核心数据结构完全指南
数据结构·人工智能·windows·python
实证小助手10 小时前
世界各国经济政策不确定指数(1997-2024年)月度数据
大数据·人工智能
csgo打的菜又爱玩10 小时前
1.JobManager启动流程解析.md
大数据·flink·源代码管理
m0_7381207210 小时前
渗透测试基础ctfshow——Web应用安全与防护(五)
前端·网络·数据库·windows·python·sql·安全