Macos系统上搭建Hadoop详细过程

一、环境检查

1、java环境检查

复制代码
java -version

openjdk version "21.0.8" 2025-07-15 LTS

OpenJDK Runtime Environment Microsoft-11933201 (build 21.0.8+9-LTS)

OpenJDK 64-Bit Server VM Microsoft-11933201 (build 21.0.8+9-LTS, mixed mode, sharing)

2、ssh免密检查

复制代码
Ahdim@Mac-Mini-Pro hadoop % ssh localhost

The authenticity of host 'localhost (127.0.0.1)' can't be established.

ED25519 key fingerprint is SHA256:kqg9GIrbTMPOEAy4wtxzz8aOk6y+U94zc14HaTKfip8.

This key is not known by any other names.

Are you sure you want to continue connecting (yes/no/[fingerprint])? yes

Warning: Permanently added 'localhost' (ED25519) to the list of known hosts.

(Ahdim@localhost) Password:

Last login: Tue Nov  4 15:40:52 2025

如果提示如下信息:

Ahdim@Mac-Mini-Pro hadoop % ssh localhost

ssh: connect to host localhost port 22: Connection refused

按照如下步骤打开权限:

系统设置->通用->共享->远程登录->打开权限

3、创建目录(安装位置)

复制代码
以下是我的安装位置,仅供参考,根据你的情况定义自己的安装位置
 mkdir -p /Users/Ahdim/data/server/hadoop
Ahdim@Mac-Mini-Pro hadoop % pwd                                     
/Users/Ahdim/data/server/hadoop

二、下载 & 解压

cd /Library/Hadoop

curl -O https://archive.apache.org/dist/hadoop/core/hadoop-3.3.6/hadoop-3.3.6.tar.gz

sudo tar -zxf hadoop-3.3.6.tar.gz

sudo mv hadoop-3.3.6 hadoop

三、环境配置

复制代码
export HADOOP_HOME=/Library/Hadoop/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export JAVA_HOME=$(/usr/libexec/java_home)
source ~/.zshrc

$HADOOP_HOME/etc/hadoop路径:

core-site.xml

复制代码
<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/Library/Hadoop/hadoop/tmp</value>
  </property>
</configuration>

hdfs-site.xml

复制代码
<configuration>
  <property><name>dfs.replication</name><value>1</value></property>
  <property><name>dfs.namenode.http-address</name><value>localhost:9870</value></property>
</configuration>

mapred-site.xml

复制代码
<configuration>
  <property><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>

yarn-site.xml

复制代码
<configuration>
  <property><name>yarn.resourcemanager.hostname</name><value>localhost</value></property>
  <property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property>
</configuration>

四、初始化 & 启动

首次格式化

hdfs namenode -format

一键启动

start-dfs.sh

start-yarn.sh

验证

jps # 应看到 NameNode/DataNode/ResourceManager/NodeManager

五、Web UI

六、运行测试示例

echo "hello hadoop" > words.txt

hdfs dfs -mkdir -p /input

hdfs dfs -put words.txt /input

hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar wordcount /input /output

hdfs dfs -cat /output/part-r-00000

相关推荐
汤姆yu1 天前
基于大数据的出行方式推荐系统
大数据·出行方式推荐
bigdata-rookie1 天前
Spark 部署模式
大数据·分布式·spark
芝麻开门-新起点1 天前
贝壳GIS数据存储与房屋3D展示技术解析
大数据
玖日大大1 天前
Gemini 3 全维度技术解析:从认知到落地实战指南
大数据
蒋士峰DBA修行之路1 天前
实验二十二 GaussDB分布式场景调优
分布式·gaussdb
yumgpkpm1 天前
数据可视化AI、BI工具,开源适配 Cloudera CMP 7.3(或类 CDP 的 CMP 7.13 平台,如华为鲲鹏 ARM 版)值得推荐?
人工智能·hive·hadoop·信息可视化·kafka·开源·hbase
little_xianzhong1 天前
把一个本地项目导入gitee创建的仓库中
大数据·elasticsearch·gitee
青靴1 天前
轻量级 CI/CD 实战(三):Kafka消费者Docker容器化部署
分布式·docker·kafka
galaxyffang1 天前
RocketMQ 为什么性能不如 Kafka?
分布式·kafka·rocketmq