Macos系统上搭建Hadoop详细过程

一、环境检查

1、java环境检查

复制代码
java -version

openjdk version "21.0.8" 2025-07-15 LTS

OpenJDK Runtime Environment Microsoft-11933201 (build 21.0.8+9-LTS)

OpenJDK 64-Bit Server VM Microsoft-11933201 (build 21.0.8+9-LTS, mixed mode, sharing)

2、ssh免密检查

复制代码
Ahdim@Mac-Mini-Pro hadoop % ssh localhost

The authenticity of host 'localhost (127.0.0.1)' can't be established.

ED25519 key fingerprint is SHA256:kqg9GIrbTMPOEAy4wtxzz8aOk6y+U94zc14HaTKfip8.

This key is not known by any other names.

Are you sure you want to continue connecting (yes/no/[fingerprint])? yes

Warning: Permanently added 'localhost' (ED25519) to the list of known hosts.

(Ahdim@localhost) Password:

Last login: Tue Nov  4 15:40:52 2025

如果提示如下信息:

Ahdim@Mac-Mini-Pro hadoop % ssh localhost

ssh: connect to host localhost port 22: Connection refused

按照如下步骤打开权限:

系统设置->通用->共享->远程登录->打开权限

3、创建目录(安装位置)

复制代码
以下是我的安装位置,仅供参考,根据你的情况定义自己的安装位置
 mkdir -p /Users/Ahdim/data/server/hadoop
Ahdim@Mac-Mini-Pro hadoop % pwd                                     
/Users/Ahdim/data/server/hadoop

二、下载 & 解压

cd /Library/Hadoop

curl -O https://archive.apache.org/dist/hadoop/core/hadoop-3.3.6/hadoop-3.3.6.tar.gz

sudo tar -zxf hadoop-3.3.6.tar.gz

sudo mv hadoop-3.3.6 hadoop

三、环境配置

复制代码
export HADOOP_HOME=/Library/Hadoop/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export JAVA_HOME=$(/usr/libexec/java_home)
source ~/.zshrc

$HADOOP_HOME/etc/hadoop路径:

core-site.xml

复制代码
<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/Library/Hadoop/hadoop/tmp</value>
  </property>
</configuration>

hdfs-site.xml

复制代码
<configuration>
  <property><name>dfs.replication</name><value>1</value></property>
  <property><name>dfs.namenode.http-address</name><value>localhost:9870</value></property>
</configuration>

mapred-site.xml

复制代码
<configuration>
  <property><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>

yarn-site.xml

复制代码
<configuration>
  <property><name>yarn.resourcemanager.hostname</name><value>localhost</value></property>
  <property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property>
</configuration>

四、初始化 & 启动

首次格式化

hdfs namenode -format

一键启动

start-dfs.sh

start-yarn.sh

验证

jps # 应看到 NameNode/DataNode/ResourceManager/NodeManager

五、Web UI

六、运行测试示例

echo "hello hadoop" > words.txt

hdfs dfs -mkdir -p /input

hdfs dfs -put words.txt /input

hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar wordcount /input /output

hdfs dfs -cat /output/part-r-00000

相关推荐
Elastic 中国社区官方博客23 分钟前
快速 vs. 准确:衡量量化向量搜索的召回率
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索
qq_3813385031 分钟前
【技术日报】2026-03-18 AI 领域重磅速递
大数据·人工智能
电商API&Tina4 小时前
【电商API接口】开发者一站式电商API接入说明
大数据·数据库·人工智能·云计算·json
zxsz_com_cn4 小时前
设备预测性维护方案设计方向,如何设计设备预测性维护方案
分布式
武子康7 小时前
大数据-253 离线数仓 - Airflow 入门与任务调度实战:DAG、Operator、Executor 部署排错指南
大数据·后端·apache hive
guoji77888 小时前
2026年Gemini 3 Pro vs 豆包2.0深度评测:海外顶流与国产黑马谁更强?
大数据·人工智能·架构
TDengine (老段)8 小时前
TDengine IDMP 组态面板 —— 工具箱
大数据·数据库·时序数据库·tdengine·涛思数据
网络工程小王8 小时前
【大数据技术详解】——Kibana(学习笔记)
大数据·笔记·学习
zxsz_com_cn10 小时前
设备预测性维护方案设计的关键要素
大数据·人工智能
唐天下闻化10 小时前
连锁数字化改造8成翻车?三维避坑实录
大数据