Hadoop 集群基础指令指南

目录

[🧩 一、Hadoop 基础服务管理指令](#🧩 一、Hadoop 基础服务管理指令)

[▶️ 启动 Hadoop](#▶️ 启动 Hadoop)

[⏹️ 关闭 Hadoop](#⏹️ 关闭 Hadoop)

[🧾 查看进程是否正常运行](#🧾 查看进程是否正常运行)

[📁 二、HDFS 常用文件系统指令](#📁 二、HDFS 常用文件系统指令)

[🛠️ 三、MapReduce 作业运行指令](#🛠️ 三、MapReduce 作业运行指令)

[📋 四、集群状态监控指令](#📋 四、集群状态监控指令)

[💡 五、管理员常用 HDFS 命令](#💡 五、管理员常用 HDFS 命令)


包含 Hadoop 启动/关闭、HDFS 基本操作、MapReduce 提交流程等的常用指令大全,适合刚搭建好 Hadoop 环境后进行操作与测试。


🧩 一、Hadoop 基础服务管理指令

▶️ 启动 Hadoop

复制代码
# 启动 HDFS 和 YARN 所有服务(推荐)
start-dfs.sh
start-yarn.sh

# 或使用统一启动脚本(部分版本支持)
start-all.sh

⏹️ 关闭 Hadoop

复制代码
# 停止 HDFS 和 YARN 所有服务
stop-dfs.sh
stop-yarn.sh

# 或使用统一停止脚本
stop-all.sh

🧾 查看进程是否正常运行

复制代码
jps
# 正常应看到:NameNode、DataNode、ResourceManager、NodeManager 等

📁 二、HDFS 常用文件系统指令

功能 命令
查看根目录 hadoop fs -ls /
创建目录 hadoop fs -mkdir /user/yourname
上传文件 hadoop fs -put test.txt /user/yourname/
下载文件 hadoop fs -get /user/yourname/test.txt ./
删除文件 hadoop fs -rm /user/yourname/test.txt
删除目录 hadoop fs -rm -r /user/yourname/testdir
查看内容 hadoop fs -cat /user/yourname/test.txt
查看空间使用 hadoop fs -du -s /user/yourname/
拷贝文件 hadoop fs -cp /src/file.txt /dst/file.txt
移动文件 hadoop fs -mv /src/file.txt /dst/

🛠️ 三、MapReduce 作业运行指令

复制代码
# 1. 编译 Java 程序并打包为 JAR(假设你写的是 WordCount.java)
javac -classpath `hadoop classpath` -d classes WordCount.java
jar -cvf wordcount.jar -C classes/ .

# 2. 上传输入文件
hadoop fs -mkdir /input
hadoop fs -put input.txt /input/

# 3. 提交 MapReduce 作业(以 WordCount 为例)
hadoop jar wordcount.jar WordCount /input /output

# 4. 查看输出结果
hadoop fs -cat /output/part-r-00000

📋 四、集群状态监控指令

功能 命令
查看作业列表 yarn application -list
查看作业状态 yarn application -status <app_id>
杀死作业 yarn application -kill <app_id>
查看节点 yarn node -list
查看集群资源 yarn cluster --list

💡 五、管理员常用 HDFS 命令

复制代码
# 查看 HDFS 使用状态
hdfs dfsadmin -report

# 刷新节点信息(当编辑了 slaves 文件等)
hdfs dfsadmin -refreshNodes

# 安全模式检查(启动时只读)
hdfs dfsadmin -safemode get
相关推荐
武子康3 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
初次攀爬者4 天前
ZooKeeper 实现分布式锁的两种方式
分布式·后端·zookeeper
武子康4 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP4 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库4 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
AI周红伟4 天前
周红伟:智能体全栈构建实操:OpenClaw部署+Agent Skills+Seedance+RAG从入门到实战
大数据·人工智能·大模型·智能体
B站计算机毕业设计超人4 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法
计算机程序猿学长4 天前
大数据毕业设计-基于django的音乐网站数据分析管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)
大数据·django·课程设计
B站计算机毕业设计超人4 天前
计算机毕业设计Django+Vue.js音乐推荐系统 音乐可视化 大数据毕业设计 (源码+文档+PPT+讲解)
大数据·vue.js·hadoop·python·spark·django·课程设计
十月南城4 天前
数据湖技术对比——Iceberg、Hudi、Delta的表格格式与维护策略
大数据·数据库·数据仓库·hive·hadoop·spark