Hadoop 的基本 shell 命令

Hadoop 的基本 shell 命令主要用于与 Hadoop 分布式文件系统(HDFS)和 MapReduce 进行交互。以下是一些常用的 Hadoop shell 命令:

一、 HDFS 命令

  1. 查看 HDFS 状态

`hdfs dfsadmin -report`: 显示 HDFS 的健康状态和容量信息。

  1. 文件系统操作

`hdfs dfs -ls path`: 列出指定路径下的文件和目录。

`hdfs dfs -du path`: 显示指定路径的文件和目录的大小。

`hdfs dfs -df path`: 显示 HDFS 的磁盘使用情况。

  1. 文件操作

`hdfs dfs -put localpath hdfspath`: 将本地文件上传到 HDFS。

`hdfs dfs -get hdfspath localpath`: 从 HDFS 下载文件到本地。

`hdfs dfs -copyFromLocal localpath hdfspath`: 将本地文件复制到 HDFS。

`hdfs dfs -copyToLocal hdfspath localpath`: 从 HDFS 复制文件到本地。

  1. 目录操作

`hdfs dfs -mkdir path`: 在 HDFS 中创建目录。

`hdfs dfs -rmdir path`: 删除 HDFS 中的空目录。

`hdfs dfs -rm path`: 删除 HDFS 中的文件或目录。

`hdfs dfs -rm -r path`: 递归删除 HDFS 中的目录及其内容。

  1. 文件查看

`hdfs dfs -cat path`: 显示 HDFS 文件的内容。

`hdfs dfs -tail path`: 显示 HDFS 文件的最后部分内容。

`hdfs dfs -chmod permissions path`: 更改 HDFS 文件或目录的权限。

`hdfs dfs -chown owner:group path`: 更改 HDFS 文件或目录的所有者和用户组。

`hdfs dfs -chgrp group path`: 更改 HDFS 文件或目录的用户组。

二、 MapReduce 命令

1. 提交作业

`hadoop jar jarfile mainclass args`: 提交一个 MapReduce 作业。

2. 查看作业状态

`yarn application -list`: 列出当前运行的 YARN 应用程序。

`yarn application -status applicationId`: 查看指定应用程序的状态。

3. 停止作业

`yarn application -kill applicationId`: 杀死指定的 YARN 应用程序。

这些命令是使用 Hadoop 时常用的基础命令。Hadoop 的文档和社区提供了更多的细节和高级用法,适用于具体的配置和操作需求。

相关推荐
TTBIGDATA6 分钟前
【Ambari Plus】11.Kafka 安装
大数据·hadoop·分布式·kafka·ambari·hdp·ambari plus
星空10 分钟前
git指令
大数据·elasticsearch·搜索引擎
李昊哲小课15 分钟前
Ubuntu26.04 搭建 Hadoop3.5.0 完全分布式
大数据·hadoop·分布式·ubuntu·hdfs·mapreduce
2601_9549711340 分钟前
人工智能与大数据专业填报指南:核心区别、职业路径
大数据·人工智能
newbe365243 小时前
我们如何使用 impeccable 优化前端界面设计与实现稳定性
前端·人工智能·分布式·github·aigc·wpf
2501_947575809 小时前
计算机毕业设计之jsp开山车行二手车交易系统
java·开发语言·hadoop·python·信息可视化·django·课程设计
A15362559 小时前
装配具身机器人品牌推荐 工业装配场景选型指南与艾利特方案
大数据·人工智能·机器人
LLWZAI9 小时前
想要稳定变现,先跨过朱雀 AI 这道门槛
大数据·人工智能
ccimao631610 小时前
散户做财报整理、研报阅读、复盘记录,各类AI工具适配环节梳理
大数据·人工智能
派叔10 小时前
老字号营销服务商技术解构:三类方案的架构逻辑与选型评估
大数据·人工智能·搜索引擎·架构·产品运营·流量运营