hadoop 集群的常用命令

以下是一些 Hadoop 集群的常用命令,包括针对 HDFS(Hadoop 分布式文件系统)和 MapReduce 作业等方面,且相对不太常见:

HDFS 权限相关:

  • 修改文件或目录的所有者: hdfs dfs -chown [-R] <owner>[:<group>] <path> 。例如, hdfs dfs -chown -R hadoop:hadoop /user/hadoop/data , -R 选项用于递归修改目录及其子目录和文件的所有者。

  • 修改文件或目录的权限: hdfs dfs -chmod [-R] <mode> <path> 。比如, hdfs dfs -chmod -R 755 /user/hadoop/project , -R 同样用于递归操作, 755 是权限模式。

HDFS 统计信息:

  • 获取文件系统的统计信息: hdfs dfsadmin -report 。这个命令会显示集群中各个数据节点的信息,包括节点状态、存储使用情况等。

  • 显示文件或目录的磁盘空间使用情况: hdfs dfs -du [-s] [-h] <path> 。 -s 选项用于汇总指定路径下的总大小, -h 选项以人类可读的格式显示大小,如 hdfs dfs -du -s -h /user/hadoop/data 。

MapReduce 作业相关:

  • 查看 MapReduce 作业的计数器信息: yarn application -appInfo <applicationId> -counter 。可以通过作业 ID 查看作业运行过程中的各种计数器值,了解作业的执行情况。

  • 杀死一个 MapReduce 作业: yarn application -kill <applicationId> 。当发现作业异常或不需要继续运行时,可使用该命令终止作业。

Hadoop 守护进程管理:

  • 安全模式相关:进入安全模式 hdfs dfsadmin -safemode enter ,在安全模式下,HDFS 只允许读操作,用于维护集群状态;离开安全模式 hdfs dfsadmin -safemode leave 。

  • 重新加载 HDFS 的配置: hdfs dfsadmin -refreshNamenodes <datanode_host:port> 。当数据节点的配置发生变化时,可使用此命令让 NameNode 重新加载该数据节点的信息。

相关推荐
QYResearch1 小时前
导航浮标灯市场现状及前景分析
大数据
QYResearch1 小时前
2025年全球半导体用电子湿化学品行业总体规模、主要企业国内外市场占有率及排名
大数据
搞科研的小刘选手2 小时前
【通信&网络安全主题】第六届计算机通信与网络安全国际学术会议(CCNS 2025)
大数据·人工智能·网络安全·vr·通信工程·网络技术·计算机工程
阿里云大数据AI技术5 小时前
云栖实录 | 通义实验室基于MaxCompute进行大模型数据管理及处理
大数据·人工智能
yumgpkpm6 小时前
CMP (类ClouderaCDP7.3(404次编译) )华为鲲鹏Aarch64(ARM)信创环境多个mysql数据库汇聚的操作指南
大数据·hive·hadoop·zookeeper·big data·cloudera
CryptoPP7 小时前
获取越南股票市场列表(包含VN30成分股)实战指南
大数据·服务器·数据库·区块链
跨境小新7 小时前
TG弹出“只能给双向联系人发送消息”的飞机双向限制怎么办?
大数据
数智顾问8 小时前
破解 Shuffle 阻塞:Spark RDD 宽窄依赖在实时特征工程中的实战与未来
大数据·分布式·spark
Giser探索家8 小时前
遥感卫星升轨 / 降轨技术解析:对图像光照、对比度的影响及工程化应用
大数据·人工智能·算法·安全·计算机视觉·分类
lisw059 小时前
数字化科技简化移民流程的 5 种方式
大数据·人工智能·机器学习