hadoop第3课(hdfs shell常用命令)

一、Hadoop FS 基础操作命令

1. 查看帮助
bash 复制代码
hadoop fs -help [命令名]  # 查看具体命令的帮助文档
# 示例:
hadoop fs -help mkdir
2. 目录操作
bash 复制代码
hadoop fs -mkdir /path          # 创建目录
hadoop fs -mkdir -p /path/a/b   # 递归创建多级目录
hadoop fs -rmdir /path          # 删除空目录
3. 文件操作
bash 复制代码
hadoop fs -put local_file /hdfs_path   # 上传本地文件到HDFS
hadoop fs -get /hdfs_file local_path   # 下载HDFS文件到本地
hadoop fs -cat /hdfs_file              # 查看文件内容
hadoop fs -tail /hdfs_file             # 查看文件尾部内容
hadoop fs -text /hdfs_file             # 查看文件内容(自动解压)
hadoop fs -cp /src /dest               # 复制文件/目录
hadoop fs -mv /src /dest               # 移动文件/目录
hadoop fs -rm /file                    # 删除文件
hadoop fs -rm -r /directory            # 递归删除目录
4. 查看目录/文件信息
bash 复制代码
hadoop fs -ls /path          # 列出目录内容
hadoop fs -ls -h /path       # 友好格式显示文件大小(KB/MB/GB)
hadoop fs -ls -R /path       # 递归列出子目录
hadoop fs -du -h /path       # 查看目录/文件占用空间
hadoop fs -stat /file        # 查看文件详细信息

二、权限管理

bash 复制代码
hadoop fs -chmod 755 /path        # 修改权限(八进制模式)
hadoop fs -chmod -R a+rwx /path   # 递归修改权限(符号模式)
hadoop fs -chown user:group /path # 修改文件所属用户和组
hadoop fs -chgrp group /path      # 修改文件所属组

三、集群管理与状态查询

bash 复制代码
hadoop fs -df -h          # 查看HDFS存储空间使用情况
hadoop fs -du -h /path    # 统计目录占用空间
hadoop fs -count /path    # 查看目录下的文件/目录数量
hadoop fsadmin -safemode enter  # 进入安全模式(管理员)
hadoop fsadmin -safemode leave  # 退出安全模式(管理员)

四、高级功能

1. 回收站操作(需开启回收站功能)
bash 复制代码
hadoop fs -rm -skipTrash /file   # 直接删除(不进入回收站)
# 默认删除操作会移动到回收站(路径:/user/${username}/.Trash)
2. 文件归档(HAR)
bash 复制代码
hadoop fs -archive -archiveName myhar.har -p /src /dest  # 创建归档文件
hadoop fs -ls har:///myhar.har   # 查看归档内容
3. 设置副本数
bash 复制代码
hadoop fs -setrep -w 2 /file   # 修改副本数为2(-w表示等待完成)

五、注意事项

  1. hadoop fs 是通用命令,兼容HDFS和其他Hadoop支持的文件系统。
  2. 删除目录时需谨慎使用 -rm -r,建议先确认路径。
  3. 安全模式操作需管理员权限。

结语

掌握这些 hadoop fs 命令是Hadoop开发与运维的基础,建议结合实践场景多操作演练。后续可深入学习HDFS架构与API开发技巧!

相关推荐
Penfy_Z1 小时前
【Python LLM 调用踩坑】Connection error 终极解决方案!npm 代理导致阿里云通义千问接口连接失败
开发语言·python·npm
暴躁小师兄数据学院3 小时前
【AI大数据工程师特训笔记】第15讲:大数据环境安装
大数据·hadoop·flink·spark
王小王-1238 小时前
基于 Hadoop + Flask 的电动汽车数据分析与可视化系统设计与实现
hadoop·数据分析·flask·电动汽车·新能源汽车数据分析·新能源汽车销量分析·新能源汽车销售分析
终将老去的穷苦程序员8 小时前
npm : 无法加载文件 C:\Program Files\nodejs\npm.ps1,因为在此系统上禁止运行脚
前端·npm·node.js
王小王-1239 小时前
基于机器学习与Hadoop的心脏病数据分析与可视化设计与实现
hadoop·机器学习·数据分析·心脏病预测
知识分享小能手9 小时前
Hadoop学习教程,从入门到精通, Hadoop 3.x 高可用集群 — 知识点详解(6)
大数据·hadoop·学习
之歆1 天前
Node.js 与 NPM 包管理完全指南
前端·npm·node.js
12点一刻1 天前
npx 使用入门教程:是什么、怎么用、和 npm 有什么区别
前端·npm·node.js
知识分享小能手1 天前
Hadoop学习教程,从入门到精通, ZooKeeper 分布式协调服务 — 全面知识点与案例代码(5)
hadoop·分布式·zookeeper
知识分享小能手2 天前
Hadoop学习教程,从入门到精通, MapReduce分布式计算框架 — 完整知识点与代码案例(4)
hadoop·学习·mapreduce