大数据笔记之 Hadoop 常用 Shell 命令(一)

文章目录

  • 前言
  • 一、HDFS上的操作
    • [1.1 查看文件或文件夹](#1.1 查看文件或文件夹)
    • [1.2 修改文件或目录权限](#1.2 修改文件或目录权限)
    • [1.3 创建或删除文件夹](#1.3 创建或删除文件夹)
    • [1.4 移动或创建文件](#1.4 移动或创建文件)
    • [1.5 信息统计](#1.5 信息统计)
    • [1.6 设置 hdfs 中文件的副本数量](#1.6 设置 hdfs 中文件的副本数量)
  • 二、在本地上传或下载的操作
    • [2.1 从本地上传文件到HDFS](#2.1 从本地上传文件到HDFS)
    • [2.2 从HDFS下载文件到本地](#2.2 从HDFS下载文件到本地)
  • 总结

前言

前无言


一、HDFS上的操作

操作HDFS上的shell命令,与Linux命令使用方法类似

1.1 查看文件或文件夹

powershell 复制代码
# -ls 显示目录信息
hdfs dfs -ls /

# 显示文件内容
hdfs dfs -cat /tmp/k.txt

# 显示文件末尾 1kb 的数据
hdfs dfs -tail /tmp/x.txt

1.2 修改文件或目录权限

powershell 复制代码
# 修改文件或目录权限
hadoop fs -chmod 777 /a.txt

# 修改文件或目录所有者和所属的组
hadoop fs -chown hadoop:hadoop /a

# 修改文件或目录所属组
hadoop fs -chgrp hadoop /a.txt

1.3 创建或删除文件夹

powershell 复制代码
# 创建文件夹
hdfs dfs -mkdir /a

# 递归创建文件夹
hdfs dfs -mkdir -p /a/b/c

# 删除文件
hdfs dfs -rm /a/b/k.txt

# 递归删除目录及目录里的内容(慎用)
hdfs dfs -rm -r /a

1.4 移动或创建文件

powershell 复制代码
# 移动文件
hdfs dfs -mv /a/k.txt /b

# 创建文件
hdfs dfs -touch /m/w.txt

1.5 信息统计

powershell 复制代码
# 统计文件夹的大小信息
hdfs dfs -du -s -h /a
hdfs dfs -du -h /a

1.6 设置 hdfs 中文件的副本数量

powershell 复制代码
hdfs dfs -setrep 5 /a/k.txt

二、在本地上传或下载的操作

2.1 从本地上传文件到HDFS

powershell 复制代码
 # 从本地剪切粘贴到HDFS
hdfs dfs -moveFromLocal tmp.txt /tmp

# 从本地文件系统中拷贝文件到HDFS上去
hdfs dfs -copyFromLocal tmp.txt /tmp

# 从本地文件系统中拷贝文件到HDFS上去(常用)
 hdfs dfs -put tmp.txt /tmp
 
 # 追加一个文件到已经存在的文件末尾
hdfs dfs -appendToFile tmp.txt /tmp/b.txt

2.2 从HDFS下载文件到本地

powershell 复制代码
# 从HDFS拷贝到本地
hdfs dfs -copyToLocal /tmp/b.txt /home

# 等同于copyToLocal (常用)
hdfs dfs -get /tmp/b.txt /home

总结

没了。。。

相关推荐
城数派12 小时前
2001-2024年全球500米分辨率逐年土地覆盖类型栅格数据
大数据·人工智能·数据分析
Hubianji_0912 小时前
[SPIE] 2026年计算机网络、通信工程与智能系统国际学术会议 (ISCCN 2026)
大数据·人工智能·计算机网络·国际会议·论文投稿·国际期刊
触想工业平板电脑一体机12 小时前
【触想智能】工业视觉设备与工控一体机进行配套需要注意的五大事项
android·大数据·运维·电脑·智能电视
运维行者_12 小时前
跨境企业 OPM:多币种订单与物流同步管理,依靠网络自动化与 snmp 软件
大数据·运维·网络·数据库·postgresql·跨境企业
TDengine (老段)12 小时前
TDengine C/C++ 连接器入门指南
大数据·c语言·数据库·c++·物联网·时序数据库·tdengine
牛奶咖啡1312 小时前
shell脚本编程(一)
linux·shell·shell脚本·shell脚本解析·grep命令语法·grep选项详解·正则表达式解析
地球资源数据云12 小时前
2019-2024年中国逐年10米分辨率最大值合成NDVI数据集
大数据·运维·服务器·数据库·均值算法
Databend12 小时前
Databend 2025:海量数据 × AI 一体化底座,v1.3 即将发布
大数据·数据仓库
天码-行空12 小时前
【大数据环境安装指南】HBase集群环境搭建教程
大数据·linux·运维·hbase
KANGBboy13 小时前
ES 索引切换及验证
大数据·elasticsearch