HDFS的Shell操作及客户端配置方法

HDFS进程启停命令

Hadoop HDFS组件内置了HDFS集群的一键启停脚本。

  • $HADOOP_HOME/sbin/start-dfs.sh,一键启动HDFS集群
  • $HADOOP_HOME/sbin/stop-dfs.sh,一键关闭HDFS集群
    执行原理:
  1. 在执行此脚本的机器上,启动(关闭)SecondaryNameNode
  2. 读取core-site.xml内容(fs.defaultFS项),确认NameNode所在机器,启动(关闭)NameNode
  3. 读取workers内容,确认DataNode所在机器,启动(关闭)全部DataNode

除了一键启停外,也可以单独控制进程的启停

  • $HADOOP_HOME/sbin/hadoop-daemon.sh,此脚本可以单独控制所在机器的进程的启停
    用法:hadoop-daemon.sh (start|status|stop) (namenode|secondarynamenode|datanode)
  • $HADOOP_HOME/bin/hdfs,此程序也可以用以单独控制所在机器的进程的启停
    用法:hdfs --daemon (start|status|stop) (namenode|secondarynamenode|datanode)

HDFS文件系统基本命令(跟Linux命令基本一样)

  • hadoop命令(老版本用法),用法:hadoop fs [generic options]
  • hdfs命令(新版本用法),用法:hdfs dfs [generic options]
  1. 创建文件夹 (mkdir)
    hadoop fs -mkdir [-p] <path>
    hdfs dfs -mkdir [-p] <path>

    hadoop fs -mkdir -p /itest

    hdfs dfs -mkdir -p /itest

  2. 上传文件到HDFS指定目录下(上传put,下载 get)
    hadoop fs -put [-f] [-p] <localsrc> ... <dst>
    hdfs dfs -put [-f] [-p] <localsrc> ... <dst>

    hadoop fs -put test.txt /itest

    hdfs dfs -put test.txt /itest

  3. 追加数据到HDFS文件中(appendToFile)
    hadoop fs -appendToFile <localsrc> ... <dst>
    hdfs dfs -appendToFile <localsrc> ... <dst>

    hadoop fs -appendToFile 2.txt 3.txt /itest/1.txt

    hdfs dfs -appendToFile 2.txt 3.txt /itest/1.txt

  4. HDFS数据删除操作(rm,skipTrash跳过回收站)
    hadoop fs -rm -r [-skipTrash] URI [URI ...]
    hdfs dfs -rm -r [-skipTrash] URI [URI ...]

    hadoop fs -rm -r -skipTrash /itest

    hdfs dfs -rm -r -skipTrash /itest

  5. HDFS shell其它命令(点此参照官方文档

  6. HDFS WEB浏览

    使用WEB浏览操作文件系统,一般会遇到权限问题

    这是因为WEB浏览器中是以匿名用户(dr.who)登陆的,其只有只读权限,多数操作是做不了的。
    如果需要以特权用户在浏览器中进行操作,需要配置如下内容到core-site.xml并重启集群

    <property> <name>hadoop.http.staticuser.user</name> <value>hadoop</value> </property>

== 注意:不推荐这样做 ==

HDFS WEBUI,只读权限挺好的,简单浏览即可

如果给与高权限,会有很大的安全问题,造成数据泄露或丢失

Big Data Tools插件

1、插件安装

在Jetbrains的产品中,均可以安装插件,其中:Big Data Tools插件可以帮助我们方便的操作HDFS,以下均支持Bigdata Tool插件,如

  • IntelliJ IDEA(Java IDE)
  • PyCharm(Python IDE)
  • DataGrip(SQL IDE)
    如图,在设置->Plugins(插件)-> Marketplace(市场),搜索Big Data Tools,点击Install安装即可

2、配置Windows

需要对Windows系统做一些基础设置,配合插件使用

  • 解压Hadoop安装包到Windows系统,如解压到:E:\hadoop-3.3.4
  • 设置$HADOOP_HOME环境变量指向:E:\hadoop-3.3.4
  • 下载 hadoop.dll 点此官网下载 和 winutils.exe 点此官网下载
    将hadoop.dll和winutils.exe放入$HADOOP_HOME/bin中
  • 然后打开插件,如下图


    至此,HDFS的Shell操作及客户端配置方法结束!!
相关推荐
小信丶13 小时前
解决 pnpm dev 报错:系统禁止运行脚本的问题
前端·vue.js·windows·npm
小邋遢2.015 小时前
vscod 执行npm build报错:Error: Cannot find module ‘vite‘
前端·npm·node.js
爱吃大芒果17 小时前
Flutter 本地存储方案:SharedPreferences、SQFlite 与 Hive
开发语言·javascript·hive·hadoop·flutter·华为·harmonyos
孟陬17 小时前
2025-12-11 之后前端 npm 如何发包 How to Publish NPM Package in Year 2025
npm·node.js·bun
shjita19 小时前
hadoop运行jar包的相关配置参考!
大数据·hadoop·分布式
yumgpkpm19 小时前
AI大模型手机的“简单替换陷阱”与Hadoop、Cloudera CDP 7大数据底座的关系探析
大数据·人工智能·hadoop·华为·spark·kafka·cloudera
yumgpkpm19 小时前
Cloudera CDP 7.3下载地址、方式,开源适配 CMP 7.3(或类 CDP 的 CMP 7.13 平台,如华为鲲鹏 ARM 版)值得推荐
大数据·hive·hadoop·分布式·华为·开源·cloudera
吴敬悦1 天前
私有的 GitHub Package 怎么拉取?
npm·github
前端郭德纲2 天前
React 19.2 已发布,现已上线 npm!
前端·react.js·npm
LYFlied2 天前
【一句话概括】前端项目包管理器怎么选?
前端·npm·pnpm·yarn