HDFS的超级用户

一. 解释原因

HDFS(Hadoop Distributed File System)和linux文件系统管理一样,也是存在权限控制的。

但是很不一样的是,

  • 在Linux文件系统中,超级用户Superuser是root
  • 而在HDFS中,超级用户Superuser是启动了namenode的用户,上图的node1(其实就是IP地址:192.168.88.101)中的用户hadoop就是启动了namenode的用户,所以用户hadoop为HDFS的超级用户

所以就可以解释了:root用户确实是Linux文件系统的超级用户,权限很大,但是到了HDFS中,也只是个普通用户罢了,所以权限会处处受限。所以想要获得HDFS的最高权限,就必须su - hadoop,切换成hadoop用户。

二. 解决方法

在HDFS中,使用和Linux一样的chownchomod的授权语句,给root用户授权即可。

  • 修改 文件/目录 所属的用户的和组,两句新旧版本的命令效果一样,-R表示递归授权目录下的全部子目录或者文件

  • Usage: hdfs dfs -chown [-R] [OWNER][:[GROUP]] URI [URI ]

    hadoop fs -chown [-R] root:root /xxx.txt
    hdfs fs -chown [-R] root:root /xxx.txt

  • 修改 文件/目录 的权限

  • Usage: hdfs dfs -chmod [-R] <MODE[,MODE]... | OCTALMODE> URI [URI ...]

    hadoop fs -chmod [-R] 777 /xxx.txt
    hdfs fs -chmod[-R] 777 /xxx.txt

相关推荐
武子康13 小时前
大数据-242 离线数仓 - DataX 实战:MySQL 全量/增量导入 HDFS + Hive 分区(离线数仓 ODS
大数据·后端·apache hive
SelectDB1 天前
易车 × Apache Doris:构建湖仓一体新架构,加速 AI 业务融合实践
大数据·agent·mcp
武子康2 天前
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
大数据·后端·mysql
IvanCodes2 天前
一、消息队列理论基础与Kafka架构价值解析
大数据·后端·kafka
武子康3 天前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
字节跳动数据平台4 天前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康4 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
字节跳动数据平台5 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术5 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康5 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive