【Ambari】Ranger KMS

目录

[一、Ranger KMS介绍](#一、Ranger KMS介绍)

二、KMS基于Ranger插件安装


一、Ranger KMS介绍


Ranger KMS是把数据存储入后台数据库中。通过Ranger Admin可以集中化管理KMS服务。

Ranger KMS有三个优点

  • l Key management
    Ranger admin 提供了创建,更新,删除密钥的Web UI 和APIs。在调试API的时候需要提供Ranger admin的用用户名和密码。
  • l Access control policies
    通过Ranger Admin可以对KMS进行访问控制,通过设置访问策略来限制用户访问。
  • l Audit
    Ranger Admin可以跟踪访问输出审计日志。

二、KMS基于Ranger插件安装


创建rangerkms库

sql 复制代码
CREATE DATABASE rangerkms DEFAULT CHARACTER SET utf8;
CREATE USER 'rangerkms'@'localhost' IDENTIFIED BY 'Winner@123456';
GRANT ALL PRIVILEGES ON *.* TO 'rangerkms'@'localhost';
CREATE USER 'rangerkms'@'%' IDENTIFIED BY 'Winner@123456';
GRANT ALL PRIVILEGES ON *.* TO 'rangerkms'@'%';
GRANT ALL PRIVILEGES ON *.* TO 'rangerkms'@'localhost' WITH GRANT OPTION;
GRANT ALL PRIVILEGES ON *.* TO 'rangerkms'@'%' WITH GRANT OPTION;
FLUSH PRIVILEGES;

选择 Ranger KMS安装

配置和测试数据库连接

数据库测试通过

安装

安装完成

可以看到服务启动完成

添加测试用户winner_spark 的HDFS权限

"winner_kms"策略中配置winner_spark用户操作HDFS的权限

使用keyadmin 用户登录ranger ,选择"Access Manger"

Add New policy

创建名为"winner_kms_key"的kms 策略,并选择用户为 "winner_spark"

"winner_kms_key"策略添加完成

Encryption中选择"winner_kms"服务,选择 "Add New Key"

Key Name: WINNER ,其他的参数我们采用默认,然后保存。

命令行查看key 的元数据信息

hdfs crypto 命令是Hadoop分布式文件系统(HDFS)中用于管理和操作加密区域(Encryption Zones, EZs)的工具。它允许用户创建、列出和管理加密区域,以及处理与加密相关的其他任务。如下是命令语法:

复制代码
# 使用key创建加密分区
hadoop key list -metadata
# 创建
hdfs dfs -mkdir /encry_zone
# 创建加密区域
hdfs crypto -createZone -keyName winner -path /encry_zone
# 列出HDFS中所有的加密区域
hdfs crypto -listZones

使用 winner_spark用户上传和下载文件到加密分区

复制代码
echo "hello hadoop" > hello.txt
hdfs dfs -put hello.txt /tmp/
hdfs dfs -put hello.txt /encry_zone
hdfs fsck /encry_zone  -files -blocks -locations -replicaDetails #查找实际磁盘存储地址

如下我们用hdfs直接查看文件未授权,切换到 winner_spark用户可正常查看加密分区数据。

参考文章:Ranger集成KMS服务:Ranger集成KMS服务 - 简书

相关推荐
£菜鸟也有梦21 小时前
Hive进阶之路
大数据·数据仓库·hive·hadoop
Microsoft Word21 小时前
Servlet
hive·hadoop·servlet
逆袭的小学生1 天前
Hadoop 1.x设计理念解析
大数据·hadoop·分布式
酷爱码2 天前
hadoop存储数据文件原理
大数据·hadoop·分布式
IT成长日记2 天前
【Hive入门】Hive性能调优之资源配置:深入解析执行引擎参数调优
数据仓库·hive·hadoop·资源配置
猪猪果泡酒2 天前
Spark和hadoop的区别与联系
大数据·hadoop·spark
IT成长日记2 天前
【Hive入门】Hive性能调优之Join优化:深入解析MapJoin与Sort-Merge Join策略
数据仓库·hive·hadoop·join优化·mapjoin·sort-merge join
程序员阿龙3 天前
【精选】基于数据挖掘的广州招聘可视化分析系统(大数据组件+Spark+Hive+MySQL+AI智能云+DeepSeek人工智能+深度学习之LSTM算法)
大数据·人工智能·hadoop·数据挖掘·spark·数据分析与可视化·用户兴趣分析
IT成长日记3 天前
【Hive入门】Hive高级特性:视图与物化视图
数据仓库·hive·hadoop·视图与物化视图
hnlucky3 天前
Hadoop 单机模式(Standalone Mode)部署与 WordCount 测试
大数据·数据库·hadoop·分布式·缓存