Hive加密,PostgreSQL解密还原

当前公司数据平台使用的处理架构,由Hive进行大数据处理,然后将应用数据同步到PostgreSQL中做各类外围应用。由于部分数据涉及敏感信息,必须在Hive进行加密,然后在PG使用时再进行单个数据解密,并监控应用的数据调用事情。因此需要实现Hive加密到PostgreSQL解密还原的过程。在不编写UDF的情况下,有以下方法。

HIVE加密

sql 复制代码
select 
base64(aes_encrypt(敏感用户名, 'Asxdc67890gt5rf3')) 加密后用户名
from table_name

关键点解析

密码长度必须是128、192、256个字节

没有各种参数来控制加密过程

PG解密

sql 复制代码
select 

convert_from(decrypt(decode(加密后用户名,'base64'),'Asxdc67890gt5rf3','aes-ecb/pad:pkcs'),'utf8') 解密用户名

from table_name

关键参数解析

algorithm是下列之一:

bf --- Blowfish

aes --- AES (Rijndael-128, -192 或 -256)

mode是下列之一:

cbc --- 下一个块依赖前一个(默认)

ecb --- 每一个块被独立加密(只用于测试)

padding是下列之一:

pkcs --- 数据可以是任意长度(默认)

none --- 数据必须是密码块尺寸的倍数

参考资料:

Hive函数aes_encrypt、 aes_decrypt详细说明页面

[HIVE-11593] Add aes_encrypt and aes_decrypt UDFs - ASF JIRA

PostgreSQL加解密模块pgcrypto详细说明页面

http://postgres.cn/docs/14/pgcrypto.html

相关推荐
查士丁尼·绵7 小时前
hadoop集群存算分离
hive·hdfs·zookeeper·spark·hbase·yarn·galera
weixin_4572971019 小时前
Hadoop面试题
大数据·hadoop·分布式
何亚告20 小时前
记一次项目上hadoop数据迁移
大数据·hadoop·分布式
默默在路上20 小时前
apache-hive-3.1.3 show databases;报错
hive·hadoop·apache
talle202120 小时前
Hadoop分布式计算框架【MapReduce】
大数据·hadoop·mapreduce
QQ129584550420 小时前
SSAS - 步骤一:通过VS2022新建项目
数据仓库·数据分析
走遍西兰花.jpg20 小时前
Oracle,hive,gaussdb的区别
hive·oracle·gaussdb
Francek Chen1 天前
【大数据基础】大数据处理架构Hadoop:01 Hadoop概述
大数据·hadoop·分布式·架构
無森~2 天前
实战:单词数量统计案例
大数据·hadoop
梦痕长情2 天前
记一次hiveSQL 查询无数据,String类型的字段自动转化为int类型的经历和解决方案
hive