给DataX配置加密的方法

给DataX配置加密的方法

前言

在生产环境中使用DataX,往往在json配置文件中需要用到数据库的账号信息,这是非常不安全的。好在DataX自带的功能支持对敏感信息加密解密,达到对配置文件信息脱敏的效果。

生成公钥和私钥

以下使用DataX源码的SecretUtil工具类,生成密钥对,并使用公钥对字符串123进行加密,得到加密字符串,再对加密字符串使用私钥解密,最终还原成123的过程。

java 复制代码
public static void main(String[] args) throws Exception {
    // 获取公钥与私钥
    String[] keys = SecretUtil.initKey();
    String publicKey = keys[0];
    String privateKey = keys[1];
    System.out.println("publicKey = " + publicKey);
    System.out.println("privateKey = " + privateKey);

    // 通过公钥加密
    String encryptData = SecretUtil.encryptRSA("123", publicKey);
    System.out.println("encryptData = " + encryptData);

    // 通过私钥解密
    String decryptData = SecretUtil.decryptRSA(encryptData, privateKey);
    System.out.println("decryptData = " + decryptData);
}

修改密钥配置

修改.secret.properties 配置文件,它在$DATAX_HOME\conf 目录下

bash 复制代码
#ds basicAuth config
auth.user=
auth.pass=
current.keyVersion=v1
current.publicKey=sfwjwwrjwejrwelththwt
current.privateKey=543l5j34lkj53l4kj5kl3
current.service.username=
current.service.password=

修改以下配置:

  • current.keyVersion 该配置可自定义,用于后面DataXjson配置中使用;
  • current.publicKey 该配置为公钥,用来对敏感信息做加密;
  • current.privateKey 该配置为私钥,用来对敏感信息做解密;

DataX配置中应用

如以下配置示例,主要做了几下改动:

  • job节点添加keyVersion配置项,值取自上一步的配置current.keyVersion中的值
  • 在需要脱敏的配置的key前面加上一个*,如"*username"、"*password"
  • 修改*开头的配置的取值,由明文改为密文,密文是由第一步的main方法生成而来
json 复制代码
{
  "job": {
    "setting": {
      "speed": {
        "channel": 3
      },
      "errorLimit": {
        "record": 0,
        "percentage": 0.02
      },
	    "keyVersion": "v1"
    },
    "content": [
      {
        "reader": {
          "name": "mysqlreader",
          "parameter": {
            "*username": "a2KMPlT1nSUJx",
            "*password": "b1VFs5VzcW4V0Cnyb",
            // 省略
          }
        },
        "writer": {
          // 省略
        }
      }
    ]
  }
}

执行DataX任务,在打印日志中能看到username解密成功,password因为是敏感信息所以用***代替。

参考

异构数据源数据同步 → 从源码分析 DataX 敏感信息的加解密-腾讯云开发者社区-腾讯云

相关推荐
虹科网络安全26 分钟前
艾体宝干货|数据复制详解:类型、原理与适用场景
java·开发语言·数据库
2301_771717211 小时前
解决mysql报错:1406, Data too long for column
android·数据库·mysql
uzong1 小时前
9 种 RAG 架构,每位 AI 开发者必学:完整实战指南
后端
小江的记录本1 小时前
【Kafka核心】架构模型:Producer、Broker、Consumer、Consumer Group、Topic、Partition、Replica
java·数据库·分布式·后端·搜索引擎·架构·kafka
dvjr cloi1 小时前
MySQL Workbench菜单汉化为中文
android·数据库·mysql
止语Lab1 小时前
从手动到框架:Go DI 演进的三个拐点
开发语言·后端·golang
dFObBIMmai2 小时前
MySQL主从同步中大事务导致的延迟_如何拆分大事务优化同步
jvm·数据库·python
szccyw02 小时前
mysql如何限制特定存储过程执行权限_MySQL存储过程安全访问
jvm·数据库·python
一切皆是因缘际会2 小时前
AI数字分身的底层原理:破解意识、自我与人格复刻的核心难题
大数据·人工智能·ai·架构
上海光华专利事务所2 小时前
跨境电商商标专利管理平台
大数据·产品运营