给DataX配置加密的方法

给DataX配置加密的方法

前言

在生产环境中使用DataX,往往在json配置文件中需要用到数据库的账号信息,这是非常不安全的。好在DataX自带的功能支持对敏感信息加密解密,达到对配置文件信息脱敏的效果。

生成公钥和私钥

以下使用DataX源码的SecretUtil工具类,生成密钥对,并使用公钥对字符串123进行加密,得到加密字符串,再对加密字符串使用私钥解密,最终还原成123的过程。

java 复制代码
public static void main(String[] args) throws Exception {
    // 获取公钥与私钥
    String[] keys = SecretUtil.initKey();
    String publicKey = keys[0];
    String privateKey = keys[1];
    System.out.println("publicKey = " + publicKey);
    System.out.println("privateKey = " + privateKey);

    // 通过公钥加密
    String encryptData = SecretUtil.encryptRSA("123", publicKey);
    System.out.println("encryptData = " + encryptData);

    // 通过私钥解密
    String decryptData = SecretUtil.decryptRSA(encryptData, privateKey);
    System.out.println("decryptData = " + decryptData);
}

修改密钥配置

修改.secret.properties 配置文件,它在$DATAX_HOME\conf 目录下

bash 复制代码
#ds basicAuth config
auth.user=
auth.pass=
current.keyVersion=v1
current.publicKey=sfwjwwrjwejrwelththwt
current.privateKey=543l5j34lkj53l4kj5kl3
current.service.username=
current.service.password=

修改以下配置:

  • current.keyVersion 该配置可自定义,用于后面DataXjson配置中使用;
  • current.publicKey 该配置为公钥,用来对敏感信息做加密;
  • current.privateKey 该配置为私钥,用来对敏感信息做解密;

DataX配置中应用

如以下配置示例,主要做了几下改动:

  • job节点添加keyVersion配置项,值取自上一步的配置current.keyVersion中的值
  • 在需要脱敏的配置的key前面加上一个*,如"*username"、"*password"
  • 修改*开头的配置的取值,由明文改为密文,密文是由第一步的main方法生成而来
json 复制代码
{
  "job": {
    "setting": {
      "speed": {
        "channel": 3
      },
      "errorLimit": {
        "record": 0,
        "percentage": 0.02
      },
	    "keyVersion": "v1"
    },
    "content": [
      {
        "reader": {
          "name": "mysqlreader",
          "parameter": {
            "*username": "a2KMPlT1nSUJx",
            "*password": "b1VFs5VzcW4V0Cnyb",
            // 省略
          }
        },
        "writer": {
          // 省略
        }
      }
    ]
  }
}

执行DataX任务,在打印日志中能看到username解密成功,password因为是敏感信息所以用***代替。

参考

异构数据源数据同步 → 从源码分析 DataX 敏感信息的加解密-腾讯云开发者社区-腾讯云

相关推荐
xushichao1989几秒前
实战:用OpenCV和Python进行人脸识别
jvm·数据库·python
树獭叔叔5 分钟前
GRPO:比PPO更简单的RLHF算法
后端·aigc·openai
shelter6 分钟前
并发操作session对象导致登录闪退问题
后端
sthnyph13 分钟前
初识MySQL · 库的操作
数据库·mysql
原来是猿13 分钟前
MySQL【视图】
数据库·mysql
兆子龙16 分钟前
TypeScript高级类型编程:从入门到精通
前端·后端
IT_陈寒25 分钟前
Python开发者的效率革命:这5个技巧让你的代码提速50%!
前端·人工智能·后端
2401_8735878238 分钟前
MySQL——事务管理
数据库·mysql
探索宇宙真理.38 分钟前
SiYuan SQL漏洞 | CVE-2026-29073复现&研究
数据库·经验分享·sql·eureka·安全漏洞·siyuan
2501_9454235439 分钟前
工具、测试与部署
jvm·数据库·python