DataX 本地调试配置

简要说明

根据自己的开发需求,完成了reader、writer、transformer开发后,在ide内通过Engine入口,调试自己的插件和job的json。

前置条件

已在系统安装了datax,本例子是在windows环境下,安装包地址https://github.com/alibaba/DataX 下,安装流程可参考其他博客。基本步骤:下载 -> 解压 -> ide打开项目 -> maven编译:mvn -U clean package assembly:assembly -Dmaven.test.skip=true(注意maven版本最好在3.6.x,我用过3.9.x会无法编译成功,assembly插件的问题)

步骤

1.下载DataX的源码

在github中,搜索datax进行下载,解压,并用idea打开

2.编写好插件和job.jsom

比如我本地的字段选择插件:

上图只展示transformer,其他内容自行完善,然后记得在TransformerRegistry类进行注册:

2.配置Engine类的启动环境参数

1)-Ddatax.home=D:/datax 是 VM options 参数,D:/datax 安装的目录

2)-job d:/datax/job/mysql2mysql.json -jobid -1 -mode standalone

其中 d:/datax/job/mysql2mysql.json 是你的任务的json,-1 是本地调试的任务id,模式也是固定的 standalone

3)D:\workspace\DataX-master 是你的datax源码解压后的地方

3.启动

找到Engine类的main方法

启动后,即可在需要的地方打点debug。

相关推荐
cxyxiaokui00126 分钟前
线程池的“变形记”:核心线程数居然能随时变大变小?
java·面试
灵魂猎手33 分钟前
11. Mybatis SQL解析源码分析
java·后端·源码
努力的小郑1 小时前
别再说你会 new Object() 了!JVM 类加载的真相,绝对和你想的不一样
java·jvm·面试
cxyxiaokui0011 小时前
论如何优雅地让AI“闭嘴”:深入SpringAI的流式停止与记忆难题
java·后端
嗝屁小孩纸1 小时前
使用EasyExcel自定义导出表格
java·excel
the beard2 小时前
深入理解Java多线程:状态、安全、同步与通信
java·开发语言
pengzhuofan2 小时前
Java设计模式-享元模式
java·设计模式·享元模式
灵魂猎手2 小时前
10. Mybatis XML配置到SQL的转换之旅
java·后端·源码
掉鱼的猫2 小时前
10分钟带你体验 Solon 的状态机
java
皮皮林5512 小时前
从一个程序员的角度告诉你:“12306”有多牛逼?
java