sqoop事务如何实现

qzWsong2024-01-18 8:54

场景1：如Sqoop在导出hdfs数据到Mysql时，某个字段过长导致任务失败，该错误记录之前的数据正常导入，之后的数据无法导入。如何保证错误发生后数据回滚？

场景2：如Sqoop在导出hdfs数据到Mysql时，某个字段重复导致主键冲突，该错误记录之前的数据正常导入，之后的数据无法导入。如何保证错误发生后数据回滚？

采用staging-table，临时表策略，创建一个临时表要和主表结构一致，数据为空即可，这样会先往临时表写，如果写入过程异常了就会删除临时表数据，否则合并到主表
sqoop export \

--connect jdbc:mysql://172.16.10.155:8306/dmp \

--username shurong --password Shurong@202205 --table staging \

--export-dir /warehouse/tablespace/managed/hive/staging/delta_0000001_0000001_0000 \

--columns name,age \

--input-fields-terminated-by '\001' \
--staging-table staging_tmp \
--clear-staging-table