kafka数据异常记录

由于公司使用英方同步工具:

Oracle --> Oracle

Oracle --> Kafka

MySQL -->Kafka --> Oracle

其中 第一个链路最稳定,同步到kafka的数据偶尔会出问题。

bash 复制代码
{
  "owner": "mydb",
  "op": 2,
  "actseq": 431649,
  "before": {},
  "sdbtype": "mysql",
  "scntime": 1771905611,
  "sync": "1",
  "optype": "UPDATE",
  "xid": null,
  "before_key": {},
  "name": "table_1",
  "after_key": {},
  "jstime": 1771905621804000,
  "after": {},
  "scn": "mysqlbin.017660:0000000302307202;41399260"
}

上面是kafka中发现的一条数据:其中before和after都是空,导致写入snap表中数据都是null。

解决方案:

(1)英方软件bug问题,升级新版本

(2)修改写入snap脚本,过滤掉before和after都是空的数据

相关推荐
阿里云云原生18 小时前
数据链路再精简:Kafka 如何做到“零 ETL”一键写入 Apache Iceberg?
kafka
阿里云云原生7 天前
告别冗长链路!Kafka × Table Bucket 实现开放表格式零 ETL 实时入湖
云原生·kafka
风吹夏回13 天前
RabbitMQ 核心术语 + Python pika 方法完整讲解
分布式·python·rabbitmq
风吹夏回13 天前
RabbitMQ 三种模式入门:HelloWorld、WorkQueue、PubSub
分布式·rabbitmq·ruby
霸道流氓气质13 天前
分布式追踪与 RequestId 传播完全指南
分布式
cheems952713 天前
[RabbitMQ高级特性] 消息确认机制:从 Ready / Unacked 到 basicAck、basicReject、basicNack 的底层拆解
分布式·rabbitmq·ruby
whaledown13 天前
Kafka 与 Java 消息队列入门:用订单场景理解核心机制
java·kafka·消息队列·springboot
枫华落尽13 天前
【Hadoop01-完全分布式运行模式】
分布式
隔壁阿布都13 天前
ShedLock 分布式定时任务锁框架介绍
spring boot·分布式
文艺倾年13 天前
【强化学习】数学推导专题,20W字总结(十五)
人工智能·分布式·大模型·强化学习·vibecoding