【复盘】记录一次类型不一致导致的Kafka消费异常问题

背景

业务主要是通过A系统向B系统写入Kafka,然后B系统消费Kafka 将结果写到Kafka中,A进行消费最终结果。

在整个流程中,A写入Kafka会写入一张 record1表记录,然后在A消费最终结果的时候也记录一张record2表。主要改动的话 只是B系统内进行写入数据,但是没有想到用的同一个Map导致前后的一个变量值String类型转换成Integer类型。导致下游系统解析错误。由于上线后没有感觉会影响到这块,所以差不多3 4个小时后才发现,所以造成比较大的影响。

事故

补救措施:由于日志中有最终消费结果,所以从日志中拉取到最终的结果,然后在生产机器上进行重新推送这波数据。

总结

事前:对于需求 可能的难点 有问题的地方需要全方位的考虑清楚。最笨的方法就是一个案例一个案例过一遍整体的流程。

事中:上线后需要及时观察总体的数据,不能只看改动的地方,这样即使出现问题后,也可以在短时间内找到问题,然后解决,将故障时间缩小到最小范围。

事后:出现问题后,需要及时复盘,影响已经造成 可以从中吸取到一定的教训。

相关推荐
小股虫9 小时前
主流注册中心技术选型:CAP理论与业务实战的平衡艺术
分布式·微服务·架构
少许极端10 小时前
Redis入门指南(五):从零到分布式缓存-其他类型及Java客户端操作redis
java·redis·分布式·缓存
Keep_Trying_Go12 小时前
accelerate 深度学习分布式训练库的使用详细介绍(单卡/多卡分布式训练)
人工智能·pytorch·分布式·深度学习
数据库知识分享者小北13 小时前
免费体验《自建 MySQL 迁移至 PolarDB 分布式 V2.0》
数据库·分布式·mysql·阿里云·云原生·polardb
ZePingPingZe13 小时前
@TransactionalEventListener:事务事件监听的艺术
分布式·spring·rabbitmq
回家路上绕了弯14 小时前
日志输出优化实战:从“能用”到“好用”的全攻略
分布式·后端
十月南城15 小时前
分布式事务方法论——2PC/TCC/SAGA与基于消息的最终一致性对照
分布式
笃行客从不躺平16 小时前
分布式中的CAP 复习
分布式
记得开心一点嘛16 小时前
分布式ID生成器
分布式
bkspiderx17 小时前
RabbitMQ 全面技术指南
分布式·消息队列·rabbitmq