通宵修bug

前两个月的某天凌晨,我司全新的一个营销工具,在全国如期上线。然而整个发布过程并非一帆风顺,在线上环境全量发布后,有同事观测到他所负责模块的监控曲线有异常!监控曲线在发布的时刻近乎于直线下跌。

经过初步排查,故障影响是:一部分新用户无法使用营销优惠~ 影响面非常大,所幸在凌晨的业务低峰期,实际影响有限,但是需要快速修复!不然等天亮用户请求量上来了,故障影响和定级就更大了!

目前接近凌晨4 点,时间很紧张!虽然这部分内容并非我负责,但我是当天的现场值班人,必须上!肝!

屎海无涯

我喝了一口红牛,打开电脑就扎进了陌生代码的汪洋大海中......

看着看着,我察觉到味道不对劲。我觉得这部分代码不是汪洋大海,而是一片屎海...... 代码堆砌如屎山,单个方法竟超过500行;嵌套的if else结构深不可测;日志更是完全缺失;职责不但不单一,反而极度混乱。总之,整个代码简直如同一团乱麻,排查难度极大。

四五个同事一起在排查代码,虽然他们负责过这部分代码,但是大家都十分挠头,找不到 bug 在哪。

当局者迷,旁观者清。经过了30分钟的细致分析,终于,我率先找到了 bug 原因。激动地心颤抖的手,我开了 5 分钟的 bug 发布会,通报了 bug 根因和修复方案。

破案了!

确定 bug 根因后,其他人默默去休息了......

接下来我负责修 bug、测试、打包、发版、验证...... 不知不觉,天空破晓,一直搞到早上 8 点多...... 在线上完成验证,监控曲线恢复正常!bug 修复完成!

bug根因

由于公司代码保密,所以我使用伪代码解释。

业务逻辑是遍历所有的优惠活动,若任意一个优惠活动需要限制新用户使用,那么就需要去查询当前用户是否新用户。

bug 代码如下! (实际的屎山代码,比这部分代码要复杂得多!)

相关推荐
东方不败之鸭梨的测试笔记2 小时前
20250605车充安服务器受木马攻击导致服务不可用
bug
Htht1113 小时前
【Qt】之【Get√】【Bug】通过值捕获(或 const 引用捕获)传进 lambda,会默认复制成 const
数据库·bug
前端发现6 小时前
如何用 pnpm patch 给 element-plus 打补丁修复线上 bug(以 2.4.4 修复 PR#15197 为例)
bug
可乐鸡翅好好吃1 天前
通过BUG(prvIdleTask、pxTasksWaitingTerminatio不断跳转问题)了解空闲函数(prvIdleTask)和TCB
c语言·stm32·单片机·嵌入式硬件·bug·keil
神膘护体小月半1 天前
bug 记录 - 使用 el-dialog 的 before-close 的坑
前端·javascript·bug
顽强d石头1 天前
bug:undefined is not iterable (cannot read property Symbol(Symbol.iterator))
前端·bug
阿松のblog2 天前
opencv使用经典bug
人工智能·opencv·bug
学习啷个办2 天前
centos挂载目录满但实际未满引发系统宕机
bug
我们的五年4 天前
【Qt】Bug:findChildren找不到控件
开发语言·qt·bug
seiyaaa4 天前
Claude Opus solved my white whale bug today that I couldn‘t find in 4 years
bug