通宵修bug

前两个月的某天凌晨,我司全新的一个营销工具,在全国如期上线。然而整个发布过程并非一帆风顺,在线上环境全量发布后,有同事观测到他所负责模块的监控曲线有异常!监控曲线在发布的时刻近乎于直线下跌。

经过初步排查,故障影响是:一部分新用户无法使用营销优惠~ 影响面非常大,所幸在凌晨的业务低峰期,实际影响有限,但是需要快速修复!不然等天亮用户请求量上来了,故障影响和定级就更大了!

目前接近凌晨4 点,时间很紧张!虽然这部分内容并非我负责,但我是当天的现场值班人,必须上!肝!

屎海无涯

我喝了一口红牛,打开电脑就扎进了陌生代码的汪洋大海中......

看着看着,我察觉到味道不对劲。我觉得这部分代码不是汪洋大海,而是一片屎海...... 代码堆砌如屎山,单个方法竟超过500行;嵌套的if else结构深不可测;日志更是完全缺失;职责不但不单一,反而极度混乱。总之,整个代码简直如同一团乱麻,排查难度极大。

四五个同事一起在排查代码,虽然他们负责过这部分代码,但是大家都十分挠头,找不到 bug 在哪。

当局者迷,旁观者清。经过了30分钟的细致分析,终于,我率先找到了 bug 原因。激动地心颤抖的手,我开了 5 分钟的 bug 发布会,通报了 bug 根因和修复方案。

破案了!

确定 bug 根因后,其他人默默去休息了......

接下来我负责修 bug、测试、打包、发版、验证...... 不知不觉,天空破晓,一直搞到早上 8 点多...... 在线上完成验证,监控曲线恢复正常!bug 修复完成!

bug根因

由于公司代码保密,所以我使用伪代码解释。

业务逻辑是遍历所有的优惠活动,若任意一个优惠活动需要限制新用户使用,那么就需要去查询当前用户是否新用户。

bug 代码如下! (实际的屎山代码,比这部分代码要复杂得多!)

相关推荐
永康李6 小时前
Pandas:从一个DataFrame中直接索引赋值到另一个索引位置出错的Bug及其解决方案
python·bug·pandas
NPE~6 小时前
Bug:Goland debug失效详细解决步骤【合集】
go·bug·goland·dlv失效
Urf_read18 小时前
改BUG:远程连接redis失败,可能是防火墙的问题
java·redis·python·bug
Tlog嵌入式2 天前
单片机常见bug记录(长期更新)
单片机·嵌入式硬件·bug
会发光的猪。4 天前
el-input无法输入0.0001的小数,自动转换为0在vue3中的bug
前端·javascript·vue.js·elementui·bug
shandianchengzi4 天前
【BUG】LLM|Ubuntu 用 ollama 部署 DeepSeek 但没输出,llama 有输出
ubuntu·llm·bug·llama·ollama·deepseek
抽象具象化4 天前
Bug日记:Linux中systemctl restart network失败问题,网络故障
linux·运维·bug
王天华帅哥4 天前
day3 改bug
bug
吉凶以情迁5 天前
lua的local 变量和self 变量的理解理解后解决自己写的bug.
开发语言·bug·lua
qq_527887875 天前
【已解决】TypeError: AsyncConnectionPool.__init__(), new install bug, httpx==0.24.1
bug·httpx