一、Who 涉及对象
- 业务操作端:考勤绩效批量修改操作流程- 系统链路:前端提交接口 → 后端业务逻辑(备注批量拼接)→ 数据库存储层- 关联配置:数据库字段约束、接口参数校验、批量业务规则配置
二、What 故障现象
考勤单批量修改多人绩效系数功能,少量人数提交正常;当批量修改人数达到100/200/300人级别时,提交直接返回500服务异常;定位发现:数据库 remark 字段固定长度上限225字符,批量操作时自动拼接的备注内容字符长度超出字段限制,触发数据库存储异常,导致接口500报错。
三、When 触发时机
- 功能在测试环境小批量操作阶段,未触发长度超限,流程正常;
- 上线生产后,执行业务超大批量百人级操作时,才触发字段长度溢出故障。
四、Where 故障发生位置
- 数据层:数据库 remark 字段长度定义为225字符,容量不足以承载大批量拼接备注;
- 代码层:后端批量修改逻辑中,自动拼接备注文案,无字符长度计算、无前置截断/校验;3. 接口层:未做批量操作人数限制、未做入参拼接长度拦截,超长数据直接透传至数据库。
五、Why 故障产生原因
- 功能设计阶段:未提前评估多人批量备注拼接后的最大字符容量,数据库字段长度预留不足;
- 程序逻辑层面:未在应用层增加拼接字符长度校验、超长容错处理,完全依赖数据库硬性约束;
- 业务规则层面:未定义该功能单次批量操作人数上限,无大数量级操作边界约束;
- 测试覆盖层面:常规功能场景可正常通过,缺少百人级超大批量边界场景的覆盖验证,未能提前暴露容量瓶颈。
六、How 处理+预防+推动体系改善
1、紧急修复How(先止血) - 临时控制:限制单次批量修改人数,减少备注拼接字符总量,规避超限;- 代码兜底:后端增加备注拼接长度实时计算,超阈值做自动截断或友好提示;- 数据层优化:评估业务长期容量,适当扩容 remark 字段长度,适配批量业务场景。 2、如何预防同类Bug再发生
- 所有带批量操作、自动拼接备注/日志的功能,用例必覆盖:少量、中量、超大批量极值场景;
- 新增/改造涉及文本存储字段,提前对齐:前端输入限制+接口校验长度+数据库字段长度三者统一;
- 纳入常规测试规范:涉及自动文本拼接逻辑,必做超长字符容量边界测试。
3、如何推动研发&流程内部改善
- 研发侧固化规范:但凡存在自动文本拼接的业务逻辑,必须增加应用层长度校验与容错处理,禁止直接抛数据库500异常;
- 需求设计规范:批量类功能必须明确单次最大可操作人数、文本字段容量规格、超长处理规则;
- 需求评审新增专项:批量操作+文本存储字段,提前评审容量、长度、边界规则,避免后期生产容量踩坑。