引言:80 分危机,把一群程序员推上神坛
凌晨三点,老张盯着屏幕上 AI 生成的 2000 行代码,这是他改的第 47 个 bug。
AI 用一分钟写完了整个模块,他已经调了三天。
更绝望的是:每修一个 bug,AI 都能"贴心"地帮他补出三个新 bug。
这不是段子,这已经是很多开发者的日常。(我自己早怒了,,)
最近知乎上突然爆火的一个词:大模型善后工程师。

看起来有点好笑,但越想越扎心:
AI 已经能把一个项目做到 80 分了。
但真正能上线、能卖钱、没 bug 的,仍然要你 20 分来救。
而这 20 分,恰恰是最难的那部分。
更扎心的是:
从 0 → 80 分,只需要一句 prompt。
但从 80 → 100 分,需要工程师半条命。
所以这份"善后"的工作,开始变成行业刚需。
01. 大模型的"80 分幻觉":它看起来能干,但它真的不能
一句 prompt,它能给你:
- 方向对
- 代码能跑
- 结构像样
- 文案顺眼
- Demo 一键生成
你觉得卧槽厉害啊,80 分了! 但很快你会发现它的成长曲线是这样的:
越复杂 → 越玄学 越细节 → 越离谱 越真实 → 越不行
原因很简单:
- 它没有产品逻辑
- 它没有业务上下文
- 它没有边界意识
- 它没有安全意识
- 它不会思考后果,只会预测下一个 token
所以你会看到一堆"莫名其妙但看似合理"的错误:
- 漏字段、漏条件、逻辑跳步、变量改名、错误兜底消失......
- 你越让它补,它越能给你补出一个"新 bug 平行宇宙"。
新手的做法是:一句接一句喂给 AI,让 AI 修复 bug。(是不是?有时一个问题喂了一下午,AI 也没有解决)
老手的做法是:"行了行了,我自己来。"
于是,"善后工程师"诞生了。
02. AI 做到 80 分很快,但 80→100 分是地狱难度
为什么?因为 AI 不擅长"确定性"。看几个你一定遇到过的 AI 产品灾难:

1)边界没处理
用户输入异常 → 直接报错
接口没数据 → 直接挂
Token 失效 → 再见
AI 永远假设:输入是完美的,网络是稳定的,用户是理性的。
现实是:用户会输入表情包,会断网,会疯狂点击按钮。
2)异常没兜底
一个报错能把整个链路砸死。
3)安全全靠运气
XSS?SQL 注入?权限?
AI:我不知道,我只是预测文本。
4)性能烂得离谱
O(n³) 算法写得比谁都自信。
5)上下文混乱
API 字段昨晚叫 userId,今天变成 userID,明天变成 uid。
这些东西,AI 永远不会主动告诉你。
于是,你必须"善后"。
03. Agent 两大派系:为什么有的能落地,有的永远只能 PPT?
Agent 现在分两派:
A. 工作流型 Agent ------ 现实可用,能规模化落地
它有 SOP(标准流程):
输入 → 处理 → 输出
边界明确,有轨道可跑。 可靠、可监控、结果可控。
适用场景:
- 客服机器人(固定问答流程)
- 代码审查(检查清单明确)
- 数据处理(ETL 流程标准化)
- 文档生成(模板 + 规则)
为什么能落地? 因为可靠性 > 灵活性。
所以大厂能用的,都是这种。
B. 自主型 Agent ------ 自由灵魂,现实灾难

目标模糊、行为难控、结果不可复现。今天帮你干活,明天给你整活。
适合展示,但绝不适合生产。现实问题:
- 今天帮你发邮件,明天给老板发了辞职信
- 今天帮你买东西,明天把你银行卡刷爆
- 今天帮你整理文件,明天把重要文档删了
核心原因:自由度越大,不确定性越大,风险越高。
这也是为什么创业公司喜欢吹自主 Agent,而工程团队只做工作流 Agent。
04. 为什么"善后工程师"是 AI 产品落地的关键?

因为真正的产品,不是能跑就算结束。是能:
- 持续跑
- 正确跑
- 安全跑
- 高性能跑
- 在各种诡异边界下依然跑
这些,统统需要人类开发者介入。
善后工程师究竟在干什么? 一句话:
把一个"看上去能用"的 AI 产物,变成"真的能上生产"的产品。
细化下来就是:
① 校对
检查 AI 生成物的逻辑漏洞:
- 分支有没有漏?
- 字段是不是一致?
- 状态是否可能错乱?
- 异常是否处理?
举例:
js
// AI 生成的登录逻辑:
if (password === user.password) {
login()
}
// 善后工程师补全:
if (!user) return { error: '用户不存在' }
if (!password) return { error: '密码不能为空' }
if (user.status === 'banned') return { error: '账号已封禁' }
if (user.loginAttempts > 5) return { error: '登录次数过多' }
if (await bcrypt.compare(password, user.passwordHash)) {
await resetLoginAttempts(user.id)
return login(user)
} else {
await incrementLoginAttempts(user.id)
return { error: '密码错误' }
}
② 重构
让 AI 代码变得可维护:
- 模块化
- 类型补全
- 结构优化
- 单测补齐
- 性能调优
比如说:AI 生成的"一锅乱炖"代码 → 善后工程师改成清晰的分层架构。
③ 打磨(很重要)
让产品真正能上线:
- 边界处理
- 异常兜底
- 安全策略
- 监控报警
- 性能提升
- 体验优化
这些才是决定产品能不能上线、能不能赚钱的部分。
05. 真相:AI 不是在替代工程师,而是在淘汰"只会写代码的工程师"

AI 做了工程师过去 60%~80% 的"体力活"。
但剩下的 20%,是「经验 + 思考 + 判断 + 产品理解」。
过去:
- 工程师负责 0→100
现在:
- AI 负责 0→80
- 工程师负责最难的 80→100
这个 20%,决定了:
- 产品能不能上线
- 用户会不会崩
- 公司能不能卖钱
- 项目会不会翻车
所以,"善后工程师"不是低端岗位,而是价值更高的岗位。
真正被 AI 取代的,是那些:
- 跟着教程敲
- 不懂架构
- 不看边界
- 不做兜底
- 不懂产品逻辑
- 不理解业务场景
的 30 分工程师。
总结
目前来看,真正 AGI 到来之前,未来的软件开发将分成两类:
- AI 写的:快、便宜、能跑
- 工程师修的:稳、能上线、能赚钱
"善后工程师"的价值在于:
不是写代码,而是把错误的地方修对,把不可靠的地方补稳,把模糊的部分变清晰。
这才是 AI 时代真正的核心竞争力。你认为呢?