AI抢工作这笔账终于有人认真算了
最近聊 AI 对工作的影响,最别扭的地方不是观点不够多,而是观点太多、证据太少。有人说大模型会让白领大失业,也有人说它只是新的 Excel。两边都能讲得很顺,但真到团队里做预算、改岗位、配培训,大家手里其实没几张能落地的表。
OpenAI 6 月 8 日推出了 Economic Research Exchange,想把研究者、企业和公共机构拉到一起,研究 AI 对岗位、生产率和经济结构的影响。只看标题,它像一个偏宏观的研究项目;我更关心的是,它会不会把"AI 到底改变了什么工作"这件事,从情绪判断拉回可测量问题。
看完这篇你能知道:
- 这件事为什么不只是 OpenAI 做公关
- AI 影响工作时,真正该量化的不是"替代率"
- 如果你是开发者或团队负责人,明天能先记录哪些指标
真问题不是会不会替代人
OpenAI 官方摘要说,这个 Exchange 会围绕 AI 对就业、生产率和经济的影响做研究,并开放申请,选择一批研究项目参与。
事实就这么多。我没有看到完整项目清单,也没有看到最终研究方法,所以这里不装成已经读完报告。我的判断只基于公开信息:OpenAI 需要一套更可信的外部研究机制,来回答企业、监管者和普通劳动者都在问的问题。
但"AI 会不会替代人"这个问法太粗了。
真实世界里,工作不是一个整体。一个岗位通常由很多任务拼起来:写文档、查资料、开会、写代码、对齐需求、做决策、背责任。AI 可能替代其中 30% 的任务,但剩下 70% 反而变得更重要。
我会先把问题拆成三层:
| 层级 | 错误问法 | 更该问什么 |
|---|---|---|
| 岗位 | 这个职业会不会消失 | 哪些任务会被压缩 |
| 团队 | 要不要少招人 | 交付瓶颈是不是变了 |
| 个人 | AI 会不会抢我饭碗 | 我的判断力有没有被放大 |
如果只盯"岗位替代率",很容易得出吓人的结论;如果拆到任务层,你会发现更有用的问题是:哪些工作从 2 小时变 20 分钟,哪些工作从来就不是靠工具解决的。
OpenAI 为什么要做这件事
这里有个容易被忽略的动机:AI 公司不能只靠产品 demo 证明自己对社会有益。
过去两年,大模型厂商最擅长展示能力:写代码、做客服、分析文档、生成视频。问题是,能力展示和经济影响之间隔着一层很厚的现实。
一个模型能写出 80 分的邮件,不等于公司就能减少 20% 人力成本。一个 Agent 能修 demo 仓库里的 bug,不等于大型团队的发布周期会缩短。中间还有流程、权限、质量标准、组织惯性、用户信任。
我不太买账的是那种"AI 工具一普及,生产率自然爆发"的说法。生产率不是魔法数值,它要落在具体流程里:
- 客服单平均处理时长有没有下降
- 代码 PR 从创建到合并有没有缩短
- 销售跟进是否多了有效触达
- 医疗/法律/金融场景里,审核负担有没有转移
- 员工是否把省下来的时间用在更高价值任务上
OpenAI 做 Economic Research Exchange,某种程度上是在补这一环:从"模型能做什么"走向"组织实际变了什么"。
这对它自己也有好处。企业客户要买单,监管者要制定规则,公众要判断风险。没有一套更硬的研究框架,所有人都会继续用情绪和立场吵。
开发者也该关心这件事
很多开发者看到"经济研究"四个字会自动划走,觉得这不是自己的菜。我反而觉得它和开发者关系很近。
因为 AI 对工作的影响,最先变成代码的地方,往往就在开发工具链里。
比如一个团队接入代码智能体后,真正该看的不是"生成了多少行代码",而是这些指标:
| 指标 | 为什么比口号更有用 |
|---|---|
| PR 周期 | 从需求到合并有没有少等 |
| 返工率 | AI 写得快,但有没有多改几轮 |
| 测试补齐率 | 省下来的时间有没有变成质量资产 |
| Review 压力 | 人类审查是在变轻还是变重 |
| 事故回滚率 | 自动化有没有把风险推到上线后 |
如果让我在团队里做一次小实验,我不会一上来问"能不能提效 50%"。我会选一个低风险仓库,连续两周记录三类任务:补测试、修小 bug、改文档。然后只看两个结果:人类修改比例和最终合并率。
这两个指标很土,但比"感觉很智能"靠谱。
AI 工具最容易制造一种错觉:你在输入框里看到了流畅输出,就以为生产率已经到账。实际上,生产率只有在流程末端兑现时才算数。代码合并了、客户问题解决了、文档被复用了、错误减少了,这才是账面收益。
反方观点也很强
反方会说:OpenAI 自己做经济影响研究,天然有利益冲突。它当然希望证明 AI 提高生产率、创造新机会,而不是放大失业和不平等。
这个质疑成立。信息源有 skin in the game,就要打折看。
所以我不会把这个 Exchange 当成中立裁判。更合理的期待是:它能不能让更多外部研究者拿到问题、数据和场景,产出可复核的方法,而不是只产出对 OpenAI 有利的故事。
这里的关键不在"谁发起",而在研究结果能不能被挑战:
- 方法是否公开
- 数据口径是否说明
- 失败案例是否保留
- 负面影响是否进入报告
- 不同地区、不同职业、不同技能层级是否分开讨论
如果最后只剩一堆漂亮案例,那它就是公关资产。如果能沉淀出一组可复用的测量框架,那它才是公共资产。
个人该怎么做
我会把这件事当成一个提醒:别再抽象地讨论"AI 会不会抢工作",先给自己的工作做任务盘点。
你可以拿一周时间,给自己的工作打一个很简单的标签:
| 任务类型 | 例子 | AI 影响 |
|---|---|---|
| 信息处理 | 搜索、总结、对比资料 | 很容易被压缩 |
| 结构化产出 | 写周报、脚本、测试用例 | 容易被加速 |
| 判断决策 | 技术取舍、优先级、风险评估 | 会被辅助,不容易外包 |
| 信任责任 | 对客户承诺、上线签字、组织协调 | 工具很难替你背 |
我更关心的是第三类和第四类。前两类会越来越便宜,后两类会越来越值钱。
这不是鸡汤。它对应的是 Naval 常说的 specific knowledge:别人能按手册学会的东西,迟早会被工具压价;你独特的判断、场景理解和责任承担,才会被杠杆放大。
所以我不建议开发者把全部精力放在"学会 100 个 AI 工具"。工具会变。更值得积累的是:你能不能定义问题、拆任务、验收结果、识别风险。
AI 会让会用工具的人更快,也会让只会执行手册的人更脆。
接下来盯一个指标
这件事短期不一定会改变你的日常工作,但它可能改变 AI 行业讲故事的方式。以前大家比模型能力,接下来会越来越多人要求看真实经济指标。
我接下来会盯一个指标:这些研究项目最后有没有产出可复用的任务级测量框架。
不是"AI 让某公司效率提升 30%"这种孤立案例,而是能让其他团队照着记录、对比、复核的框架。比如同一类岗位里,哪些任务被压缩,哪些任务迁移给人类,哪些任务产生了新的审核成本。
我的判断是:AI 对工作的影响不会以"某个职业突然消失"的方式到来,它会先改变任务颗粒度,再改变团队预算,最后才改变岗位结构。
真正该焦虑的不是"AI 会不会抢我的工作",而是"我的工作里有多少部分可以被写成手册"。如果答案很多,先别焦虑,先重构自己的任务清单。
你怎么看?你现在的工作里,哪一块已经明显被 AI 压缩了?评论区聊聊。