AI抢工作这笔账终于有人认真算了

最近聊 AI 对工作的影响，最别扭的地方不是观点不够多，而是观点太多、证据太少。有人说大模型会让白领大失业，也有人说它只是新的 Excel。两边都能讲得很顺，但真到团队里做预算、改岗位、配培训，大家手里其实没几张能落地的表。

OpenAI 6 月 8 日推出了 Economic Research Exchange，想把研究者、企业和公共机构拉到一起，研究 AI 对岗位、生产率和经济结构的影响。只看标题，它像一个偏宏观的研究项目；我更关心的是，它会不会把"AI 到底改变了什么工作"这件事，从情绪判断拉回可测量问题。

看完这篇你能知道：

这件事为什么不只是 OpenAI 做公关
AI 影响工作时，真正该量化的不是"替代率"
如果你是开发者或团队负责人，明天能先记录哪些指标

真问题不是会不会替代人

OpenAI 官方摘要说，这个 Exchange 会围绕 AI 对就业、生产率和经济的影响做研究，并开放申请，选择一批研究项目参与。

事实就这么多。我没有看到完整项目清单，也没有看到最终研究方法，所以这里不装成已经读完报告。我的判断只基于公开信息：OpenAI 需要一套更可信的外部研究机制，来回答企业、监管者和普通劳动者都在问的问题。

但"AI 会不会替代人"这个问法太粗了。

真实世界里，工作不是一个整体。一个岗位通常由很多任务拼起来：写文档、查资料、开会、写代码、对齐需求、做决策、背责任。AI 可能替代其中 30% 的任务，但剩下 70% 反而变得更重要。

我会先把问题拆成三层：

层级	错误问法	更该问什么
岗位	这个职业会不会消失	哪些任务会被压缩
团队	要不要少招人	交付瓶颈是不是变了
个人	AI 会不会抢我饭碗	我的判断力有没有被放大

如果只盯"岗位替代率"，很容易得出吓人的结论；如果拆到任务层，你会发现更有用的问题是：哪些工作从 2 小时变 20 分钟，哪些工作从来就不是靠工具解决的。

OpenAI 为什么要做这件事

这里有个容易被忽略的动机：AI 公司不能只靠产品 demo 证明自己对社会有益。

过去两年，大模型厂商最擅长展示能力：写代码、做客服、分析文档、生成视频。问题是，能力展示和经济影响之间隔着一层很厚的现实。

一个模型能写出 80 分的邮件，不等于公司就能减少 20% 人力成本。一个 Agent 能修 demo 仓库里的 bug，不等于大型团队的发布周期会缩短。中间还有流程、权限、质量标准、组织惯性、用户信任。

我不太买账的是那种"AI 工具一普及，生产率自然爆发"的说法。生产率不是魔法数值，它要落在具体流程里：

客服单平均处理时长有没有下降
代码 PR 从创建到合并有没有缩短
销售跟进是否多了有效触达
医疗/法律/金融场景里，审核负担有没有转移
员工是否把省下来的时间用在更高价值任务上

OpenAI 做 Economic Research Exchange，某种程度上是在补这一环：从"模型能做什么"走向"组织实际变了什么"。

这对它自己也有好处。企业客户要买单，监管者要制定规则，公众要判断风险。没有一套更硬的研究框架，所有人都会继续用情绪和立场吵。

开发者也该关心这件事

很多开发者看到"经济研究"四个字会自动划走，觉得这不是自己的菜。我反而觉得它和开发者关系很近。

因为 AI 对工作的影响，最先变成代码的地方，往往就在开发工具链里。

比如一个团队接入代码智能体后，真正该看的不是"生成了多少行代码"，而是这些指标：

指标	为什么比口号更有用
PR 周期	从需求到合并有没有少等
返工率	AI 写得快,但有没有多改几轮
测试补齐率	省下来的时间有没有变成质量资产
Review 压力	人类审查是在变轻还是变重
事故回滚率	自动化有没有把风险推到上线后

如果让我在团队里做一次小实验，我不会一上来问"能不能提效 50%"。我会选一个低风险仓库，连续两周记录三类任务：补测试、修小 bug、改文档。然后只看两个结果：人类修改比例和最终合并率。

这两个指标很土，但比"感觉很智能"靠谱。

AI 工具最容易制造一种错觉：你在输入框里看到了流畅输出，就以为生产率已经到账。实际上，生产率只有在流程末端兑现时才算数。代码合并了、客户问题解决了、文档被复用了、错误减少了，这才是账面收益。

反方观点也很强

反方会说：OpenAI 自己做经济影响研究，天然有利益冲突。它当然希望证明 AI 提高生产率、创造新机会，而不是放大失业和不平等。

这个质疑成立。信息源有 skin in the game，就要打折看。

所以我不会把这个 Exchange 当成中立裁判。更合理的期待是：它能不能让更多外部研究者拿到问题、数据和场景，产出可复核的方法，而不是只产出对 OpenAI 有利的故事。

这里的关键不在"谁发起"，而在研究结果能不能被挑战：

方法是否公开
数据口径是否说明
失败案例是否保留
负面影响是否进入报告
不同地区、不同职业、不同技能层级是否分开讨论

如果最后只剩一堆漂亮案例，那它就是公关资产。如果能沉淀出一组可复用的测量框架，那它才是公共资产。

个人该怎么做

我会把这件事当成一个提醒：别再抽象地讨论"AI 会不会抢工作"，先给自己的工作做任务盘点。

你可以拿一周时间，给自己的工作打一个很简单的标签：

任务类型	例子	AI 影响
信息处理	搜索、总结、对比资料	很容易被压缩
结构化产出	写周报、脚本、测试用例	容易被加速
判断决策	技术取舍、优先级、风险评估	会被辅助,不容易外包
信任责任	对客户承诺、上线签字、组织协调	工具很难替你背

我更关心的是第三类和第四类。前两类会越来越便宜，后两类会越来越值钱。

这不是鸡汤。它对应的是 Naval 常说的 specific knowledge：别人能按手册学会的东西，迟早会被工具压价；你独特的判断、场景理解和责任承担，才会被杠杆放大。

所以我不建议开发者把全部精力放在"学会 100 个 AI 工具"。工具会变。更值得积累的是：你能不能定义问题、拆任务、验收结果、识别风险。

AI 会让会用工具的人更快，也会让只会执行手册的人更脆。

接下来盯一个指标

这件事短期不一定会改变你的日常工作，但它可能改变 AI 行业讲故事的方式。以前大家比模型能力，接下来会越来越多人要求看真实经济指标。

我接下来会盯一个指标：这些研究项目最后有没有产出可复用的任务级测量框架。

不是"AI 让某公司效率提升 30%"这种孤立案例，而是能让其他团队照着记录、对比、复核的框架。比如同一类岗位里，哪些任务被压缩，哪些任务迁移给人类，哪些任务产生了新的审核成本。

我的判断是：AI 对工作的影响不会以"某个职业突然消失"的方式到来，它会先改变任务颗粒度，再改变团队预算，最后才改变岗位结构。

真正该焦虑的不是"AI 会不会抢我的工作"，而是"我的工作里有多少部分可以被写成手册"。如果答案很多，先别焦虑，先重构自己的任务清单。

你怎么看？你现在的工作里，哪一块已经明显被 AI 压缩了？评论区聊聊。