美 7000 万人或被取代，Agent 光速卷入职场！北大校友、杨笛一新作

【新智元导读】AI 想替代谁？谁愿意被替代？北大校友的研究首次揭示数据真相！

1769 年，瓦特改进了蒸汽机。

1945 年，计算机诞生。

2001 年，3G 移动网络开始部署。

这些发明创新彻底改变了人的生活：从农田到工厂，从体力劳动到脑力劳动，从线下工作到线上工作。

2025 年，AI 智能体来了。这次是好是坏？

AI 智能体将带来规模最大的职场变革：仅在美国，就有多达 7000 万名工人即将面临这场变革。

但几乎从来没有人关心他们真正的想法。

在 AI 加速自动化各种工作的时代，斯坦福大学的研究团队选择了另一种路径：研究美国劳动力中，工人们的意愿与 AI 能力之间的差距。

论文链接：arxiv.org/abs/2506.06...

博客链接：futureofwork.saltlab.stanford.edu/

这次，团队有 3 大研究发现：

职场 AI 智能体的需求 - 能力分布图揭示了 AI 研究的关键错配现象：41.0% 的 Y Combinator 企业任务集中在低优先级区和自动化「红灯」区
众多任务需要人机对等协作，但从业者普遍期望更高程度的人类主导权，这一矛盾可能引发摩擦
若 AI 智能体开始进入劳动力市场，人类核心能力或将转向人际交往与组织协调技能。

「AI 真香定律」

这项研究对你很有用

这是跨学科研究团队：

计算机：Yijia Shao，Humishka Zope，Yucheng Jiang，杨笛一（Diyi Yang）

数字经济：David Nguyen, Erik Brynjolfsson

计算机 + 数字经济：Jiaxin Pei

团队建立了基于调查的严谨评估框架，用于摸清在全美各职业中，AI 智能体实现「自动化」和「增强人类能力」的潜力。

利用美国劳工部的数据库，他们开展了以下工作：

调查了 104 个职业 领域的 1500 名行业专家
招募了 52 名 AI 研究员和开发者来评估当前 AI 智能体的能力

基于这些数据，研究人员构建了**「**AI 智能体从业者前景与准备度知识库」（Worker Outlook & Readiness Knowledge Bank，WORKBank）。

如果不从事 AI 相关工作，为什么你也应该关心这件事？

因为 AI 的「真香定律」：「你可能对 AI 不感兴趣，但 AI 终将对你产生兴趣。」

为了指导未来 AI 智能体的研发，并帮助研究人员人类为未来的工作做好准备，团队正式发布了 WORKBank 数据库的第一个版本。

AI 来袭，

职场海啸？

AI 正在职场引发革命！

2023 年，OpenAI 等机构的研究表明，约 80% 的美国劳动者可能面临大语言模型（LLM）影响其至少 10% 的工作任务，其中 19% 的劳动者超过半数职责或将受到冲击。

论文链接：arxiv.org/abs/2303.10...

2025 年初，Anthropic 分析了 LLM 使用数据，结论进一步显示：

**在 36% 的职业中，**AI 工具已活跃应用于至少 25% 的工作任务。

论文链接：arxiv.org/abs/2503.04...

对普通打工人而言，AI 到底是福是祸？

这一次 AI 专家携手经济学家，直接从一线从业者反馈获取洞见。

他们提出了双视角的审计框架：

一是工人希望 AI 承担哪些任务，

二是专家评估 AI 实际上能胜任哪些任务。

为了帮助参与者准确表达想法，问卷设计了有逻辑引导的问题，并加入音频访谈，方便他们结合实际工作经验回答。

基于这个框架，研究团队构建了 WORKBank 数据库，用数据全面描绘需求和影响：

· 工人的实际需求

· 任务能否被 AI 接手的图谱（意愿---能力分布）

· 不同任务对人类参与程度的要求（HAS 等级）

· 这些变化可能对人类核心技能产生的影响

图 1：审计框架概览与关键发现

打工人的欲望与恐惧

为何不愿让 AI 智能体介入工作？

利用 AI 对工人语音回答进行归类，研究人员总结了 AI 自动化最常见的三大担忧：

45% 表示：不信任 AI 系统的准确性、能力或可靠性；
23% 担心：AI 会取代自己的工作；
16.3% 认为：AI 缺乏「人味」，无法做到人类那种沟通、理解与判断。

从行业来看，艺术、设计与媒体领域的抵触情绪最明显------

在这些领域里，只有 17.1% 的任务得到了工人的正面自动化评价。这说明，在更依赖创造力与情感表达的工作中，工人对 AI 的接受度更低。

哪些任务愿意让 AI 来做？

研究团队发现，在约 46.1% 的任务中，正在从事这些工作的工人表示「愿意让 AI 来做」。

即便是在被提醒要考虑「失业风险」或「工作变得无聊」之后，他们依然在问卷中打了超过 3 分（满分 5 分）的支持评分，说明这些任务更容易被接受自动化。

自动化意愿评分在任务中的分布。纵轴为工人对任务自动化的意愿评分（1 到 5 分），横轴为 844 项任务的排名

上图显示，有 46.1% 的任务评分高于 3 分，表示工人对这些任务由 AI 自动完成持积极态度。

排名前 3 的任务包括：

报税员：安排客户预约（5.00 分）
公共安全通信员：维护紧急呼叫相关信息档案（4.67 分）
考勤文员：记录并调整因错误造成的工资问题（4.60 分）

评分最低的 3 个任务则是：

编辑：撰写文章、社论或通讯稿（1.60 分）
物流分析师：联系供应商了解物料情况（1.50 分）
售票与旅行服务员：追踪客户行李丢失或延误情况（1.50 分）

为什么工人希望让 AI 来接手工作？

研究团队调查了支持自动化的工人为什么愿意让 AI 来帮忙------通过多选题和自由回答两种方式。

最常见的理由是：「可以把时间腾出来，去做更有价值的工作」，这项理由被 69% 的人选中。

其他常见原因包括：任务太重复（47%）、太累太有压力（26%）、或者希望通过 AI 提升工作质量（47%）。

从工人和专家的评分对比中，研究人员把任务大致分成了四个区域：

绿灯区：工人想交给 AI，AI 技术也能胜任。是最理想的自动化对象，有望带来效率与社会效益双赢。
红灯区：AI 技术没问题，但工人不愿意。这类任务部署 AI 要小心，容易引发抵触或更大争议。
研发机会区：工人很希望 AI 来做，但现在 AI 还做不到。是未来技术突破的重点方向。
低优先级区：工人不想交给 AI，AI 也还做不到。暂时不是 AI 发展的重点。

意愿---能力图谱

这张「意愿---能力图谱」帮助识别出哪些任务值得重点投入。

但当把 YC 旗下的创业公司与这些任务匹配时，研究人员发现：目前的投资并未优先关注「绿灯区」或「研发机会区」。反而有约 41% 的 YC 公司集中在「红灯区」或「低优先级区」这些不太受欢迎或技术难度高的任务。

换句话说，许多「技术可行 + 工人也欢迎」的任务，其实并没有得到应有的重视。

这提醒我们：AI 的发展不仅要看技术本身，也要看人们真正想要什么。

人机协作

不只替代，AI 更是搭档

AI 智能体对工作的影响并非简单的「自动化」或「非自动化」这样的二选一问题。

为此，研究人员引入了「人类能动性等级」（Human Agency Scale）：包含 5 个等级的量表，涵盖了从「完全自动化」到「人机协作增益」之间的各种状态------

在后一种状态下，技术主要用于补充和增强人类的能力。

H1：AI 能完全独立完成任务，无需人参与。

H2：AI 能完成大部分任务，偶尔需要人类输入。

H3：AI 和人类平等协作，效果优于任何一方单独完成。

H4：AI 必须依赖人类才能完成任务。

H5：AI 无法独立完成任务，必须全程由人主导。

这一等级体系不是说「越高越好」，而是用来匹配不同任务的实际需求。

下图 2 展示了这五个等级在不同任务中的具体例子，比如哪些任务适合完全交给 AI，哪些则需要人机长期协作。

HAS 不仅能让人更清楚地理解「AI 适合做什么」，也为打工人准备未来技能、开发者设计更合理的 AI 智能体提供了清晰的参考。

总体上，工人更倾向于较高水平的人类参与，这可能预示着随着 AI 能力增强，会产生一定的摩擦。

在调查的 104 种职业中，有 47 种工人最倾向的等级是 H3------也就是「人机平等协作」。

这说明，很多工人并不想让 AI 全面接管工作，而是希望 AI 成为有力的合作伙伴。

不过，也出现了值得注意的现象：在将近一半（47.5%）的任务中，工人希望的「人类参与度」远超专家估计。

更极端的是，有 16.4% 的任务，工人希望的等级高出专家评估两个档次。这意味着，哪怕 AI 已经技术上「能做」，很多工人还是不放心、不愿放手。

人类能动性程度在同一职业内部也存在差异，有些任务适合自动化，有些则不然。

这也提醒开发者：在设计 AI 智能体时，不能一刀切。

为未来做好准备

并不是所有类型的工作都会同样受到 AI 的影响。

为了理解未来工作的走向，以及哪些技能将变得最有价值，研究团队进一步利用 WORKBank 数据库来分析人类技能的变化趋势。

最后发现了三项可能影响未来人类工作的趋势：

对信息处理类技能的需求正在减弱。它们在那些人类参与度高的任务中出现较少。
人际沟通与组织管理类技能正变得更重要。它们在高 HAS 等级的任务中更为常见。
高人类参与度的技能涵盖多种维度。平均人类参与度最高的前十项技能，跨越了人际、组织、决策与判断等多个方面。

作者介绍

Yijia Shao 是斯坦福大学的博士生，师从杨笛一教授。

此前，她在北京大学元培学院获得学士学位。

她曾在微软亚洲研究院、谷歌 Tensorflow Lite 团队实习。

她的研究方向为机器学习与自然语言处理。

参考资料：

x.com/EchoShao889...

arxiv.org/abs/2506.06...

www.linkedin.com/feed/update...

futureofwork.saltlab.stanford.edu/