
【新智元导读】AI 想替代谁?谁愿意被替代?北大校友的研究首次揭示数据真相!
1769 年,瓦特改进了蒸汽机。
1945 年,计算机诞生。
2001 年,3G 移动网络开始部署。
这些发明创新彻底改变了人的生活:从农田到工厂,从体力劳动到脑力劳动,从线下工作到线上工作。
2025 年,AI 智能体来了。这次是好是坏?
AI 智能体将带来规模最大的职场变革:仅在美国,就有多达 7000 万名工人即将面临这场变革。
但几乎从来没有人关心他们真正的想法。

在 AI 加速自动化各种工作的时代,斯坦福大学的研究团队选择了另一种路径:研究美国劳动力中,工人们的意愿与 AI 能力之间的差距。

博客链接:futureofwork.saltlab.stanford.edu/
这次,团队有 3 大研究发现:
-
职场 AI 智能体的需求 - 能力分布图揭示了 AI 研究的关键错配现象:41.0% 的 Y Combinator 企业任务集中在低优先级区和自动化「红灯」区
-
众多任务需要人机对等协作,但从业者普遍期望更高程度的人类主导权,这一矛盾可能引发摩擦
-
若 AI 智能体开始进入劳动力市场,人类核心能力或将转向人际交往与组织协调技能。

「AI 真香定律」
这项研究对你很有用
这是跨学科研究团队:
计算机:Yijia Shao,Humishka Zope,Yucheng Jiang,杨笛一(Diyi Yang)
数字经济:David Nguyen, Erik Brynjolfsson
计算机 + 数字经济:Jiaxin Pei
团队建立了基于调查的严谨评估框架,用于摸清在全美各职业中,AI 智能体实现「自动化」和「增强人类能力」的潜力。
利用美国劳工部的数据库,他们开展了以下工作:
-
调查了 104 个职业 领域的 1500 名行业专家
-
招募了 52 名 AI 研究员和开发者来评估当前 AI 智能体的能力
基于这些数据,研究人员构建了**「**AI 智能体从业者前景与准备度知识库」(Worker Outlook & Readiness Knowledge Bank,WORKBank)。
如果不从事 AI 相关工作,为什么你也应该关心这件事?
因为 AI 的「真香定律」:「你可能对 AI 不感兴趣,但 AI 终将对你产生兴趣。」
为了指导未来 AI 智能体的研发,并帮助研究人员人类为未来的工作做好准备,团队正式发布了 WORKBank 数据库的第一个版本。

AI 来袭,
职场海啸?
AI 正在职场引发革命!
2023 年,OpenAI 等机构的研究表明,约 80% 的美国劳动者可能面临大语言模型(LLM)影响其至少 10% 的工作任务,其中 19% 的劳动者超过半数职责或将受到冲击。

2025 年初,Anthropic 分析了 LLM 使用数据,结论进一步显示:
**在 36% 的职业中,**AI 工具已活跃应用于至少 25% 的工作任务。

对普通打工人而言,AI 到底是福是祸?
这一次 AI 专家携手经济学家,直接从一线从业者反馈获取洞见。
他们提出了双视角的审计框架:
一是工人希望 AI 承担哪些任务,
二是专家评估 AI 实际上能胜任哪些任务。
为了帮助参与者准确表达想法,问卷设计了有逻辑引导的问题,并加入音频访谈,方便他们结合实际工作经验回答。
基于这个框架,研究团队构建了 WORKBank 数据库,用数据全面描绘需求和影响:
· 工人的实际需求
· 任务能否被 AI 接手的图谱(意愿---能力分布)
· 不同任务对人类参与程度的要求(HAS 等级)
· 这些变化可能对人类核心技能产生的影响

图 1:审计框架概览与关键发现

打工人的欲望与恐惧
为何不愿让 AI 智能体介入工作?
利用 AI 对工人语音回答进行归类,研究人员总结了 AI 自动化最常见的三大担忧:
-
45% 表示:不信任 AI 系统的准确性、能力或可靠性;
-
23% 担心:AI 会取代自己的工作;
-
16.3% 认为:AI 缺乏「人味」,无法做到人类那种沟通、理解与判断。
从行业来看,艺术、设计与媒体领域的抵触情绪最明显------
在这些领域里,只有 17.1% 的任务得到了工人的正面自动化评价。这说明,在更依赖创造力与情感表达的工作中,工人对 AI 的接受度更低。

哪些任务愿意让 AI 来做?
研究团队发现,在约 46.1% 的任务中,正在从事这些工作的工人表示「愿意让 AI 来做」。
即便是在被提醒要考虑「失业风险」或「工作变得无聊」之后,他们依然在问卷中打了超过 3 分(满分 5 分)的支持评分,说明这些任务更容易被接受自动化。

自动化意愿评分在任务中的分布。纵轴为工人对任务自动化的意愿评分(1 到 5 分),横轴为 844 项任务的排名
上图显示,有 46.1% 的任务评分高于 3 分,表示工人对这些任务由 AI 自动完成持积极态度。
排名前 3 的任务包括:
-
报税员:安排客户预约(5.00 分)
-
公共安全通信员:维护紧急呼叫相关信息档案(4.67 分)
-
考勤文员:记录并调整因错误造成的工资问题(4.60 分)
评分最低的 3 个任务则是:
-
编辑:撰写文章、社论或通讯稿(1.60 分)
-
物流分析师:联系供应商了解物料情况(1.50 分)
-
售票与旅行服务员:追踪客户行李丢失或延误情况(1.50 分)
为什么工人希望让 AI 来接手工作?
研究团队调查了支持自动化的工人为什么愿意让 AI 来帮忙------通过多选题和自由回答两种方式。
最常见的理由是:「可以把时间腾出来,去做更有价值的工作」,这项理由被 69% 的人选中。
其他常见原因包括:任务太重复(47%)、太累太有压力(26%)、或者希望通过 AI 提升工作质量(47%)。

从工人和专家的评分对比中,研究人员把任务大致分成了四个区域:
-
绿灯区:工人想交给 AI,AI 技术也能胜任。是最理想的自动化对象,有望带来效率与社会效益双赢。
-
红灯区:AI 技术没问题,但工人不愿意。这类任务部署 AI 要小心,容易引发抵触或更大争议。
-
研发机会区:工人很希望 AI 来做,但现在 AI 还做不到。是未来技术突破的重点方向。
-
低优先级区:工人不想交给 AI,AI 也还做不到。暂时不是 AI 发展的重点。

意愿---能力图谱
这张「意愿---能力图谱」帮助识别出哪些任务值得重点投入。
但当把 YC 旗下的创业公司与这些任务匹配时,研究人员发现:目前的投资并未优先关注「绿灯区」或「研发机会区」。反而有约 41% 的 YC 公司集中在「红灯区」或「低优先级区」这些不太受欢迎或技术难度高的任务。

换句话说,许多「技术可行 + 工人也欢迎」的任务,其实并没有得到应有的重视。
这提醒我们:AI 的发展不仅要看技术本身,也要看人们真正想要什么。

人机协作
不只替代,AI 更是搭档
AI 智能体对工作的影响并非简单的「自动化」或「非自动化」这样的二选一问题。
为此,研究人员引入了「人类能动性等级」(Human Agency Scale):包含 5 个等级的量表,涵盖了从「完全自动化」到「人机协作增益」之间的各种状态------
在后一种状态下,技术主要用于补充和增强人类的能力。
H1:AI 能完全独立完成任务,无需人参与。
H2:AI 能完成大部分任务,偶尔需要人类输入。
H3:AI 和人类平等协作,效果优于任何一方单独完成。
H4:AI 必须依赖人类才能完成任务。
H5:AI 无法独立完成任务,必须全程由人主导。
这一等级体系不是说「越高越好」,而是用来匹配不同任务的实际需求。
下图 2 展示了这五个等级在不同任务中的具体例子,比如哪些任务适合完全交给 AI,哪些则需要人机长期协作。

HAS 不仅能让人更清楚地理解「AI 适合做什么」,也为打工人准备未来技能、开发者设计更合理的 AI 智能体提供了清晰的参考。
总体上,工人更倾向于较高水平的人类参与,这可能预示着随着 AI 能力增强,会产生一定的摩擦。
在调查的 104 种职业中,有 47 种工人最倾向的等级是 H3------也就是「人机平等协作」。
这说明,很多工人并不想让 AI 全面接管工作,而是希望 AI 成为有力的合作伙伴。

不过,也出现了值得注意的现象:在将近一半(47.5%)的任务中,工人希望的「人类参与度」远超专家估计。
更极端的是,有 16.4% 的任务,工人希望的等级高出专家评估两个档次。这意味着,哪怕 AI 已经技术上「能做」,很多工人还是不放心、不愿放手。

人类能动性程度在同一职业内部也存在差异,有些任务适合自动化,有些则不然。
这也提醒开发者:在设计 AI 智能体时,不能一刀切。


为未来做好准备
并不是所有类型的工作都会同样受到 AI 的影响。
为了理解未来工作的走向,以及哪些技能将变得最有价值,研究团队进一步利用 WORKBank 数据库来分析人类技能的变化趋势。
最后发现了三项可能影响未来人类工作的趋势:
-
对信息处理类技能的需求正在减弱。它们在那些人类参与度高的任务中出现较少。
-
人际沟通与组织管理类技能正变得更重要。它们在高 HAS 等级的任务中更为常见。
-
高人类参与度的技能涵盖多种维度。平均人类参与度最高的前十项技能,跨越了人际、组织、决策与判断等多个方面。


作者介绍
Yijia Shao 是斯坦福大学的博士生,师从杨笛一教授。
此前,她在北京大学元培学院获得学士学位。

她曾在微软亚洲研究院、谷歌 Tensorflow Lite 团队实习。
她的研究方向为机器学习与自然语言处理。
参考资料: