美 7000 万人或被取代,Agent 光速卷入职场!北大校友、杨笛一新作

【新智元导读】AI 想替代谁?谁愿意被替代?北大校友的研究首次揭示数据真相!

1769 年,瓦特改进了蒸汽机。

1945 年,计算机诞生。

2001 年,3G 移动网络开始部署。

这些发明创新彻底改变了人的生活:从农田到工厂,从体力劳动到脑力劳动,从线下工作到线上工作。

2025 年,AI 智能体来了。这次是好是坏?

AI 智能体将带来规模最大的职场变革:仅在美国,就有多达 7000 万名工人即将面临这场变革。

但几乎从来没有人关心他们真正的想法。

在 AI 加速自动化各种工作的时代,斯坦福大学的研究团队选择了另一种路径:研究美国劳动力中,工人们的意愿与 AI 能力之间的差距。

论文链接:arxiv.org/abs/2506.06...

博客链接:futureofwork.saltlab.stanford.edu/

这次,团队有 3 大研究发现:

  1. 职场 AI 智能体的需求 - 能力分布图揭示了 AI 研究的关键错配现象:41.0% 的 Y Combinator 企业任务集中在低优先级区和自动化「红灯」区

  2. 众多任务需要人机对等协作,但从业者普遍期望更高程度的人类主导权,这一矛盾可能引发摩擦

  3. 若 AI 智能体开始进入劳动力市场,人类核心能力或将转向人际交往与组织协调技能。

「AI 真香定律」

这项研究对你很有用

这是跨学科研究团队:

计算机:Yijia Shao,Humishka Zope,Yucheng Jiang,杨笛一(Diyi Yang)

数字经济:David Nguyen, Erik Brynjolfsson

计算机 + 数字经济:Jiaxin Pei

团队建立了基于调查的严谨评估框架,用于摸清在全美各职业中,AI 智能体实现「自动化」和「增强人类能力」的潜力。

利用美国劳工部的数据库,他们开展了以下工作:

  • 调查了 104 个职业 领域的 1500 名行业专家

  • 招募了 52 名 AI 研究员和开发者来评估当前 AI 智能体的能力

基于这些数据,研究人员构建了**「**AI 智能体从业者前景与准备度知识库」(Worker Outlook & Readiness Knowledge Bank,WORKBank)

如果不从事 AI 相关工作,为什么你也应该关心这件事?

因为 AI 的「真香定律」:「你可能对 AI 不感兴趣,但 AI 终将对你产生兴趣。」

为了指导未来 AI 智能体的研发,并帮助研究人员人类为未来的工作做好准备,团队正式发布了 WORKBank 数据库的第一个版本。

AI 来袭,

职场海啸?

AI 正在职场引发革命!

2023 年,OpenAI 等机构的研究表明,约 80% 的美国劳动者可能面临大语言模型(LLM)影响其至少 10% 的工作任务,其中 19% 的劳动者超过半数职责或将受到冲击

论文链接:arxiv.org/abs/2303.10...

2025 年初,Anthropic 分析了 LLM 使用数据,结论进一步显示:

**在 36% 的职业中,**AI 工具已活跃应用于至少 25% 的工作任务

论文链接:arxiv.org/abs/2503.04...

对普通打工人而言,AI 到底是福是祸?

这一次 AI 专家携手经济学家,直接从一线从业者反馈获取洞见。

他们提出了双视角的审计框架:

一是工人希望 AI 承担哪些任务,

二是专家评估 AI 实际上能胜任哪些任务。

为了帮助参与者准确表达想法,问卷设计了有逻辑引导的问题,并加入音频访谈,方便他们结合实际工作经验回答。

基于这个框架,研究团队构建了 WORKBank 数据库,用数据全面描绘需求和影响:

· 工人的实际需求

· 任务能否被 AI 接手的图谱(意愿---能力分布)

· 不同任务对人类参与程度的要求(HAS 等级)

· 这些变化可能对人类核心技能产生的影响

图 1:审计框架概览与关键发现

打工人的欲望与恐惧

为何不愿让 AI 智能体介入工作?

利用 AI 对工人语音回答进行归类,研究人员总结了 AI 自动化最常见的三大担忧:

  • 45% 表示:不信任 AI 系统的准确性、能力或可靠性;

  • 23% 担心:AI 会取代自己的工作;

  • 16.3% 认为:AI 缺乏「人味」,无法做到人类那种沟通、理解与判断。

从行业来看,艺术、设计与媒体领域的抵触情绪最明显------

在这些领域里,只有 17.1% 的任务得到了工人的正面自动化评价。这说明,在更依赖创造力与情感表达的工作中,工人对 AI 的接受度更低。

哪些任务愿意让 AI 来做?

研究团队发现,在约 46.1% 的任务中,正在从事这些工作的工人表示「愿意让 AI 来做」。

即便是在被提醒要考虑「失业风险」或「工作变得无聊」之后,他们依然在问卷中打了超过 3 分(满分 5 分)的支持评分,说明这些任务更容易被接受自动化。

自动化意愿评分在任务中的分布。纵轴为工人对任务自动化的意愿评分(1 到 5 分),横轴为 844 项任务的排名

上图显示,有 46.1% 的任务评分高于 3 分,表示工人对这些任务由 AI 自动完成持积极态度。

排名前 3 的任务包括:

  • 报税员:安排客户预约(5.00 分)

  • 公共安全通信员:维护紧急呼叫相关信息档案(4.67 分)

  • 考勤文员:记录并调整因错误造成的工资问题(4.60 分)

评分最低的 3 个任务则是:

  • 编辑:撰写文章、社论或通讯稿(1.60 分)

  • 物流分析师:联系供应商了解物料情况(1.50 分)

  • 售票与旅行服务员:追踪客户行李丢失或延误情况(1.50 分)

为什么工人希望让 AI 来接手工作?

研究团队调查了支持自动化的工人为什么愿意让 AI 来帮忙------通过多选题和自由回答两种方式。

最常见的理由是:「可以把时间腾出来,去做更有价值的工作」,这项理由被 69% 的人选中。

其他常见原因包括:任务太重复(47%)、太累太有压力(26%)、或者希望通过 AI 提升工作质量(47%)。

从工人和专家的评分对比中,研究人员把任务大致分成了四个区域:

  1. 绿灯区:工人想交给 AI,AI 技术也能胜任。是最理想的自动化对象,有望带来效率与社会效益双赢。

  2. 红灯区:AI 技术没问题,但工人不愿意。这类任务部署 AI 要小心,容易引发抵触或更大争议。

  3. 研发机会区:工人很希望 AI 来做,但现在 AI 还做不到。是未来技术突破的重点方向。

  4. 低优先级区:工人不想交给 AI,AI 也还做不到。暂时不是 AI 发展的重点。

意愿---能力图谱

这张「意愿---能力图谱」帮助识别出哪些任务值得重点投入。

但当把 YC 旗下的创业公司与这些任务匹配时,研究人员发现:目前的投资并未优先关注「绿灯区」或「研发机会区」。反而有约 41% 的 YC 公司集中在「红灯区」或「低优先级区」这些不太受欢迎或技术难度高的任务。

换句话说,许多「技术可行 + 工人也欢迎」的任务,其实并没有得到应有的重视。

这提醒我们:AI 的发展不仅要看技术本身,也要看人们真正想要什么。

人机协作

不只替代,AI 更是搭档

AI 智能体对工作的影响并非简单的「自动化」或「非自动化」这样的二选一问题。

为此,研究人员引入了「人类能动性等级」(Human Agency Scale):包含 5 个等级的量表,涵盖了从「完全自动化」到「人机协作增益」之间的各种状态------

在后一种状态下,技术主要用于补充和增强人类的能力。

H1:AI 能完全独立完成任务,无需人参与。

H2:AI 能完成大部分任务,偶尔需要人类输入。

H3:AI 和人类平等协作,效果优于任何一方单独完成。

H4:AI 必须依赖人类才能完成任务。

H5:AI 无法独立完成任务,必须全程由人主导。

这一等级体系不是说「越高越好」,而是用来匹配不同任务的实际需求。

下图 2 展示了这五个等级在不同任务中的具体例子,比如哪些任务适合完全交给 AI,哪些则需要人机长期协作。

HAS 不仅能让人更清楚地理解「AI 适合做什么」,也为打工人准备未来技能、开发者设计更合理的 AI 智能体提供了清晰的参考。

总体上,工人更倾向于较高水平的人类参与,这可能预示着随着 AI 能力增强,会产生一定的摩擦。

在调查的 104 种职业中,有 47 种工人最倾向的等级是 H3------也就是「人机平等协作」。

这说明,很多工人并不想让 AI 全面接管工作,而是希望 AI 成为有力的合作伙伴。

不过,也出现了值得注意的现象:在将近一半(47.5%)的任务中,工人希望的「人类参与度」远超专家估计。

更极端的是,有 16.4% 的任务,工人希望的等级高出专家评估两个档次。这意味着,哪怕 AI 已经技术上「能做」,很多工人还是不放心、不愿放手。

人类能动性程度在同一职业内部也存在差异,有些任务适合自动化,有些则不然。

这也提醒开发者:在设计 AI 智能体时,不能一刀切。

为未来做好准备

并不是所有类型的工作都会同样受到 AI 的影响。

为了理解未来工作的走向,以及哪些技能将变得最有价值,研究团队进一步利用 WORKBank 数据库来分析人类技能的变化趋势。

最后发现了三项可能影响未来人类工作的趋势:

  1. 对信息处理类技能的需求正在减弱。它们在那些人类参与度高的任务中出现较少。

  2. 人际沟通与组织管理类技能正变得更重要。它们在高 HAS 等级的任务中更为常见。

  3. 高人类参与度的技能涵盖多种维度。平均人类参与度最高的前十项技能,跨越了人际、组织、决策与判断等多个方面。

作者介绍

Yijia Shao 是斯坦福大学的博士生,师从杨笛一教授。

此前,她在北京大学元培学院获得学士学位。

她曾在微软亚洲研究院、谷歌 Tensorflow Lite 团队实习。

她的研究方向为机器学习与自然语言处理。

参考资料:

x.com/EchoShao889...

arxiv.org/abs/2506.06...

www.linkedin.com/feed/update...

futureofwork.saltlab.stanford.edu/

相关推荐
说私域几秒前
定制开发开源AI智能名片S2B2C商城小程序:破解B2B营销四大难题的新路径
人工智能·小程序·开源·零售
璞华Purvar4 分钟前
2025年全国技术贸易创新实践案例:AI编辑助手平台助力“一带一路”数字媒体产业高质量发展
大数据·人工智能·媒体
趣浪吧7 分钟前
【JSON-To-Video】AI智能体开发:为视频图片元素添加动效(滑入、旋转、滑出),附代码
人工智能·ai·aigc·音视频·视频
Listennnn7 分钟前
强化学习三大分类
人工智能·强化学习
柠檬味拥抱26 分钟前
面向边缘智能的MCP Bridge轻量化适配策略研究与实现
人工智能
学境思源AcademicIdeas34 分钟前
如何使用ChatGPT快速完成一篇论文初稿?
人工智能·chatgpt
人类发明了工具40 分钟前
【强化学习】PPO(Proximal Policy Optimization,近端策略优化)算法
人工智能·算法·机器学习·ppo·近端策略优化算法
ShanHai山海1 小时前
SpringAI+DeepSeek-了解AI和大模型应用
人工智能
墨家巨子@俏如来1 小时前
二.干货干货!!!SpringAI入门到实战-记忆存储和会话隔离
人工智能·springai
西猫雷婶1 小时前
python学智能算法(十二)|机器学习朴素贝叶斯方法初步-拉普拉斯平滑计算条件概率
开发语言·人工智能·python·深度学习·机器学习·矩阵