AI 如何重塑劳动力市场:基于 Claude 数据的深度分析

前言

本文翻译自 Anthropic 今天发布的 The Anthropic Economic Index ,经济指数报告,这份报告基于 Claude 的数据对目前的 AI 使用情况做了汇总。

引言

在未来的几年里,人工智能系统将对人们的工作方式产生重大影响。因此,我们推出了 Anthropic Economic Index,这是一个旨在理解人工智能对劳动力市场和经济的长期影响的倡议。

该指数的初步报告提供了基于数百万匿名对话在 Claude.ai 上的首次数据和分析,揭示了 AI 在现代经济中如何融入现实任务的最新清晰图景。

我们还将开源用于此分析的数据集,以便研究人员可以在此基础上扩展我们的发现。制定应对劳动力市场即将发生的转型及其对就业和生产率影响的政策反应需要多种视角。为此,我们还将邀请经济学家、政策专家和其他研究人员就指数提供意见。

经济指数第一篇论文的主要发现是:

  • 今天,使用主要集中在软件开发和技术写作任务中。超过三分之一的职业(大约 36%)在其相关任务中至少有四分之一使用 AI,而大约 4%的职业在其相关任务中有四分之三使用 AI。
  • 人工智能的应用更倾向于增强(57%),即人工智能与人类能力协作并增强,而自动化(43%)则是人工智能直接执行任务。
  • 人工智能的使用在中等到高薪职业(如计算机程序员和数据科学家)相关的任务中更为普遍,但在最低和最高薪酬的角色中较低。这很可能反映了当前人工智能能力的局限性,以及使用这项技术的实际障碍。

以下为关于我们初步发现详情的说明。

劳动力市场人工智能应用映射

我们的新论文建立在关于技术对劳动力市场影响的研究长河之上,从工业革命时期的珍妮纺纱机到当今的汽车制造机器人。我们关注人工智能的持续影响。我们不调查人们对人工智能的使用情况,也不试图预测未来;相反,我们拥有关于人工智能实际使用情况的第一手数据。

分析职业任务

我们的研究始于经济学文献中的一个重要洞见:有时关注职业任务本身比关注职业更有意义。工作往往共享某些共同的任务和技能:例如,视觉模式识别是设计师、摄影师、安检人员和放射科医生执行的任务。

某些任务更适合通过新技术自动化或增强,因此我们预计人工智能将被有选择性地应用于不同职业的不同任务中,并且分析任务------除了整个工作------将使我们更全面地了解人工智能如何融入经济。

使用 Clio 将人工智能应用与任务匹配

这项研究得益于 Clio 系统,该系统允许我们在保护用户隐私的同时分析与 Claude 的对话。我们在大约一百万条与 Claude 的对话数据集(具体为 Claude.ai 上的免费和 Pro 对话)上使用了 Clio,并利用它按职业任务组织对话。

我们根据美国劳工部所做的分类选择了任务,该部门维护着一个大约有 20,000 个特定工作相关任务的数据库,称为职业信息网络,或 ONET。Clio 将每个对话与最能代表对话中 AI 角色的 ONET 任务相匹配(该过程总结在下图)。然后我们遵循 O*NET 方案将任务分组到它们最能代表的职业中,并将职业分到一个小的整体类别集合中:教育和图书馆、商业和金融等。

结果

**人工智能按职业类型的使用。**在我们的数据集中,采用人工智能最广泛的职业类别是"计算机和数学"类别,这主要涵盖了软件工程角色。向 Claude 发送的查询中有 37.2%属于这个类别,包括软件修改、代码调试和网络故障排除等任务。

第二大类别是"艺术、设计、体育、娱乐和媒体"(查询的 10.3%),这主要反映了人们使用 Claude 进行各种写作和编辑。不出所料,涉及高度体力劳动的职业,如"农业、渔业和林业"类别(查询的 0.1%),代表性最少。

我们也比较了我们的数据中的比率与每个职业在劳动力市场总体中出现的比率。比较结果如图下所示。

**人工智能在职业中的应用深度。**我们的分析发现,很少有职业在其相关任务中广泛使用人工智能:只有大约 4%的工作至少有 75%的任务使用了人工智能。然而,人工智能的适度使用则更为普遍:大约 36%的工作至少有 25%的任务使用了人工智能。

正如我们所预测的,这个数据集中没有证据表明工作完全自动化:相反,人工智能在经济中的许多任务中得到了扩散,对某些任务群体的影响比其他群体更强。

**人工智能使用和薪资。**O*NET 数据库提供了美国各职业的中位薪资。我们将此信息添加到我们的分析中,使我们能够比较各职业的中位薪资以及它们相应任务中的人工智能使用水平。

有趣的是,低薪和非常高薪的工作在人工智能的使用率上都非常低(这些通常是涉及大量手工技巧的工作,如洗发师和产科医生)。在我们的数据中,使用人工智能最频繁的是那些处于中等到高薪水平的具体职业,如计算机程序员和文案撰写者。

**自动化与增强。**我们还更详细地研究了任务执行的方式------具体来说,哪些任务涉及"自动化"(AI 直接执行如格式化文档等任务)与"增强"(AI 与用户协作完成任务)。

总体来看,我们看到了向增强的一点点倾斜,57%的任务进行了增强,43%的任务实现了自动化。也就是说,在超过一半的情况下,人工智能并没有被用来取代执行任务的人,而是与他们一起工作,参与验证(例如,双重检查用户的工作)、学习(例如,帮助用户获取新的知识和技能)以及任务迭代(例如,帮助用户进行头脑风暴或执行重复的生成性任务)。

注意事项

我们的研究为深入了解人工智能如何改变劳动力市场提供了独特的视角。但与所有研究一样,它也有重要的局限性。其中包括:

  • 我们无法确定使用 Claude 完成任务的人是在完成工作上的任务。有人向 Claude 寻求写作或编辑建议,可能是为了工作,也可能是为了他们作为爱好所写的小说。
  • 相关地,我们不知道用户是如何使用 Claude 的回复的。他们是否,例如,复制粘贴代码片段?他们是在核实回复还是无批判地接受它们?我们数据中显示的一些自动化可能实际上是增强:例如,用户可能要求 Claude 为他们写一份完整的备忘录(这看起来像是自动化),但之后又自己编辑了它(这将是增强)。
  • 我们仅分析 Claude.ai 免费和 Pro 计划的用户数据,而不是 API、团队或企业用户的数据。虽然 Claude.ai 数据包含一些非工作对话,我们使用语言模型过滤这些数据,使其仅包含与职业任务相关的对话,这有助于减轻这种担忧。
  • 大量不同的任务意味着 Clio 可能错误地分类了一些对话(请参阅完整论文,特别是附录 B,以了解我们如何验证分析的具体细节);
  • Claude 无法生成图像(除非通过代码间接生成),因此数据中不会提及一些创意用途
  • 鉴于 Claude 被宣传为最先进的编码模型,我们可能会预期编码作为一个用例会被过度代表。因此,我们不认为我们数据集中的用例是人工智能应用的一般代表性样本。

结论与未来研究

人工智能的使用正在迅速扩展,模型的能力也在不断增强。在相对较短的时间内,劳动力市场的状况可能会有很大的不同。因此,我们将随着时间的推移重复上述许多分析,以帮助追踪可能发生的社会和经济变化。我们将定期发布结果和相关数据集,作为 Anthropic 经济指数的一部分。

这类纵向分析可以让我们对人工智能和就业市场有新的认识。例如,我们将能够监控职业中人工智能使用深度的变化。如果人工智能仍然只用于某些任务,并且只有少数工作将人工智能用于其大多数任务,那么未来可能是一个大多数现有工作演变而非消失的世界。我们还可以监控自动化与增强的比例,为自动化变得越来越普遍的领域提供信号。

我们的研究提供了关于人工智能如何被使用的数据,但它并不提供政策建议。关于如何为人工智能对劳动力市场的影响做准备的问题的答案不能直接来自孤立的研究;相反,它们将来自来自广泛视角的证据、价值观和经验的结合。我们期待使用我们新的方法来对这些问题有更深入的了解。

阅读全文(译者注:论文在文末)以获取我们分析和结果的更多细节。

开放数据,征集意见

这篇论文和人类经济指数最重要的贡献是其新的方法论,提供了关于人工智能影响的详细数据。我们立即公开分享用于上述分析的数据库,并计划在将来有更多可用数据集时继续分享。

完整数据集可在此下载。(https://huggingface.co/datasets/Anthropic/EconomicIndex)

研究人员提供反馈和建议新研究方向的形式已在此。(https://docs.google.com/forms/d/e/1FAIpQLSfDEdY-mT5lcXPaDSv-0Ci1rSXGlbIJierxkUbNB7_07-kddw/viewform?usp=dialog)

致谢

我们感谢 Jonathon Hazell、Anders Humlum、Molly Kinder、Anton Korinek、Benjamin Krause、Michael Kremer、John List、Ethan Mollick、Lilach Mollick、Arjun Ramani、Will Rinehart、Robert Seamans、Michael Webb 和 Chenzi Xu 对论文早期发现和草稿的富有成效的评论和讨论。

原文

原文地址: https://www.anthropic.com/news/the-anthropic-economic-index

论文: https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf

相关推荐
NPE~3 小时前
[AI]Mac本地部署Deepseek R1模型 — — 保姆级教程
macos·ai·大模型·deepseek·部署教程
HuggingFace3 小时前
让 LLM 来评判 | 评估你的评估结果
llm
BugNest6 小时前
图像处理技术和应用
图像处理·人工智能·深度学习·机器学习·计算机视觉·ai
大龄码农有梦想6 小时前
SpringBoot集成Milvus,实现数据增删改查
人工智能·spring boot·ai·springboot·milvus·向量数据库
致Great6 小时前
DeepSeek 背后的数学原理:深入探究群体相对策略优化 (GRPO)
llm·deepseek
云计算课代表6 小时前
喂饭式教程 - 腾讯云轻量服务器部署DeepSeek
服务器·ai·腾讯云
TotheAnts8 小时前
本地部署 Browser-Use WebUI + 本地部署 DeepSeek 实现浏览器AI自动化
ai
suyukangchen10 小时前
用 DeepSeek + Kimi 自动做 PPT,效率起飞
ai
hunteritself10 小时前
DeepSeek全球第二,R1生态扩展,华为&荣耀接入,OpenAI推出深度研究,谷歌Gemini 2.0发布!AI Weekly 2.3-2.9
人工智能·科技·华为·ai·chatgpt·deepseek