近日 Claude 开发公司 Anthropic 发布了一篇 《How AI Is Transforming Work at Anthropic》 的文章,文章是 Anthropic 在 8 月对内部员工进行调查,通过对 132 名工程师和研究人员的调查、53 次深度访谈,以及对 20 万条内部 Claude Code 使用记录的分析,报告了目前 AI 对于工程师的相关影响。
这是一份很有参考价值的数据。
在这里 Anthropic 使用三种互补方法,确保定量与定性数据的平衡:
- 通过内部 Slack 渠道(68 份响应)和直接接触 207 人(64 份响应,31% 响应率)进行,问题聚焦编码任务频率、生产力影响和委托策略
- 针对前 53 名调查受访者,进行主题分析,探讨委托实践、技能变化、社会动态和职业转变
- 使用隐私保护工具分析 20 万条内部记录,按任务复杂度(1-5 量表)、类型(如调试、功能实现)和团队差异分类
文章的核心是 AI 如何重塑工作,分为生产力、新任务启用、委托实践、技能变化、社会/职业影响和使用趋势等,我们可以先简单看看文章提供的真实数据表格,感受下 AI 对于开发者的影响数据:
| 每日使用率 | 当前值 | 数据含义/备注 |
|---|---|---|
| 调试/修复错误 | 55% | 超过一半的员工每天用它修 Bug |
| 理解/阅读代码 | 42% | 用于解释复杂的代码库 |
| 新功能开发 | 37% | 直接用于写新 Feature |
| 时间点 / 统计 | Claude 使用占比 / 频率 | 平均自报生产力提升 |
|---|---|---|
| 一年前 | 使用率 ≈ 28% | +20% 生产力提升 |
| 2025 年(报告时点) | 使用率 ≈ 59% | +50% 生产力提升 |
| "Power Users"(表现最好的一部分用户) | --- | 有 14% 的人报告生产力提升超过 100% |
| 新任务 & 杂项改进比例 | 百分比 / 频率 |
|---|---|
| Claude-assisted work 中,"原本不会做 / 被跳过"的任务 (new work) | 27% |
| Claude Code 任务中 "papercut fixes"(小修小补 / 可维护性/质量提升/工具/文档等) | 8.6% |
| 复杂度 & 自动化程度 | 平均任务复杂度 (1--5 量表) | 平均最大连续工具调用数 (tool calls) | 平均 Human Turns (人类交互次数) |
|---|---|---|---|
| 6 个月前 (Feb 2025) | 3.2 | 9.8 次连续调用 | 6.2 次 Human Turns |
| 2025 年 August (报告时点) | 3.8 | 21.2 次连续调用 | 4.1 次 Human Turns |
| 各任务类别占比变化 | Feb 2025 占比 | Aug 2025 占比 |
|---|---|---|
| 新功能开发 | 14.3% | 36.9% |
| 设计/规划 | 1.0% | 9.9% |
| 其他(debugging / code understanding / refactoring / papercuts / ...) | 剩余 ≈ 84.7% | 剩余 ≈ 53.2% (大致 = 100 − 36.9 − 9.9) |
| 全栈化 (跨领域) | 主用 Claude Code 任务类型 / 占比 (主要任务) |
|---|---|
| Pre-training team | 新功能开发 (building new features) 占比 ~ 54.6% |
| 对齐/安全团队 | 前端开发 (front-end development / 数据可视化) 占比 ~ 7.5% |
| Post-training team | 前端开发 ~ 7.4% |
| Security team | 代码理解 / 分析占 ~ 48.9% |
| 非技术人员 | Debugging 占 ~ 51.5%;Data science / 数据分析占 ~ 12.7% ,编写/调试脚本,能够通过 AI 获得基础编码能力 |
| 所有团队 ("All Teams" baseline) | 主要任务为新功能开发、调试 (debugging)、code understanding |
通过上面这份数据,可以直观看到:
生产力提升:
- 平均 50% 生产力提升(14% 用户超过 100%),合并拉取请求(pull requests)每工程师增加 67%,任务时间减少(如调试时间缩短),输出量增加
- 减少琐碎工作(如重构),并行探索想法(如同时运行多个 Claude 实例),复杂调试可能需更多善后清理时间,但整体效率更高
启用新工作:
- 这是一个有趣的现象,报告里 27% 的 Claude 辅助工作原本不会发生,包括扩展项目、"锦上添花"任务(如交互式仪表板、文档、测试)和探索性工作,另外还有 8.6% 为"小修小补"(如可维护性重构)
- 例如安全团队用 Claude 分析未知代码含义;非技术员工调试网络或 Git 问题
委托实践:
- 整体 Claude 使用频繁提升,但完全委托只占了 0-20%,大多数情况还是需主动监督,开发者还是优先委托易验证、低风险或枯燥任务(如抛弃式调试代码),在逐步信任逐步后,才有从简单到复杂的过程。
- 边界:调查报告里主要反馈还有高风险、战略思考或"品味"任务(如设计决策)需要保留人类处理
技能扩展与退化:
- 这也是比较经典的调查结果,现在的工程师更"全栈化" ,处理专长外任务(如后端工程师快速构建复杂 UI,研究人员用 Claude 创建前端可视化,对齐团队用 Claude 实验,安全团队分析代码影响)
- 当然,对于 Claude 的开发者而已,他们也有技能退化的忧虑,担心这样大幅度减少了动手实践,胡导致代码编写和审阅技能弱化,影响监督能力,一些工程师反应会通过定期"无 AI 练习"应对焦虑
社会与职业转变:
- AI 带来的最直接影响之一,人与人的互动更少了,每个人都更像是一个独立的"超级个体"与 AI 结对编程,而非与团队协作
- 受访者情绪分裂:短期多数人对扩展能力与效率提升持乐观,但也有人担心长远会被 AI 替代或角色被彻底改写
可以看到,职业认同的危机不只是外部开发者有, Claude 内部开发者也有这个焦虑,这种心态大概是:
"我以为我喜欢写代码,其实我只是喜欢代码跑通的结果"。
所以未来 AI 对于开发者的影响,还可能会带来新的职业价值观的重构,所以有人感到迷茫:如果写代码这个动作本身不再重要,那么以后作为软件工程师的身份认同建立在哪里?
另外,AI 也不是完完全全就减少了开发者的工作时间,在报告里可以看到,因为 AI 也导致了一些开发者的工作随机反着增加了:
- 正向的"更多时间" :以前因为太难或太繁琐而通过"放弃"来处理的任务,现在工程师愿意花时间去攻克了
- 负向的"更多时间" :盲目信任 AI 生成的代码,结果把自己逼进了死胡同,最后不得不花大量时间去调试和清理 AI 留下的烂摊子,这也增加了"认知负荷",毕竟阅读和理解别人(或 AI)写的代码,往往比自己写更累
可以看到,Anthropic 这篇数据虽然只是内部调研,但是也很直观反映了当前的一些情况,随着 AI 的流行,整个开发结构也在发生变化,最明显就是开发者的边界在慢慢打破:
- 后端可以通过 AI 构建 UI ,算法团队可以自己搭建可视化数据拓展,开发者的边界越来越模糊,工程师变得更 "full-stack",更敢去处理以往不熟悉的领域(前后端、数据库、数据可视化等),因为 Claude 能覆盖很多低上下文或易校验任务
- AI 很擅长做大量"papercut"(小修小补、局部消重构、写测试、生成文档)以及加速调试/理解代码,从而让同一时间段内"输出量"提升明显,开发者更聚焦在需求理解和业务领域
另外,报告里也提到了:
"人们通常把 AI 当作一辆更快的车,但如果你拥有一百万匹马,你可以同时测试无数个想法。"
这也是一个典型代表,在 AI 时代的工程模式发生了转变,以前从线性的"构思-编码-测试",可以转变为并行的"多路径探索",工程师的角色从"搬砖者"变成了"指挥官",指挥 AI 牛马去尝试不同的解决方案,然后人类来挑选最好的一个。
这对于不差 token 的 Claude 内部员工来说无疑是 Free 的。
当然,Anthropic 员工是"内圈"样本,结论不能直接外推到非科技行业或不同规模公司,但是从报告所反映的短期/中期效应,长期劳动力结构变化、工资分配与职业路径变化都有不错的参考价值:
AI 能显著增加产量并扩展个人可承担任务的范围,但同时带来技能退化风险、团队协作减少与职业不确定感。
总的来说,Anthropic 的这份报告可以反射出一个正在发生的现实:
- AI 已经不仅仅是工具,它已经在慢慢改变你的工作方式和职业生涯
- 红利与债务并存:使用 AI 在获得了巨大的生产力红利(产出增加、门槛降低),但也背负了潜在的隐性债务(技能空心化、社交隔离)
- 未来的关键能力 :在 AI 时代,工程师的核心竞争力可能不再是"写出完美的语法",而是 "定义问题"、"设计验证机制"以及"跨领域的系统性思维" 等
所以,这不仅是 Anthropic 内部的故事,也是整个软件行业即将面临的"预告片" 。