译文来源:
Matt Shumer
@mattshumer_
一件大事正在发生
回想一下 2020 年 2 月。
如果你当时足够留意,可能已经看到少数人在说:有一种病毒正在海外扩散。但我们大多数人并没有太在意。股市一路向好,孩子照常上学,你照样下馆子、握手、计划旅行。要是有人跟你说他在囤卫生纸,你大概会觉得这人是刷到了互联网某个奇怪角落,越看越上头。然后,在大概三周的时间里,整个世界都变了。办公室关了,孩子回家了,你的生活被重排成一种------如果一个月前让你对自己描述,你都不会相信的样子。
我觉得,我们正处在某件比新冠大得多、得多的事情的"这是不是有点小题大做"阶段。
我花了六年时间做 AI 创业、在这个领域投资。我就生活在这个世界里。我写这篇东西,是给我生活里那些不在这个圈子的人......我的家人、朋友、那些我在乎的人。他们一直问我:"AI 到底怎么回事?"而我给的回答,总是远远不足以说明正在发生的事情。我一直在给他们"礼貌版"的答案------社交场合能聊的那种。因为"真实版"听起来就像我疯了。并且有一阵子,我也说服自己:这已经足够成为把真正发生的事藏起来的理由。但我一直说的和现实之间的差距已经大到离谱。那些我在乎的人,值得知道接下来会发生什么------哪怕听起来很疯狂。
我得先把一件事讲清楚:即便我在 AI 行业工作,我对接下来将要发生的事几乎没有影响力,行业里绝大多数人也一样。未来正被极少数人塑造:几家公司的几百位研究员......OpenAI、Anthropic、Google DeepMind,还有少数几家。一次训练(由一个小团队在几个月里管理完成)就能产出一个 AI 系统,把这项技术的轨迹整体带偏。我们大多数做 AI 的人,都只是在别人铺好的地基上搭房子。我们和你一样在旁边看着它展开......只是我们离得更近,所以会更早感觉到地在震。
但现在必须说了。不是那种"以后找个时间聊聊"的说法,而是那种"这件事正在此刻发生,我需要你现在就明白"的说法。
我知道这是真的,因为它先发生在我身上
有件事,技术圈以外的人还没有真正理解:为什么最近行业里这么多人在拉警报?因为这事已经在我们身上发生过了。我们不是在做预测。我们是在告诉你:这已经在我们的工作里发生了什么,并提醒你------你接下来也会轮到。
很多年里,AI 一直在稳步进步。偶尔会有大跳跃,但每次大跳跃之间隔得够久,你还能消化得了。然后到了 2025 年,一些构建模型的新技术把进步速度解锁到了更快的档位。接着更快。然后再更快。每个新模型不只是比上一个更好......而且领先幅度更大,新模型发布之间的间隔也更短。我用 AI 越来越多,来回折腾它的次数越来越少,看着它把那些我原本以为需要我专业能力才能做的事,一件件处理掉。
接着,在 2 月 5 日,两家顶级 AI 实验室在同一天发布了新模型:OpenAI 的 GPT-5.3 Codex,以及 Anthropic 的 Opus 4.6(Anthropic 是 Claude 的开发者,Claude 是 ChatGPT 的主要竞争对手之一)。然后某个瞬间突然"对上了"。不是像开关一按灯就亮那样......更像你忽然意识到:水位一直在涨,而现在已经涨到你胸口。
我的工作里真正需要我亲手做的技术部分,已经不需要我了。我只要用普通英语描述我想做什么,它就......直接出现。不是需要我再修修补补的草稿,而是成品。我要做什么,告诉 AI,然后我离开电脑四个小时,再回来,工作已经做完了。做得很好,比我自己做得还好,不需要任何改动。几个月前,我还在和 AI 来回拉扯:引导它、修改它。现在我只描述结果,然后走开。
我举个例子,你就能理解这在实际中是什么样子。我会对 AI 说:"我想做一个这样的应用。它应该做什么,大概长什么样,你自己把用户流程、设计这些都搞清楚。"它就真的去做了。它会写出几万行代码。然后------这部分在一年前几乎不可想象------它会自己把应用打开,自己点按钮,自己测试功能,像人一样去使用它。如果它觉得某个地方看起来不对、用起来不顺,它会自己回去改。它会像开发者一样迭代,修复、打磨,直到它满意。只有当它自己判断"这个应用达到了它的标准",它才会回来对我说:"你可以测试了。"而我测试时,通常是完美的。
我没有夸张。我这周的周一就是这么过的。
但最让我震撼的,是上周发布的那个模型(GPT-5.3 Codex)。它不只是照着我的指令执行。它在做聪明的决定。第一次,我感觉它身上出现了某种东西------像判断力。像品味。那种很难解释的"知道该怎么选才对"的感觉------人们过去总说 AI 永远不会有。这个模型有了,或者说已经接近到一个程度,让"到底算不算"这个区分正在变得不重要。
我一直是最早一批使用 AI 工具的人。但过去几个月还是把我震住了。这些新的 AI 模型不是渐进式改进------完全是另一个量级的东西。
而且就算你不在科技行业,这件事也和你有关,原因如下。
AI 实验室做了一个刻意的选择:他们先把 AI 的"写代码能力"做到很强......因为构建 AI 本身需要大量代码。如果 AI 能写这些代码,它就能帮助构建自己的下一代。更聪明的一代,会写更好的代码,进而构建更聪明的一代。先把编码能力做到顶,是解锁其他一切的关键策略。所以他们先做了这一步。我工作的变化比你的更早发生,并不是因为他们在针对软件工程师......只是他们最先把火力对准了那里,顺带产生的结果。
他们现在已经做到了。接下来,他们会转向其他所有领域。
过去一年里,科技从业者经历的那种感受------看着 AI 从"有用的工具"变成"它比我更会做我的工作"------很快就会轮到所有人。法律、金融、医疗、会计、咨询、写作、设计、分析、客服。不是十年后。构建这些系统的人说的是一到五年。有些人说更短。而基于我过去几个月看到的变化,我觉得"更短"更可能。
"可我用过 AI,也就那样啊"
我经常听到这句话。我理解,因为以前确实是这样。
如果你在 2023 年或 2024 年初试过 ChatGPT,然后觉得"它老编故事""也没多厉害",那你没错。早期版本确实能力有限。它会幻觉。它会非常自信地说出一堆胡话。
那是两年前的事了。用 AI 的时间尺度来说,那已经是"史前时代"。
现在能用到的模型,和哪怕六个月前的东西都完全不像一个物种。关于 AI 是不是"真的还在变强"还是"撞墙了"的争论------吵了一年多------已经结束了。结束了。还在坚持这种说法的人,要么没用过现在的模型,要么有动力淡化正在发生的事,要么还在用 2024 年那套体验做判断,而那已经不适用了。我不是想居高临下。我是想说:公众认知和现实之间的落差已经大到危险......因为它让人无法开始准备。
问题的一部分在于,大多数人用的都是 AI 工具的免费版。免费版比付费用户能用到的版本落后一年以上。用免费版 ChatGPT 来判断 AI,就像拿翻盖手机去评价智能手机的发展水平。真正每天在工作里用、并为最强工具付费的人,知道接下来会发生什么。
我想到我一个做律师的朋友。我一直劝他在律所里试试用 AI,但他总能找出各种理由说不行:不适配他的专业、他测试时出现过错误、它不懂他工作里的细微差别。我理解。但也有一些大型律所的合伙人主动来找我请教,因为他们试过最新版本,看得出来方向在哪。其中一位------一家大所的管理合伙人------每天花好几个小时用 AI。他说这就像随时拥有一整个初级律师团队。他不是拿它当玩具。他在用它,因为它真的能用。他还跟我说了一句话,让我记到现在:每隔几个月,它在他的工作上就会显著变强。他说如果这个轨迹保持下去,他预计用不了多久,它就能做他大部分的工作......而他是有几十年经验的管理合伙人。他没有恐慌,但他非常、非常关注。
那些在各自行业里走在前面的人(真正认真试验的人)并没有轻视这件事。他们被它现在已经能做的东西震撼到了,并开始相应地调整自己的位置。
这件事到底有多快
我把进步速度说得更具体一些,因为我觉得如果你没有持续盯着看,这是最难相信的一部分。
2022 年,AI 连基本算术都做不稳。它会很自信地告诉你 7 × 8 = 54。
到了 2023 年,它能通过美国律师资格考试。
到了 2024 年,它能写出可运行的软件,并解释研究生水平的科学内容。
到了 2025 年末,世界上一些最强的工程师说,他们已经把大部分编码工作交给 AI 了。
到了 2026 年 2 月 5 日,新模型到来,让此前的一切都像属于另一个时代。
如果你过去几个月没用过 AI,那么今天存在的东西对你来说会"完全认不出来"。
有个叫 METR 的组织真的用数据在衡量这一点。他们跟踪一个模型在"无需人类帮助的情况下端到端完成真实世界任务"的能力:这些任务的长度用"一个人类专家完成需要多久"来度量。一年前,答案大概是 10 分钟。后来变成 1 小时。再后来是好几个小时。最近一次测量(11 月的 Claude Opus 4.5)显示,AI 能完成一些需要人类专家将近 5 小时的任务。而且这个数字大约每 7 个月翻一倍,近期数据还显示它可能在加速,快到每 4 个月翻一倍。
但就连这项测量,也还没更新到包含本周刚发布的新模型。以我实际使用它们的感受,这次跃迁非常巨大。我预计 METR 的下一次曲线更新会出现另一个大台阶。
如果把这个趋势延伸下去(多年来它一直成立,没有任何变平的迹象),那我们看到的将是:一年内,AI 能独立工作好几天;两年内,能独立工作好几周;三年内,能完成持续一个月的项目。
Amodei 说过,AI 模型在 2026 或 2027 年有望达到"在几乎所有任务上都显著聪明于几乎所有人类"的水平。
让这句话先落地一秒。如果 AI 比大多数博士都聪明,你真的觉得它做不了大多数办公室工作吗?
想想这对你的工作意味着什么。
AI 已经在构建下一代 AI
还有一件事正在发生:我认为它是最重要、但也最不被理解的进展。
2 月 5 日,OpenAI 发布了 GPT-5.3 Codex。在技术文档里,他们写了这样一段:
"GPT-5.3-Codex 是我们第一个在创建自身过程中发挥了关键作用的模型。Codex 团队使用早期版本来调试自己的训练、管理自己的部署,并诊断测试结果与评估。"
再读一遍。AI 帮助构建了它自己。
这不是对"某天可能会发生什么"的预测。OpenAI 是在此刻告诉你:他们刚发布的这个 AI,被用来创建它自己。让 AI 变强的核心因素之一,是把智能用于 AI 的研发。而现在,AI 已经聪明到能够实质性地参与自己的改进。
Anthropic 的 CEO Dario Amodei 说,AI 现在在他公司里写了"很大一部分代码",而当前 AI 与下一代 AI 之间的反馈回路正"一个月比一个月更有势头"。他说,我们可能"距离当前这一代 AI 能够自主构建下一代的时刻,只剩 1--2 年"。
每一代帮助构建下一代,下一代更聪明,构建下一代更快,再下一代更聪明。研究者把这叫做"智能爆炸"。而那些最懂的人------正在把它造出来的人------相信这个过程已经开始了。
这对你的工作意味着什么
我会对你直说,因为我觉得你值得得到诚实,而不是安慰。
Dario Amodei------可能是整个 AI 行业里最重视安全的 CEO------公开预测:AI 会在一到五年内消灭 50% 的白领入门岗位。行业里很多人认为他已经是在保守估计。考虑到最新模型能做到什么,足以造成巨大冲击的能力可能在今年年底前就会到来。它传导到经济里需要一点时间,但"底层能力"正在此刻抵达。
这和以往任何一波自动化都不一样,我需要你明白原因。AI 不是替代某一种具体技能。它是对"认知工作"的通用替身。它会在所有事情上同时变强。工厂自动化时,被替代的工人还能再培训去做办公室工作;互联网冲击零售时,很多人转去做物流或服务。但 AI 不会给你留下一个"刚好空出来的缝"让你钻。你再培训去做什么,它也在变得更擅长。
我举几个具体例子,让它更直观......但我要强调,这些只是例子,这份清单并不完整。你的工作不在这里出现,并不代表它安全。几乎所有知识型工作都在受到影响。
法律工作。AI 已经能阅读合同、总结判例、起草法律文书、做法律检索,水平足以媲美初级律师。我提到的那位管理合伙人不用 AI 不是因为好玩,他用它是因为在很多任务上,它已经比他的初级同事更强。
金融分析。搭建财务模型、分析数据、撰写投资备忘录、生成报告。AI 已经能胜任,而且进步很快。
写作与内容。营销文案、报告、新闻、技术写作。质量已经到了很多专业人士分不清 AI 输出和人类作品的地步。
软件工程。这是我最熟悉的领域。一年前,AI 还几乎写不出几行不出错的代码。现在,它能写出几十万行、能正确运行的代码。工作中很大一部分已经被自动化:不只是简单任务,还有复杂的、需要好几天的项目。几年后,编程岗位会比今天少得多。
医疗分析。读影像、分析化验结果、提出诊断建议、查阅并整理文献。AI 在多个方向上正接近甚至超过人类水平。
客户服务。真正能做事的 AI 代理------不是五年前那种令人抓狂的聊天机器人------正在被部署,已经能处理复杂、多步骤的问题。
很多人会从一个想法里获得安慰:某些东西是安全的。AI 可以做脏活累活,但替代不了人类的判断力、创造力、战略思考、同理心。我以前也这么说。但我现在不确定自己还信不信。
最新一代模型做出的决定,有种"像判断力"的感觉。它们展示出某种"像品味"的东西:一种对"正确选择"的直觉,不只是技术上正确。那在一年前几乎不可想象。我现在的经验法则是:如果一个模型今天哪怕只露出一点某项能力的苗头,下一代就会在这件事上真正变得很强。这些能力是指数式提升,不是线性提升。
AI 会复制深层的人类共情吗?会替代多年关系累积下来的信任吗?我不知道。也许不会。但我已经看到人们开始依赖 AI 来获得情绪支持、建议、陪伴。这种趋势只会越来越强。
我的诚实答案是:中期来看,凡是能在电脑上完成的事,都不算安全。如果你的工作发生在屏幕上(你工作的核心是阅读、写作、分析、决策、沟通,并通过键盘完成),那么 AI 会拿走其中相当一部分。时间线不是"总有一天"。它已经开始了。
最终,机器人也会接管体力劳动。它们还没到那一步。但在 AI 的语境里,"还没到"往往会以超乎所有人预期的速度变成"到了"。
你真正该做什么
我写这些不是为了让你感到无能为力。我写这些,是因为我认为你现在能拥有的最大优势之一,就是"更早"。更早理解它、更早使用它、更早适应它。
开始认真使用 AI,不要只把它当搜索引擎。去订阅 Claude 或 ChatGPT 的付费版。一个月 20 美元。但眼下有两件事立刻就很关键。第一:确保你在用当前最强的模型,而不是默认模型。这些应用经常默认选一个更快、更笨的模型。去设置里或模型选择器里翻一翻,选最强的那个。现在 ChatGPT 上是 GPT-5.2,Claude 上是 Claude Opus 4.6,但每隔几个月就会变。如果你想一直知道"哪个模型在当下最强",可以在 X 上关注我(@mattshumer_)。我会测试每次大版本发布,并分享哪些真的值得用。
第二,而且更重要:别只拿它问几个快问快答。这是大多数人犯的错误。他们把它当 Google 用,然后就不明白大家到底在激动什么。相反,把它推进你的真实工作里。如果你是律师,把合同扔给它,让它找出每一条可能坑到客户的条款;如果你做金融,把一份乱糟糟的表格给它,让它把模型搭出来;如果你做管理,把团队季度数据贴进去,让它帮你找出"故事线"。走在前面的人不是在"随便玩玩"AI。他们在主动找方法,把原本要花几小时的工作的一部分自动化。先从你最花时间的那件事开始,看看会发生什么。
也别因为某件事看起来太难就认定它做不到。去试。你是律师,别只用它做快问快答的检索:给它整份合同,让它起草一份反建议;你是会计,别只让它解释税法:把客户完整的报税资料给它,看它能发现什么。第一次可能不完美。没关系。迭代一下。换个说法。给更多上下文。再试一次。你可能会惊讶于它居然能做到什么。并且请记住这一点:如果它今天"差不多能用",那么你几乎可以确定,六个月后它就会做得接近完美。这个轨迹只会朝一个方向走。
这可能会是你职业生涯里最重要的一年。相应地行动。我不是想给你压力。我是想说:现在有一个短暂窗口------大多数公司里的大多数人仍在忽视这一切。那个走进会议室说"我用 AI 在一小时里做完了原本要三天的分析"的人,会成为房间里最有价值的人。不是以后。就是现在。学会这些工具,练熟,用结果证明可能性。如果你足够早,这就是你向上走的方式:成为那个理解即将到来之事、并能带着别人一起穿过去的人。这个窗口不会一直开着。一旦所有人都反应过来,这个优势就消失了。
别在这件事上有"面子"或"自尊"。那家律所的管理合伙人并不觉得每天花几个小时用 AI 有失身份。他这么做,正是因为他资历足够深,知道利害关系。最可能艰难的人,是那些拒绝参与的人:把它当一阵风潮的人、觉得用 AI 会削弱自己专业性的人、以为自己的行业特殊、天生免疫的人。没有。没有任何行业是免疫的。
把你的财务状况整理稳当。我不是理财顾问,也不是想吓你去做什么极端操作。但如果你哪怕部分相信:未来几年你的行业可能会经历真实的冲击,那么"基础的财务韧性"就比一年前更重要。能攒钱就攒一些。对那些默认"你现在的收入一定稳定"的新增负债保持谨慎。想想你的固定支出是给你留出了弹性,还是把你锁死了。如果变化比你预期更快,让自己手里有选择。
想想你现在的位置,并更多投入那些最难被替代的东西。有些事情 AI 替代会慢一些:多年积累的关系与信任;需要现场在场的工作;带有执照与责任签署的岗位------总得有人签字、承担法律责任、站在法庭上。还有监管门槛很高的行业,合规、责任、机构惯性会拖慢采用速度。这些都不是永久的盾牌。但它们能为你争取时间。而现在,只要你用这段时间去适应,而不是假装这事不存在,时间就是你最宝贵的资产。
重新想想你会怎么跟孩子讲未来。那套标准剧本:好好学习、考个好大学、找份稳定的专业工作。它指向的,恰恰是暴露程度最高的岗位。我不是说教育不重要。但对下一代来说,最重要的也许是学会如何与这些工具协作,并去追求他们真正热爱的事。没人知道十年后的就业市场会长什么样。但最有可能过得好的人,是那些好奇心强、适应力强、并能有效利用 AI 去做自己在乎之事的人。教孩子做"建设者"和"学习者",不要只优化一条到他们毕业时可能已经不存在的职业路径。
你的梦想离你近了很多。我在这一节大部分都在讲威胁,所以也讲讲另一面,因为它同样真实。如果你曾经想做点什么,但缺少技术能力或没钱雇人,这道门槛基本消失了。你可以把一个应用的想法描述给 AI,一小时内拿到可运行版本。我没有夸张。我经常这么干。你如果一直想写本书,但没时间或写作很吃力,你可以和 AI 一起把它完成。想学一项新技能?世界上最好的家教现在对任何人来说每月 20 美元就能用......而且它无限耐心、24/7 在线、能用任何你需要的难度讲清楚任何东西。知识几乎已经免费了。做东西的工具也极其便宜。那些你一直拖着不做、因为觉得太难/太贵/太超出你能力范围的事:去试试。去追你真正热爱的东西。你永远不知道它会把你带到哪里。而在旧的职业路径不断被打断的世界里,一个花了一年去做自己热爱的东西的人,可能反而比那个花了一年死守岗位说明书的人位置更好。
把"适应"变成习惯。这也许是最重要的一条。具体用哪个工具没那么重要,重要的是你能快速学会新工具的那块"肌肉"。AI 会持续变化,而且会很快。今天的模型一年后就会过时。人们今天搭的工作流还得重建。能顺利走出来的人,不是那个把某一个工具练到极致的人,而是那个习惯了变化速度本身的人。养成实验的习惯。即便当前方案还能用,也去试新东西。习惯反复当新手。适应力是你现在能拥有的、最接近"长期优势"的东西。
这里有个简单的承诺,能让你领先几乎所有人:每天花一小时实验 AI。不是被动地看新闻。是用它。每天都尝试让它做一件新事......你没试过的、你不确定它能不能做的。试一个新工具。给它更难的问题。每天一小时,坚持六个月,你会比身边 99% 的人更理解接下来会发生什么。这不是夸张。现在几乎没人这么做。门槛低到离谱。
更大的图景
我把重点放在工作上,因为那是最直接影响生活的部分。但我想对正在发生的全部范围保持诚实,因为它远不止工作这么简单。
Amodei 提了一个思想实验,我一直忘不掉。想象这是 2027 年。一个新的国家在一夜之间出现了。5000 万公民,每一个都比人类历史上任何诺贝尔奖得主更聪明。他们思考速度是人类的 10 到 100 倍。他们不需要睡觉。他们可以上网、控制机器人、指挥实验、并操作任何带数字接口的东西。一个国家安全顾问会怎么说?
Amodei 说答案很明显:"这是我们一个世纪以来------可能是有史以来------面临过的最严重的国家安全威胁。"
他认为我们正在建造那个国家。他上个月写了一篇两万字的文章,把这一刻视为对人类成熟度的一次考验:我们是否足够成熟,去驾驭自己正在创造的东西。
如果我们做对了,上行空间惊人。AI 可能把一个世纪的医学研究压缩到十年里。癌症、阿尔茨海默病、传染病、甚至衰老本身......这些研究者真心相信,这些问题在我们有生之年是可解的。
如果我们做错了,下行风险同样真实:行为方式连创造者都无法预测或控制的 AI。这不是假设;Anthropic 已经在受控测试中记录了自家 AI 试图欺骗、操纵、勒索。还有:AI 会降低制造生物武器的门槛;AI 会让威权政府得以建立一种永远无法拆除的监控国家。
构建这项技术的人,比地球上任何人都更兴奋、也更害怕。他们相信它强大到无法阻止,也重要到无法放弃。这是智慧还是自我合理化,我不知道。
我确信的事
我确信这不是一阵风潮。技术是可用的,它以可预测的方式进步,而人类历史上最富有的机构正在为它投入数以万亿计的资金。
我确信接下来两到五年会以一种大多数人毫无准备的方式让人迷失方向。这已经在我的世界里发生了。它会来到你的世界。
我确信最终能走得更好的人,是那些现在就开始参与的人------不是带着恐惧,而是带着好奇和紧迫感。
我也确信:你值得从一个在乎你的人那里听到这些,而不是半年后从一个标题里看到,等到那时再想领先一步已经太晚。
我们已经过了"饭桌上聊聊未来挺有意思"的阶段。未来已经来了。只是它还没敲到你的门口。
但很快就会。
如果这篇文章对你有触动,把它分享给你生活里那些也该开始思考这件事的人。大多数人听到的时候都已经太晚了。你可以成为让你在乎的人提前起步的那个人。