我特意去翻了一下自己过去两年与 AI 编程相关的收藏。
从 2023 年初到现在,刚出 GPT-4 的那阵子,各种"让 GPT 变身资深工程师的 100 句咒语";后来 Cursor 火起来,又出了一轮".cursorrules 模板大全";再后来 Claude Code、各家 Agent 工具起来,又迎来了一轮"最强 workflow 模板"。
最近重新过了一遍。能让我"哦,这个还是对的"的------不多。剩下的那些,要么在讲一个早就不存在的工具,要么在讲一个早就升级过的模型,要么在教一种早就被官不推荐的写法。
更让我有点扎心的是------我自己也写过几篇这样的文章。在公司内网、在团队群里、甚至在某次分享上,我把当时觉得"这就是真理"的东西讲给别人听。回头看,那些 PPT 里的最佳实践,过期得比我想象的还快。
所以这篇文章不是要骂哪个教程作者。骂他们没意义------他们当年和我一样,都觉得自己抓住了某个会留下来的东西。
我只想搞清楚一件事:为什么这两年我们抓的那些"经验",绝大多数都没留下来?到底是哪里出了问题?
一、我自己抄过、推过、最后又删掉的三波"经验"
先讲点具体的。三件都是我自己干过的事,不是别人的。
第一波,"咒语模板"
2023 年,我从网上抄过一堆"让 GPT 变身资深工程师"的开场语。
"Act as a senior software engineer with 20 years of experience..." 这一类开头不一而足。还有那句一度被论文盖章的 "Take a deep breath and think step by step",据说能让推理准确率显著提升。我当时把它当圣旨------每次开新对话,都习惯性地贴上这么一段。
到了 GPT-4 中后期,我开始觉得不太对:贴和不贴,差别没那么明显。再到 Claude 3.5、GPT-4o、Claude 4、GPT-5 这一代,这段开头不仅没用,反而开始反向干扰------你写得越花哨,模型越容易陷进一种"角色扮演"的语气里,原本能直接给的结构化答案,被你那句"20 年经验资深工程师"绕远了。
那些咒语现在拿出来看,每句单独拎出来都有当时的逻辑,合在一起,就是一个时代的笑话。
第二波,"项目级 rules 模板"
2024 年,团队全面切到 Cursor 的时候,我跟着社区一起赶过一轮 ".cursorrules 热"。
仓库里的模板一拽一堆,按语言分块、按框架分块,变个底只要"粘上就能用"。我也在团队里推过------"以后大家提交代码前先把这个 rules 文件拷进项目"。
效果有吗?有一点。但很快就发现两个问题。
一个是 rules 越长,模型反而越糊涂。你以为复杂的约束都被记住了,实际上模型未必都看,看了未必记,记了未必用。写 rules 的人在自我感动,模型该幻觉还是幻觉。另一个是 Cursor 自己一直在变------从 .cursorrules 到 .cursor/rules/,从单文件到多文件分层,每次 Cursor 一更新,原来那份模板都要回炉重写一遍。维护它的成本,很快超过了它带来的收益。
后来我还在用 Cursor,但 rules 文件已经从"最佳实践大全"瘦到只剩下项目里真正不一样的那几条约定。多出来的那些"通用佳作"------删了,没人想念。
第三波,"Agent workflow 模板"
2025 年,Claude Code、各家 Agent 工具开始盛行,我又开始搞 workflow 了。
什么"先 plan 再 act 再 review"的三步法,什么"主 Agent 调度子 Agent"的编排模板,什么"用一个独立 review agent 校验主 agent 输出"的双层结构。
现在再看那张流程图,我心里清楚------它撑不过多久。Claude Code 自己就在演化,模型本身的规划能力也在演化,今天必须人工编排的步骤,下一个版本可能就内置进去了。
而我已经是第三次干这种事了。第一次是 prompt 模板,第二次是 rules 模板,第三次是 workflow 模板。形态在变,我犯的错却是同一个。
到这里,我开始反思一个我之前一直没正面回答的问题:
我每次都觉得自己抓住了"AI 编程的最佳实践",可为什么每一次都过期得这么快?
不是我不努力。也不是写教程的那些人不努力。
是我们抓的那个东西本身------就是会过期的。
二、那些会过期的"经验",有一个共同的影子
我把三次踩过的坑放到一起看,又重新扫了一遍那些收藏,发现一件挺有意思的事------
绝大多数会过期的"经验",都依附在一个具体的实现上。
依附于某一版模型("GPT-4 喜欢这样写 prompt")。 依附于某一版 IDE(".cursorrules 应该这样配")。 依附于某一个工具的某个功能("Cursor 的 Composer 这样用最爽")。 依附于某一种工作流("先 plan 再 act 再 review")。
而这些被依附的东西,全都是这一两年才出现、明天就可能再大改一次的东西。
模型一升级,依附在它上面的那一层经验就废了。IDE 一改版,依附在它上面的那一层经验也废了。工具一换、工作流一调,全跟着废。
我之前一直把这些"经验"当作真本事在攒,这两年下来,它们其实一直在我手里融化。我以为我攒了一筐石头,回头看,是一筐冰。
这就是绝大多数 AI 编程教程会过期的真正原因------它们没教错具体的招式。它们错在把招式当成了内功。 而招式天然就是会随兵器和场子一起换的。
三、那一小部分没过期的,是什么
讲到这里,反而那个更有意思的问题浮出来了:
有没有什么东西,这两年没变?
我又往回翻,把那些"重读还觉得对"的内容挑出来,一字一句过。挑完之后我自己有点意外------它们全都不在讲工具,全都在讲模型本身。
讲模型是怎么做下一个 token 概率采样的、讲它为什么没有"事实"这个概念、讲它的输出为什么会被前文条件分布带着走。讲长上下文为什么会"中段失忆"、讲为什么 RAG 在某些场景反而比直接塞全文更糟、讲什么信息塞在窗口前面和后面效果不一样。讲 Agent 的"自主性"本质上不过是模型在每一步选 token 时是否带工具调用、讲 Agent 链条变长之后幻觉为什么会自我复用。
这些东西从 GPT-3.5 时代到今天,没改。
模型从 70B 涨到 1T,上下文从 8K 涨到 200 万 token,工具从 Copilot 换到 Cursor 换到 Claude Code------它们一直站在那。
为什么?不是因为它们写得多高深,是因为它们讲的不是某个工具该怎么用,讲的是这台机器本身的工作机制。
机器本身的工作机制,不会因为换了个 UI 就变。基于机器机制衍生出来的工具会,而且会反复地变。
教程的问题,就是绝大多数都在教会变的那一层。
而真正不会变的那一层,写起来不性感、流量也低,反而很少有人写。
四、调整之后,我现在怎么"学" AI
想清楚这件事之后,我学 AI 的方式整个就变了。
我不再保存"100 句神奇 prompt",也不再追"最强 workflow"。我换了三件事在做。
第一件,看到任何一个新教程,我先问自己一个问题:它解释了背后的"为什么"吗?
如果它通篇都在说"第一步点这里、第二步配这个、第三步贴这段"------那它的保鲜期撑不到下个季度,可以快速浏览,不要花时间记。如果它在告诉我"为什么模型在这种情况下会失败、所以我们要在那一层加约束"------那才值得花时间嚼,因为只要模型还是这台机器,这个原因就一直在。
第二件,看到一个有用的招式,我不再去背招式,我去还原它背后的原理。
它让我"在 prompt 里加 examples"------为什么?因为 few-shot 在收紧概率分布。 它让我"先生成大纲再生成正文"------为什么?因为长生成里前面的 token 会成为后面的条件。 它让我"用一个独立 review agent 检查"------为什么?因为同一个上下文里模型很难自我纠错。
把每一个招式都还原回它背后的原理,原理记住了,招式过期了你还能自己再造一个。这件事比收藏一百个模板实在得多。
第三件,每次有新工具、新框架,我先问一个问题:它改的是哪一层?
如果它没改变模型的工作机制、没改变上下文组织方式、没改变 Agent 循环的结构------那它就是上一代东西的微调,值得知道,不值得为它重写工作流。
如果它改的是底层(比如长上下文真正可用、比如工具调用从 prompt 进了训练、比如规划能力从外置变成内置)------那才值得花时间深入,因为它会改变你之前所有判断的前提。
这条原则这一两年下来,我自己估算,起码省掉了不少不必要的"追新成本"。我没追每一个新工具,但需要用某个工具的时候,我能在不长的时间里判断出它能不能用、用在哪里、有什么坑。
这件事的杠杆,比"追十个新工具"高得多。
五、回到那个标题
写到这里,可以回到开头那个有点"标题党"的标题了。
两年的收藏,最后能留下来的几乎没什么------这是真的。但"剩下的为什么过期"这件事,我的判断不是它们错,也不是写的人不专业。
是它们赌错了一件事:
它们赌的是这一版工具、这一版模型、这一版工作流会稳定下去,所以围着它精心打磨一圈招式。
可这一代 AI 工具最不像样的特点恰恰就是------它一定不会稳定。它会以一种过去任何技术栈都没经历过的速度,把自己今天的样子推翻。
在这种速度面前,任何依附于具体实现的"经验",都是负债,不是资产。它在你以为自己在攒东西的时候,悄悄在你手里融化。
真正的资产,只有一种------对这台机器本身的理解。这种理解越深,你越不需要任何"教程"。看到一个新工具,心里立刻有一把尺,知道它的边界、它的限度、它能不能用在你的场景里。
你会从"被教程拖着走",变成"自己拿着尺子判断"。
这是这两年我最贵的一个学习教训。也是我做这件事之前,最想先把它写下来的原因。
写在最后
也是因为这件事,我下定决心做了一件可能"很不讨好"的事------
写一本完全不教招式、只讲原理的 AI 编程书。
不写"100 个最佳 prompt",不写"Cursor 配置全攻略",不写"Claude Code workflow 模板"。这些东西网上有的是,每三个月就会被新一波取代。
我只想做一件事:把 AI 编程从底层原理一层层推上来,让你心里有一把不会过期的尺。下次再有新工具、新模型、新争论冒出来,你不再需要追教程,自己就能判断它值不值得花时间。
这本书叫《AI 编程的第一性原理》,已经放到 GitHub 上,免费、开源、可全文阅读。
仓库地址:github.com/caozhiyi/ai...
如果你也曾收藏过一堆"最佳实践",过两个月发现几乎都得重学一遍;如果你也想从"追教程"里跳出来------欢迎来读。
技术发展的车轮滚滚向前。这两年我们以为攒下来的那些经验,绝大多数会被后面的浪头一波一波打散。能留在手里的,只有那些跟具体工具无关的东西。
愿我们都不在融化的冰上盖楼,把房子盖在不会变的那一层上。