收藏了两年 AI 编程教程，最后能留在手里的几乎没什么

我特意去翻了一下自己过去两年与 AI 编程相关的收藏。

从 2023 年初到现在，刚出 GPT-4 的那阵子，各种"让 GPT 变身资深工程师的 100 句咒语"；后来 Cursor 火起来，又出了一轮".cursorrules 模板大全"；再后来 Claude Code、各家 Agent 工具起来，又迎来了一轮"最强 workflow 模板"。

最近重新过了一遍。能让我"哦，这个还是对的"的------不多。剩下的那些，要么在讲一个早就不存在的工具，要么在讲一个早就升级过的模型，要么在教一种早就被官不推荐的写法。

更让我有点扎心的是------我自己也写过几篇这样的文章。在公司内网、在团队群里、甚至在某次分享上，我把当时觉得"这就是真理"的东西讲给别人听。回头看，那些 PPT 里的最佳实践，过期得比我想象的还快。

所以这篇文章不是要骂哪个教程作者。骂他们没意义------他们当年和我一样，都觉得自己抓住了某个会留下来的东西。

我只想搞清楚一件事：为什么这两年我们抓的那些"经验"，绝大多数都没留下来？到底是哪里出了问题？

一、我自己抄过、推过、最后又删掉的三波"经验"

先讲点具体的。三件都是我自己干过的事，不是别人的。

第一波，"咒语模板"

2023 年，我从网上抄过一堆"让 GPT 变身资深工程师"的开场语。

"Act as a senior software engineer with 20 years of experience..." 这一类开头不一而足。还有那句一度被论文盖章的 "Take a deep breath and think step by step"，据说能让推理准确率显著提升。我当时把它当圣旨------每次开新对话，都习惯性地贴上这么一段。

到了 GPT-4 中后期，我开始觉得不太对：贴和不贴，差别没那么明显。再到 Claude 3.5、GPT-4o、Claude 4、GPT-5 这一代，这段开头不仅没用，反而开始反向干扰------你写得越花哨，模型越容易陷进一种"角色扮演"的语气里，原本能直接给的结构化答案，被你那句"20 年经验资深工程师"绕远了。

那些咒语现在拿出来看，每句单独拎出来都有当时的逻辑，合在一起，就是一个时代的笑话。

第二波，"项目级 rules 模板"

2024 年，团队全面切到 Cursor 的时候，我跟着社区一起赶过一轮 ".cursorrules 热"。

仓库里的模板一拽一堆，按语言分块、按框架分块，变个底只要"粘上就能用"。我也在团队里推过------"以后大家提交代码前先把这个 rules 文件拷进项目"。

效果有吗？有一点。但很快就发现两个问题。

一个是 rules 越长，模型反而越糊涂。你以为复杂的约束都被记住了，实际上模型未必都看，看了未必记，记了未必用。写 rules 的人在自我感动，模型该幻觉还是幻觉。另一个是 Cursor 自己一直在变------从 .cursorrules 到 .cursor/rules/，从单文件到多文件分层，每次 Cursor 一更新，原来那份模板都要回炉重写一遍。维护它的成本，很快超过了它带来的收益。

后来我还在用 Cursor，但 rules 文件已经从"最佳实践大全"瘦到只剩下项目里真正不一样的那几条约定。多出来的那些"通用佳作"------删了，没人想念。

第三波，"Agent workflow 模板"

2025 年，Claude Code、各家 Agent 工具开始盛行，我又开始搞 workflow 了。

什么"先 plan 再 act 再 review"的三步法，什么"主 Agent 调度子 Agent"的编排模板，什么"用一个独立 review agent 校验主 agent 输出"的双层结构。

现在再看那张流程图，我心里清楚------它撑不过多久。Claude Code 自己就在演化，模型本身的规划能力也在演化，今天必须人工编排的步骤，下一个版本可能就内置进去了。

而我已经是第三次干这种事了。第一次是 prompt 模板，第二次是 rules 模板，第三次是 workflow 模板。形态在变，我犯的错却是同一个。

到这里，我开始反思一个我之前一直没正面回答的问题：

我每次都觉得自己抓住了"AI 编程的最佳实践"，可为什么每一次都过期得这么快？

不是我不努力。也不是写教程的那些人不努力。

是我们抓的那个东西本身------就是会过期的。

二、那些会过期的"经验"，有一个共同的影子

我把三次踩过的坑放到一起看，又重新扫了一遍那些收藏，发现一件挺有意思的事------

绝大多数会过期的"经验"，都依附在一个具体的实现上。

依附于某一版模型（"GPT-4 喜欢这样写 prompt"）。依附于某一版 IDE（".cursorrules 应该这样配"）。依附于某一个工具的某个功能（"Cursor 的 Composer 这样用最爽"）。依附于某一种工作流（"先 plan 再 act 再 review"）。

而这些被依附的东西，全都是这一两年才出现、明天就可能再大改一次的东西。

模型一升级，依附在它上面的那一层经验就废了。IDE 一改版，依附在它上面的那一层经验也废了。工具一换、工作流一调，全跟着废。

我之前一直把这些"经验"当作真本事在攒，这两年下来，它们其实一直在我手里融化。我以为我攒了一筐石头，回头看，是一筐冰。

这就是绝大多数 AI 编程教程会过期的真正原因------它们没教错具体的招式。它们错在把招式当成了内功。 而招式天然就是会随兵器和场子一起换的。

三、那一小部分没过期的，是什么

讲到这里，反而那个更有意思的问题浮出来了：

有没有什么东西，这两年没变？

我又往回翻，把那些"重读还觉得对"的内容挑出来，一字一句过。挑完之后我自己有点意外------它们全都不在讲工具，全都在讲模型本身。

讲模型是怎么做下一个 token 概率采样的、讲它为什么没有"事实"这个概念、讲它的输出为什么会被前文条件分布带着走。讲长上下文为什么会"中段失忆"、讲为什么 RAG 在某些场景反而比直接塞全文更糟、讲什么信息塞在窗口前面和后面效果不一样。讲 Agent 的"自主性"本质上不过是模型在每一步选 token 时是否带工具调用、讲 Agent 链条变长之后幻觉为什么会自我复用。

这些东西从 GPT-3.5 时代到今天，没改。

模型从 70B 涨到 1T，上下文从 8K 涨到 200 万 token，工具从 Copilot 换到 Cursor 换到 Claude Code------它们一直站在那。

为什么？不是因为它们写得多高深，是因为它们讲的不是某个工具该怎么用，讲的是这台机器本身的工作机制。

机器本身的工作机制，不会因为换了个 UI 就变。基于机器机制衍生出来的工具会，而且会反复地变。

教程的问题，就是绝大多数都在教会变的那一层。

而真正不会变的那一层，写起来不性感、流量也低，反而很少有人写。

四、调整之后，我现在怎么"学" AI

想清楚这件事之后，我学 AI 的方式整个就变了。

我不再保存"100 句神奇 prompt"，也不再追"最强 workflow"。我换了三件事在做。

第一件，看到任何一个新教程，我先问自己一个问题：它解释了背后的"为什么"吗？

如果它通篇都在说"第一步点这里、第二步配这个、第三步贴这段"------那它的保鲜期撑不到下个季度，可以快速浏览，不要花时间记。如果它在告诉我"为什么模型在这种情况下会失败、所以我们要在那一层加约束"------那才值得花时间嚼，因为只要模型还是这台机器，这个原因就一直在。

第二件，看到一个有用的招式，我不再去背招式，我去还原它背后的原理。

它让我"在 prompt 里加 examples"------为什么？因为 few-shot 在收紧概率分布。它让我"先生成大纲再生成正文"------为什么？因为长生成里前面的 token 会成为后面的条件。它让我"用一个独立 review agent 检查"------为什么？因为同一个上下文里模型很难自我纠错。

把每一个招式都还原回它背后的原理，原理记住了，招式过期了你还能自己再造一个。这件事比收藏一百个模板实在得多。

第三件，每次有新工具、新框架，我先问一个问题：它改的是哪一层？

如果它没改变模型的工作机制、没改变上下文组织方式、没改变 Agent 循环的结构------那它就是上一代东西的微调，值得知道，不值得为它重写工作流。

如果它改的是底层（比如长上下文真正可用、比如工具调用从 prompt 进了训练、比如规划能力从外置变成内置）------那才值得花时间深入，因为它会改变你之前所有判断的前提。

这条原则这一两年下来，我自己估算，起码省掉了不少不必要的"追新成本"。我没追每一个新工具，但需要用某个工具的时候，我能在不长的时间里判断出它能不能用、用在哪里、有什么坑。

这件事的杠杆，比"追十个新工具"高得多。

五、回到那个标题

写到这里，可以回到开头那个有点"标题党"的标题了。

两年的收藏，最后能留下来的几乎没什么------这是真的。但"剩下的为什么过期"这件事，我的判断不是它们错，也不是写的人不专业。

是它们赌错了一件事：

它们赌的是这一版工具、这一版模型、这一版工作流会稳定下去，所以围着它精心打磨一圈招式。

可这一代 AI 工具最不像样的特点恰恰就是------它一定不会稳定。它会以一种过去任何技术栈都没经历过的速度，把自己今天的样子推翻。

在这种速度面前，任何依附于具体实现的"经验"，都是负债，不是资产。它在你以为自己在攒东西的时候，悄悄在你手里融化。

真正的资产，只有一种------对这台机器本身的理解。这种理解越深，你越不需要任何"教程"。看到一个新工具，心里立刻有一把尺，知道它的边界、它的限度、它能不能用在你的场景里。

你会从"被教程拖着走"，变成"自己拿着尺子判断"。

这是这两年我最贵的一个学习教训。也是我做这件事之前，最想先把它写下来的原因。

写在最后

也是因为这件事，我下定决心做了一件可能"很不讨好"的事------

写一本完全不教招式、只讲原理的 AI 编程书。

不写"100 个最佳 prompt"，不写"Cursor 配置全攻略"，不写"Claude Code workflow 模板"。这些东西网上有的是，每三个月就会被新一波取代。

我只想做一件事：把 AI 编程从底层原理一层层推上来，让你心里有一把不会过期的尺。下次再有新工具、新模型、新争论冒出来，你不再需要追教程，自己就能判断它值不值得花时间。

这本书叫《AI 编程的第一性原理》，已经放到 GitHub 上，免费、开源、可全文阅读。

仓库地址：github.com/caozhiyi/ai...

如果你也曾收藏过一堆"最佳实践"，过两个月发现几乎都得重学一遍；如果你也想从"追教程"里跳出来------欢迎来读。

技术发展的车轮滚滚向前。这两年我们以为攒下来的那些经验，绝大多数会被后面的浪头一波一波打散。能留在手里的，只有那些跟具体工具无关的东西。

愿我们都不在融化的冰上盖楼，把房子盖在不会变的那一层上。