Andrej Karpathy的最新帖子：分层的大模型辅助编程实践

继续探索最佳的大模型辅助编程体验。特别是，我发现与其追求某个"完美"的单一方式，我的使用习惯正在逐渐多元化------把几种工作流拼接起来，取长补短。

对我个人来说，最核心的方式（大约占了 75%？）依旧是 （Cursor 的）Tab 补全。原因是我觉得自己在正确的地方写下具体的代码或注释，是一种高带宽的方式来向 LLM 传达"任务说明"。换句话说，这主要是关于"任务规格"的传递------如果完全靠文字描述，我需要花费太多比特和等待太高的延迟，不如直接在代码里、在对应的位置示范我想要什么。有时 Tab 补全模型会让我烦恼，所以我经常开开关关。

更高一层的方式，是 选中一段具体代码并请求某种修改。

再往上一层，是 Claude Code / Codex / 等工具 ，它们运行在 Cursor 旁边。我会在需要较大功能块时使用它们，这些功能块也相对容易用 prompt 指定。这些工具确实很有帮助，但整体上仍然参差不齐，有点让人沮丧。我不会"YOLO 式"地全盘放手交给它们，因为它们有时会跑偏，做一些我完全不需要的事，于是我经常要按 ESC 打断。我也还没学会如何同时高效地使用多个实例------一个已经够难管理了。我也没有找到一个好的方法来保持 CLAUDE.md 文件的更新和整洁。我常常需要自己做一遍"清理"，比如统一代码风格或者符合个人"代码品味"的地方。比如它们常常过于防御性，滥用 try/catch；它们经常过度复杂化抽象；代码往往很臃肿（用多层嵌套 if-else，而不是列表推导或一行的 if-then-else）；有时还会复制粘贴大段代码，而不是抽取成一个简洁的 helper 函数。简单说，它们基本没有"品味"。但在某些我不熟悉的领域（比如最近写的 Rust、SQL，或者其他我没怎么碰过的东西）里，它们是不可替代的。我也试过让 Claude Code 一边写代码一边教我，但完全没效果------它真的只想写代码，完全不想解释。我还试过让 Claude Code 做超参数调优，结果非常滑稽。除此之外，它们在各种低风险的一次性可视化、工具或调试任务上非常有用。如果换我自己写，可能要花太久我根本不会写。但 Claude Code 可以一次性砸出一千行临时代码，只为了帮我找一个特定 bug，然后在找到之后统统删掉。这已经是代码"后稀缺"时代了------你可以随便生成成千上万行定制化、短命的代码，然后删除也没关系，代码不再是稀缺或昂贵的东西。

最后一层防线是 GPT-5 Pro，我会在遇到最难的情况时使用它。比如，我和 Cursor、Claude Code 一起卡在某个 bug 上 10 分钟时，把整个东西贴给 GPT-5 Pro，它会"思考"10 分钟，最后真的能找到那个非常微妙的 bug。它非常强大。它能翻出各种冷门的文档和论文。我也用过它来处理更复杂的任务，比如对抽象层次的清理给出建议（结果参差不齐，有些好点子，有些不太行），或者做一整个领域的文献综述------它能给出有价值的资源和参考。

总的来说，编程现在已经被各种可能性彻底打开了，不同"类型"的编程、不同的工具，各有优劣。很难避免一种焦虑感：害怕自己没站在"集体可能性的最前沿"。所以这就是一个随机的周日洗澡时的思考喷发，也很想知道别人都在探索什么。