Andrej Karpathy的最新帖子:分层的大模型辅助编程实践

原贴

继续探索最佳的大模型辅助编程体验。特别是,我发现与其追求某个"完美"的单一方式,我的使用习惯正在逐渐多元化------把几种工作流拼接起来,取长补短。

对我个人来说,最核心的方式(大约占了 75%?)依旧是 (Cursor 的)Tab 补全。原因是我觉得自己在正确的地方写下具体的代码或注释,是一种高带宽的方式来向 LLM 传达"任务说明"。换句话说,这主要是关于"任务规格"的传递------如果完全靠文字描述,我需要花费太多比特和等待太高的延迟,不如直接在代码里、在对应的位置示范我想要什么。有时 Tab 补全模型会让我烦恼,所以我经常开开关关。

更高一层的方式,是 选中一段具体代码并请求某种修改

再往上一层,是 Claude Code / Codex / 等工具 ,它们运行在 Cursor 旁边。我会在需要较大功能块时使用它们,这些功能块也相对容易用 prompt 指定。这些工具确实很有帮助,但整体上仍然参差不齐,有点让人沮丧。我不会"YOLO 式"地全盘放手交给它们,因为它们有时会跑偏,做一些我完全不需要的事,于是我经常要按 ESC 打断。我也还没学会如何同时高效地使用多个实例------一个已经够难管理了。我也没有找到一个好的方法来保持 CLAUDE.md 文件的更新和整洁。我常常需要自己做一遍"清理",比如统一代码风格或者符合个人"代码品味"的地方。比如它们常常过于防御性,滥用 try/catch;它们经常过度复杂化抽象;代码往往很臃肿(用多层嵌套 if-else,而不是列表推导或一行的 if-then-else);有时还会复制粘贴大段代码,而不是抽取成一个简洁的 helper 函数。简单说,它们基本没有"品味"。但在某些我不熟悉的领域(比如最近写的 Rust、SQL,或者其他我没怎么碰过的东西)里,它们是不可替代的。我也试过让 Claude Code 一边写代码一边教我,但完全没效果------它真的只想写代码,完全不想解释。我还试过让 Claude Code 做超参数调优,结果非常滑稽。除此之外,它们在各种低风险的一次性可视化、工具或调试任务上非常有用。如果换我自己写,可能要花太久我根本不会写。但 Claude Code 可以一次性砸出一千行临时代码,只为了帮我找一个特定 bug,然后在找到之后统统删掉。这已经是代码"后稀缺"时代了------你可以随便生成成千上万行定制化、短命的代码,然后删除也没关系,代码不再是稀缺或昂贵的东西。

最后一层防线是 GPT-5 Pro,我会在遇到最难的情况时使用它。比如,我和 Cursor、Claude Code 一起卡在某个 bug 上 10 分钟时,把整个东西贴给 GPT-5 Pro,它会"思考"10 分钟,最后真的能找到那个非常微妙的 bug。它非常强大。它能翻出各种冷门的文档和论文。我也用过它来处理更复杂的任务,比如对抽象层次的清理给出建议(结果参差不齐,有些好点子,有些不太行),或者做一整个领域的文献综述------它能给出有价值的资源和参考。

总的来说,编程现在已经被各种可能性彻底打开了,不同"类型"的编程、不同的工具,各有优劣。很难避免一种焦虑感:害怕自己没站在"集体可能性的最前沿"。所以这就是一个随机的周日洗澡时的思考喷发,也很想知道别人都在探索什么。

相关推荐
CoderJia程序员甲10 小时前
GitHub 热榜项目 - 日榜(2025-09-06)
ai·开源·github·ai编程·github热榜
大熊猫侯佩11 小时前
苹果 FoundationModels 秘典侠客行:隐私为先的端侧 AI 江湖
ai编程·swift·apple
程序员码歌17 小时前
零代码AI编程实战-热搜从0到1技术方案
前端·ai编程·cursor
GitLqr17 小时前
AI洞察 | Hunyuan-MT 翻译模型开源,谷歌终端嵌入模型登场
github·ai编程·gemini
落小小19 小时前
Qoder如何免费续杯,立即参与实践分享,赢 1000Credits
ai编程·cursor
蜗牛快跑1231 天前
拆巨资让 Claude Code 和 Codex 同时住进了我的终端里
前端·后端·ai编程
用户4099322502121 天前
多环境配置切换机制能否让开发与生产无缝衔接?
后端·ai编程·trae
工藤学编程2 天前
【AI编程工具】快速搭建图书管理系统
ai编程
原住民的自修室2 天前
对话Michael Truell:23岁创立Cursor,与Github Copilot竞争
ai编程·cursor