本文已收录到 AI编程一站式导航。本文链接:[03.9 2026 年最佳 AI 编码工具完全指南](code.ai80.vip/ai-tool-gui... 2026 年最佳 AI 编码工具完全指南) 强烈推荐:AI编程巴士网站:稳定纯净的ClaudeCode套餐供应;
Claude Code 联合创始人 Boris Cherny 最近晒了组数据,挺炸裂的:30 天提交 259 个 PR,每行代码都是 Claude + Opus 4.5 写的;47 天里有 46 天在用,最长一个 session 跑了 1 天 18 小时。
他分享了 13 条心得,今天单聊第 12 条------
"长时间运行的任务,用ralph-wiggum插件。"

这不只是个插件。搞懂它背后的原理,你对 AI Agent 的认知会上一个台阶。
一、先说说什么是拉尔夫循环
最近这个概念挺火。简单讲,就是你给 Agent 一个任务,Agent 跑了很多轮之后觉得"我做完了"想退出------这时候拉尔夫会拦截这个退出,把同样的 prompt 再喂一遍。
关键是:Agent 之前的上下文还在(有的持久化到文件里,有的直接复用上下文),之前改过的代码也保留着。于是 Agent 从上次停下的地方继续干活。
这个场景你可以这么理解:实习生觉得自己做完了就停了,老板甩着鞭子说"没完呢,继续",一直干到老板满意为止。
本质上,这是通过多轮迭代来解决一个老问题:LLM 上下文窗口有限,导致 Agent 难以很好地完成长任务。
效果有多夸张?流传最广的案例是,有个老哥靠这个机制"鞭打"Agent,跑了一个 3 个月的循环,直接干出了一门完整的编程语言(后面会详细聊)。
二、理解一组概念:Context Rot vs In-Context Learning
用 Ralph 跑长任务,上下文窗口是核心战场。随着对话变长,上下文不断增加。问题是,这些增加的内容到底是是在"污染"还是在"学习"?这直接决定你的 Agent 能不能高效工作。

- Context Rot(上下文腐化):当上下文中充满了重复、错误或无价值的信息时,AI会陷入思维定势。这些信息"引入了噪音或误导性的模式",导致AI不断重复同样的错误,性能越来越差。
- In-Context Learning(上下文学习):当上下文中增加了有价值的新信息时,比如明确的错误反馈、成功的尝试记录或是对问题空间的有效探索,AI就能从中学习,越跑越聪明。
怎么判断你的任务是哪种情况?一个简单标准:假设删除掉前N次尝试记录,如果问题更容易解决了,就是腐化;如果更难了,就是学习。
三、Ralph 循环到底是什么?
这项技术的创造者 Geoffrey Huntley 有句话说得好:"迭代胜于完美。在不确定的世界里,确定性的失败好过不确定的成功。"
名字来自《辛普森一家》里的 Ralph Wiggum------那个看起来笨笨的、但异常执着、永不放弃的小孩。
技术上,它的本质就是一个 Bash 循环:
bash
while :; do cat PROMPT.md | claude ; done
反复给AI同一个指令,直到任务被最终完成。
具体工作流程是这样的:
- 注入Prompt:喂一个定义了明确成功标准的任务文件
- 执行任务:Claude修改代码、跑测试
- 拦截退出:用Stop hook 挡住Claude的"下班"企图
- 循环重置:如果未达完成条件,重读Prompt,保留文件和Git历史作为上下文,再来一轮
每一轮都能看到上轮变更,AI基于失败经验改进。
这跟传统的 AI 编程模式有本质区别:
- 传统模式:你是微观管理者,精心设计 Prompt,追求一次成功,失败就得从头来
- Ralph工作流:你是目标设定者和裁判,只定义成功标准,让系统自动迭代。失败不是问题,是改进的燃料
四、技术实战:在Claude Code中使用Ralph
Anthropic 官方插件市场已经集成了 Ralph。安装很简单:
bash
# 添加官方插件市场源
/plugin marketplace add anthropics/claude-code
# 安装 Ralph 插件
/plugin install ralph-wiggum@claude-code-plugins
装好后用 /ralph-loop 命令启动。举个例子:
arduino
/ralph-loop "用Next.js + Tailwind CSS做一个todolist程序,你要写好测试用例,测试用例都通过后,最终网站要能正常使用" --max-iterations 20 --completion-promise "<promise>MISSION_COMPLETE</promise>"
两个关键参数: --max-iterations 20:安全阀,防止无限循环烧钱 --completion-promise:完成契约,Claude 输出这个字符串时循环才停
五、几个实战技巧
- 成功标准要可验证:用TDD思维。别写"实现高效排序",要写"跑 pytest tests/sorting_test.py,修复所有错误,输出DONE。"
- 声明式优于命令式:告诉 AI 要达到什么状态,别规定具体怎么做。复杂任务可以拆成多个子循环
- 加入自省指令:让每轮开始时先跑 git diff 看上一轮改了什么,分析失败原因,避免重复踩坑。
- 成本与进度平衡:Ralph 是 Token大户,复杂任务可能烧$50-100+。从小迭代数开始(10-20次),精心设计退出条件。
- 最佳适用场景:框架迁移、TypeScript 改造、大规模重构、代码规范统一------这类机械但繁琐的活儿
六、三个真实案例
6.1 案例1:三个月从零造一门编程语言
Geoffrey Huntley 用一句 Prompt 启动:"创建一个像 Golang 的编程语言,但关键词全换成 Gen Z 俚语。"
Ralph 连续跑了 3 个月。成果:完整语言 CURSED Lang,包括解释器/编译器、LLVM 支持、标准库、VSCode/Emacs/Vim 扩展,甚至能自举------用 CURSED 写 CURSED。
Huntley 说:Claude 学会了它从未被训练过的语言。
6.2 案例2:50,000的外包合同:MVP交付
Huntley指导的一位旧金山工程师接了5万美元的MVP合同,用Ralph循环迭代代码、跑测试,确保覆盖率>80%。
最终API成本:$297。工程师称之为"最疯狂的ROI"。
6.3 案例3:Python到TypeScript全仓库翻译:自学习循环
一个 Reddit 用户需要迁移 Python 项目到 TypeScript,用 Ralph 迭代翻译、修复测试,每轮保留错误日志优化下一轮。
最终:完整迁移,测试 100% 通过。
七、什么时候不该用?
Ralph 不是万能的。这些场景慎用::
- 模糊需求:没有明确完成标准,AI 可能无限循环
- 安全敏感代码:认证、授权、加密等安全相关的代码需要人工严格审查和判断
- 架构决策:高层次的架构设计需要人类的判断和审美,AI难以胜任。
- 审美相关:UI/UX、文案润色,AI 缺乏审美直觉
- 简单任务:一行代码能修的 Bug,没必要动用循环
核心原则:Ralph 最适合那些有明确标准、能程序化验证的机械性任务。
八、写在最后
Ralph 代表一种思维转变:从"精准控制 AI"到"演化引导 AI"。
失败不再是挫折,而是数据。我们从"指令下达者"变成"规则设计者"。
找个小任务试试------比如给项目里某个工具函数补全 JSDoc 注释。启动你的第一个 Ralph 循环,体验一下让 AI 替你死磕的感觉。
本文已收录到 AI编程一站式导航。本文链接:[03.9 2026 年最佳 AI 编码工具完全指南](code.ai80.vip/ai-tool-gui... 2026 年最佳 AI 编码工具完全指南) 强烈推荐:AI编程巴士网站:稳定纯净的ClaudeCode套餐供应;