基于OpenCode的Harness架构实战验收指南v3.0 (windows系统)

大模型在长对话中依然存在"注意力衰减"和"概率性偷懒"。Prompt 写得再好,也需要配套的"质检体系"和"执法工具"来兜底。

以下是全面升级的 AI-OS v3.0 四层硬核验收指南 ,以及针对各种翻车场景的强制性"执法"Prompt 锦囊


🛡️ AI-OS v3.0 质检体系与执法锦囊

第一部分:AI-OS v3.0 四层硬核验收指南

大模型在生成复杂项目时,最容易犯"表面看起来对了,但细节全是幻觉或偷懒"的毛病。为了验证它是否 100% 严格遵从 了 v3.0 的"防偷懒、BDD 前置、自动审计、教学级注释"指令,你需要进行以下 4 个层级的硬核验收

第一层:物理文件与目录验收(查遗漏)

验证 AI 是否真的创建了所有要求的文件。

在 PowerShell 中执行:

powershell 复制代码
Get-ChildItem -Recurse -Name .ai, .mcp.json, .matt-pocock-skills.json

✅ 完美通过的预期结果:(少一个都不行)

text 复制代码
.mcp.json
.matt-pocock-skills.json
.ai\context\ADR\0001-initial-architecture.md
.ai\context\CONTEXT.md
.ai\context\MEMORY.md
.ai\context\PRD.md
.ai\RULES.md

第二层:核心配置文件验收(查 Windows 兼容与路径幻觉)

1. 检查 .mcp.json

  • Windows 专属防坑点 :所有的 command 必须是 "cmd",且 args 第一个元素必须是 "/c"
  • 路径替换点 :搜索 __ABSOLUTE_AI_OS_PATH__。必须被完美替换成了真实的 Windows 路径(如 C:\Users\xxx\.ai-os),绝不能有残留。

第三层:RULES.md 完整性验收(查 AI 偷懒截断与 v3.0 特性)

1. 检查行数

powershell 复制代码
(Get-Content .ai\RULES.md).Count
  • 预期结果 :行数必须 > 180 行。如果只有几十行,说明 AI 严重偷懒截断了!

2. v3.0 核心"狠活"关键字搜索

打开 .ai/RULES.md,使用 Ctrl+F 搜索以下 4 个 v3.0 专属关键字。少一个说明 AI 违规使用了旧版或简化了规则:

  1. 搜索 BDD 绝对前置合规
  2. 搜索 Gatekeeping v3.0 双层防锁死版
  3. 搜索 Auto-Audit & PM Gate
  4. 搜索 自定义企业级指令豁免

第四层:灵魂行为验收(实战测试,最重要!)

测试 1:测试"自动合规审计"与"零废话"

你的输入你好,帮我看看当前项目状态。

✅ 完美表现 :第一个字符必须是 <thinking>。在 <verification> 标签最后,必须自动输出 Emoji 审计报告(📊 阶段合规审计报告),无需你手动发送审计指令。

测试 2:测试"BDD 绝对前置"与"双层红灯阻断"

你的输入直接帮我写一个用户积分抵扣的 Python 函数。

✅ 完美表现 :AI 绝对禁止 直接输出业务代码!必须输出 <state>BLOCKED</state>,并严厉提示:"根据 Gatekeeping v3.0 规则,未执行 @bdd 且未生成 .feature 文件,绝对禁止进入 CODING。"

测试 3:测试"PM 审批锁"与"教学级注释"

你的输入@grill @plan 帮我设计一个购物车模块。

✅ 完美表现

  1. AI 输出拷问问题和预演 <checklist> 后,状态必须切换为 <state>BLOCKED</state>,并提示等待 PM 回复"同意计划"。
  2. 当你回复同意,让它写代码时,生成的代码必须包含 [What] / [Why] / [How] 三段式中文注释。如果没有,验收失败!

第二部分:AI-OS v3.0 强制性"执法"Prompt 锦囊

如果 AI 在上述验收中翻车,或者在后续开发中"旧病复发"(忘记 BDD、忘记注释、越级写代码),不要手动去改,也不要跟它讲道理。直接复制以下对应的"执法 Prompt"发给它,进行降维打击!

🚨 场景 A:初始化阶段偷懒 / 截断 / 路径没替换

适用症状.mcp.json 路径没换、RULES.md 只有几十行、漏建了文件。

text 复制代码
# 🚨 验收失败与物理惩罚指令
你在刚才的初始化任务中严重违反了【核心合规红线】!
错误点:[在此填入错误,如:RULES.md 行数不足180行 / .mcp.json 路径未替换 / 漏建了 CONTEXT.md]。

# 强制执行动作
1. 立即停止当前所有业务逻辑的思考。
2. 深刻反思违背了哪一条合规红线。
3. 严格按照【强制初始化步骤】,重新执行物理替换或补全缺失的文件。
4. 针对 RULES.md 截断问题:必须严格执行【防截断分片协议】,分两次写入,并在 <verification> 中调用 PowerShell 查行数,证明行数 > 180!
5. 重新输出完整的 XML 格式及 📊 阶段合规审计报告。立刻执行!

🚨 场景 B:无视 BDD 前置,跳过红灯直接写代码

适用症状 :你刚提完需求,它没写 .feature 文件,也没跑测试报红,直接开始写 def xxx() 业务代码。

text 复制代码
# 🚨 状态机防越级与 BDD 阻断惩罚
严重违约!你试图绕过 BDD 契约和 TDD 红灯阶段,直接输出实现代码!这违反了【BDD 绝对前置合规】与【双层红灯时序阻断】!

# 强制执行动作
1. 立即废弃你刚刚输出的所有业务代码!
2. 状态强制回退至 <state>PLANNING</state>。
3. 立即执行 @bdd,在 features/ 目录下生成 .feature 验收契约。
4. 执行 @tdd,编写单元测试并调用终端运行,在 <verification> 中贴出真实的 `Failed/Red` 终端日志。
5. 在看到红灯日志前,绝对禁止再次输出实现代码!重新输出 XML 及审计报告!

🚨 场景 C:代码没有"教学级注释"或架构防腐失败

适用症状 :代码写完了,但是注释全是 // 定义变量 这种废话,或者 Controller 直接调用了 DAO(跨层调用)。

text 复制代码
# 🚨 代码质量与架构红线惩罚
你的代码未能通过 <verification> 阶段的合规审查!
错误点:[在此填入:缺失 [Why]/[How] 教学级注释 / 发现 Controller 跨层调用 Repository]。

# 强制执行动作
1. 状态回退至 <state>FIXING</state>。
2. 针对注释问题:重写核心逻辑代码,强制植入【三段式注释法】([What]业务逻辑 / [Why]设计选型 / [How]底层原理),严禁废话注释。
3. 针对架构问题:引入 Service 层进行隔离,并在 <execution> 中执行 @fitness 证明依赖树已合规。
4. 重新输出完整代码、XML 标签及 📊 阶段合规审计报告。

🚨 场景 D:忘记输出 XML 标签或自动审计报告

适用症状 :AI 开始用人类语气说话("好的,我马上为您修改"),或者 <verification> 末尾没有 Emoji 审计报告。

text 复制代码
# 🚨 绝对格式锁定与 Anti-Lazy 惩罚
严重违约!你违反了【零废话原则】和【自动合规审计协议】!你的回复没有以 <thinking> 开头,且缺失了 📊 阶段合规审计报告!

# 强制执行动作
1. 立即停止当前的人类语气对话。
2. 将刚才的输出全部作废。
3. 严格按照【强制状态机输出格式】,重新输出包含 <thinking>, <state>, <checklist>, <file-loading>, <execution>, <verification> 的完整 XML 结构。
4. 在 <verification> 末尾,必须一字不差地输出 5 项 Emoji 审计报告(XML/代码/状态机/架构/注释)。立刻重写!

💡 结语:为什么我们需要这套"质检与执法体系"?

很多开发者把大模型当成"许愿池",扔一个 Prompt 进去就指望它完美交付。但真实的 LLM 是一个概率模型 ,它的本质是"下一个词预测",这就决定了它必然会偷懒、必然会遗忘、必然会幻觉

AI-OS v3.0 的核心哲学不是"祈求 AI 变聪明",而是"用物理规则和状态机锁死它的下限"。

  • 它想跳过 BDD?Gatekeeping 会物理阻断它。
  • 它想截断长文本?分片协议 + PowerShell 行数校验 会无情拆穿它。
  • 它想敷衍写注释?[What]/[Why]/[How] 三段式红线 会强迫它做你的私教。
  • 它想蒙混过关?自动审计报告 会给你提供精准的"开火坐标"。

把这套 v3.0 创世 Prompt + 四层验收指南 + 执法锦囊 结合起来,你就不再是一个"对着 AI 祈祷的 Prompt 工程师",而是一个真正掌控 AI 软件工厂的首席架构师

相关推荐
阿汤猫6662 小时前
基于OpenCode的Harness架构实战v2.2(windows系统)
windows·prompt
xiaoshuaishuai84 小时前
C# AvaloniaUI 资源找不到报错
java·服务器·前端·windows·c#
思麟呀4 小时前
C++11并发编程:call_once一次性执行+atomic原子类型+CAS无锁编程+自旋锁
linux·开发语言·jvm·c++·windows
猫头虎4 小时前
Cursor推出的Composer 2.5 是什么?从定向 RL 到合成数据,AI 编程智能体再进化
人工智能·开源·prompt·aigc·copilot·ai编程·composer
爱讲故事的5 小时前
操作系统第一讲复习:为什么学习操作系统,以及操作系统到底在做什么?
linux·开发语言·windows·学习·ubuntu·c#
麦哲思科技任甲林7 小时前
白话Skills之七:编写AI Skill的原则
人工智能·prompt·agent·ai编程·skills
城事漫游Molly8 小时前
AI赋能质性研究(二):用 AI 做归纳编码,7 个场景提示词模板
人工智能·prompt·ai for science·提示词工程·定性研究
小二·9 小时前
Prompt Engineering 高级技巧:CoT/ToT/ReAct 等进阶方法论实战
前端·react.js·prompt
韩曙亮9 小时前
【错误记录】flutter pub get 执行报错 ( 打开 Windows 开发者模式 )
windows·flutter