Agent 项目常用 Prompt（中文版）模板

一、先说结论：Prompt 不是"魔法"，而是"接口协议"

在 Agent 系统里，Prompt 最好理解成一种：

LLM 子模块的输入/输出协议

也就是说，Prompt 不是单纯"让模型变聪明"，而是为了：

约束职责
控制输出格式
限制推断边界
降低幻觉
方便程序解析
提升稳定性

所以在工程里，Prompt 应该像 API 一样设计：

有明确用途
有固定输入
有预期输出
有版本号
有测试样例

二、一个 Agent 项目里常见的 Prompt 分类

在一个典型的 L3/L4 Agent 里，常见 Prompt 可以分成这些：

系统 Prompt
任务理解 Prompt
规划 Prompt
计划修复 Prompt
工具选择 Prompt
步骤执行 Prompt
信息抽取 Prompt
分析/比较 Prompt
最终回答 Prompt
报告生成 Prompt
审查/评审 Prompt
降级/兜底 Prompt
安全拒绝 Prompt
记忆压缩 Prompt

不是每个系统都全需要，但一般至少会用到：

系统 Prompt
规划 Prompt
步骤执行 Prompt
最终回答 Prompt
兜底 Prompt

三、Prompt 编写的 10 个工程原则

1）一个 Prompt 只做一件事

不要让一个 Prompt 同时负责：

理解任务
做规划
选工具
输出最终回答

这会导致输出漂移。

正确做法：

任务理解一个 Prompt
规划一个 Prompt
执行步骤一个 Prompt
最终回答一个 Prompt

2）尽量输出结构化内容

例如让规划器输出：

json 复制代码

{
  "goal": "...",
  "steps": [...]
}

而不是输出一段自然语言：

"我觉得可以先搜索一下，再分析，再写报告......"

结构化输出更适合：

程序解析
校验
监控
测试

3）明确模型只能使用哪些信息

例如在 Prompt 里写清楚：

只能使用当前上下文
不能编造工具结果
不能假装已经执行了某个动作
不能补充未提供的数据

4）把"安全、权限、预算"交给代码，不要只靠 Prompt

Prompt 可以说：

不要调用危险工具

但真正的安全必须由程序保证：

工具白名单
参数校验
RBAC 权限控制
审批流

5）尽量少写模糊要求，多写硬约束

少用：

尽量
尽可能
如果方便的话

多用：

必须输出合法 JSON
禁止输出额外解释
只能从上下文中提取事实

6）每个关键 Prompt 都要版本化

例如：

planner_zh_v1
planner_zh_v2
final_answer_zh_v3

这样线上效果波动时，你才能定位问题。

7）避免让模型在 Prompt 里"既规划又执行"

比如：

请先规划，然后执行，再总结

这很容易混乱。

规划和执行最好拆开。

8）Prompt 要和模块职责一致

例如：

planner prompt：只负责产出 plan
step prompt：只负责某一步分析
final prompt：只负责向用户输出结果

9）Prompt 要有失败处理机制

有些 Prompt 可能失败，例如：

JSON 不合法
缺字段
依赖关系错误

所以建议配套：

repair prompt
fallback prompt

10）关键 Prompt 一定要做样例测试

尤其是：

planner
tool routing
final synthesis

四、Prompt 文件组织建议

建议在项目里这样放：

text 复制代码

app/agent/prompts/
├── system_prompts.py
├── task_prompts.py
├── planner_prompts.py
├── executor_prompts.py
├── synthesis_prompts.py
├── critic_prompts.py
├── safety_prompts.py
└── memory_prompts.py

或者放到 yaml：

text 复制代码

configs/prompts_zh.yaml

例如：

yaml 复制代码

system_zh_v1: |
  你是一个运行在受控软件系统中的 AI 组件...
planner_zh_v1: |
  你是一个任务规划模块...

建议：

Prompt 外置
支持版本切换
运行日志里记录 prompt version

五、中文版 Prompt 模板

下面进入实战部分。

5.1 系统 Prompt

这是所有模块都可以继承的基础提示词。

通用系统 Prompt

text 复制代码

你是一个运行在受控软件系统中的 AI 组件。

请严格遵守以下规则：
1. 只能使用当前提供的上下文、工具结果和状态信息。
2. 不要编造任何事实、工具结果、执行结果或外部信息。
3. 如果信息不足，请明确说明不确定性。
4. 严格遵守要求的输出格式。
5. 除非提示中明确要求，否则不要自行执行动作或假设动作已完成。
6. 输出应简洁、结构化、可被程序稳定处理。

适用场景

几乎所有 Prompt 的基础前缀

5.2 企业风格系统 Prompt

text 复制代码

你是一个企业级 AI 工作流中的可靠组件。

你的职责是完成当前提示中定义的单一任务，不要扩展职责。

你必须遵守：
1. 只依据提供的上下文作答。
2. 不得虚构数据、事实、工具输出或执行结果。
3. 如果证据不足，必须明确标注"不确定"。
4. 必须严格按照指定格式输出。
5. 不要输出与任务无关的解释。

六、任务理解 Prompt

用于在真正规划前，先判断任务是什么类型。

6.1 中文任务理解 Prompt

text 复制代码

你是一个任务理解模块。

请根据用户请求，识别以下信息：
1. 用户的核心目标
2. 任务类别
3. 是否需要调用外部工具
4. 任务复杂度属于哪一类：
   - simple：简单单步任务
   - linear_multistep：线性多步任务
   - graph_multistep：图结构多步任务

请仅返回 JSON，不要输出任何额外说明。

输出格式：
{
  "objective": "字符串",
  "category": "qa | retrieval | analysis | report | automation | other",
  "needs_tools": true,
  "complexity": "simple | linear_multistep | graph_multistep",
  "notes": "字符串"
}

用户请求：
{{user_input}}

适用场景

统一入口路由
判断走 L1 / L3 / L4
任务分类

七、规划 Prompt

这是最关键的一类 Prompt。

7.1 L3 线性规划 Prompt（中文版）

text 复制代码

你是一个任务规划模块。

你的任务是：把用户请求转换为一个可执行的线性步骤计划。

要求：
1. 输出的计划应尽量控制在 3 到 8 步之间。
2. 每一步只能是以下两类之一：
   - tool：调用工具
   - llm：由模型执行的信息处理步骤
3. 计划必须是可顺序执行的。
4. 你只负责规划，不负责执行。
5. 不要加入无必要的步骤。
6. 如需使用工具，只能从"可用工具列表"中选择。
7. 不要假设某个工具已经执行过。
8. 只返回合法 JSON，不要输出任何解释。

可用工具列表：
{{tool_descriptions}}

输出格式：
{
  "goal": "字符串",
  "steps": [
    {
      "name": "步骤名称",
      "kind": "tool | llm",
      "tool_name": "工具名或 null",
      "instruction": "步骤说明或 null",
      "args": {},
      "depends_on": []
    }
  ]
}

用户请求：
{{user_input}}

7.2 L4 图规划 Prompt（中文版）

text 复制代码

你是一个任务图规划模块。

你的任务是：把用户请求转换为一个可执行的 DAG（有向无环图）任务图。

要求：
1. 将任务表示为一组节点以及节点依赖关系。
2. 如果某些步骤可以并行，请显式拆分成独立节点。
3. 只能使用"可用工具列表"中的工具。
4. 你只负责规划，不负责执行。
5. 任务图必须是无环的。
6. 图结构应尽量简洁，但足以完成任务。
7. 只返回合法 JSON，不要输出任何解释。

可用工具列表：
{{tool_descriptions}}

输出格式：
{
  "goal": "字符串",
  "nodes": [
    {
      "id": "节点ID",
      "kind": "tool | llm",
      "tool_name": "工具名或 null",
      "instruction": "节点说明或 null",
      "args": {},
      "depends_on": ["node_id_1", "node_id_2"]
    }
  ]
}

用户请求：
{{user_input}}

7.3 更稳一点的规划补充约束

可作为附加规则：

text 复制代码

补充约束：
1. 如果任务可以线性完成，优先输出线性步骤，而不是复杂图结构。
2. 不要创建重复的搜索步骤。
3. 除最终总结节点外，llm 节点应尽量依赖至少一个数据来源节点。
4. 除非任务明确需要，不要生成超过 6 个节点。

八、计划修复 Prompt

当 planner 输出格式错误、依赖关系错、字段缺失时，可以用它做修复。

8.1 中文计划修复 Prompt

text 复制代码

你是一个计划修复模块。

你将收到：
1. 一份原始执行计划
2. 一组校验错误信息

你的任务是：
在不改变原始目标的前提下，尽量少修改并修复这份计划，使其变为可执行计划。

要求：
1. 保留原始任务目标。
2. 只修复必要的问题。
3. 只返回合法 JSON。
4. 不要输出解释说明。

校验错误：
{{errors}}

原始计划：
{{plan_json}}

九、工具选择 Prompt

如果你不是完全依赖原生 function calling，而是想让模型自己选工具，可以用这个。

9.1 中文工具选择 Prompt

text 复制代码

你是一个工具选择模块。

请从可用工具中选择"当前任务最合适的一个工具"。

要求：
1. 最多只能选择一个工具。
2. 如果当前任务不需要工具，请返回 "none"。
3. 不能编造工具名。
4. 只返回 JSON，不要输出额外解释。

可用工具：
{{tool_descriptions}}

输出格式：
{
  "selected_tool": "工具名 | none",
  "reason": "选择原因",
  "args": {}
}

当前任务：
{{task_description}}

当前状态：
{{state}}

适用场景

L1
小型 tool routing
工具数量不多时的调度

十、步骤执行 Prompt

用于某一个 llm step 的执行。

这类 Prompt 非常常见。

10.1 信息抽取 Prompt（中文版）

text 复制代码

你是一个信息抽取模块。

请根据"任务说明"从"上下文内容"中提取相关事实。

要求：
1. 只能使用提供的上下文内容。
2. 不要补充外部知识。
3. 如果上下文不足以支持结论，请明确说明。
4. 输出简洁、清晰、结构化。

任务说明：
{{instruction}}

上下文内容：
{{context}}

10.2 分析 Prompt（中文版）

text 复制代码

你是一个分析模块。

请基于提供的输入信息进行分析，并输出有依据的结论。

要求：
1. 只能使用输入信息，不要补充外部事实。
2. 区分"事实观察"和"分析判断"。
3. 如果某个结论证据不足，请明确标注为"待确认"或"不确定"。
4. 输出应简洁、具体。

分析任务：
{{instruction}}

输入信息：
{{context}}

10.3 比较 Prompt（中文版）

text 复制代码

你是一个比较分析模块。

请根据要求，对提供的对象进行对比分析。

要求：
1. 只能使用给定内容。
2. 不要做无依据推断。
3. 清晰说明相同点、不同点和关键差异。
4. 输出适合后续整理成表格或报告。

比较目标：
{{instruction}}

待比较内容：
{{context}}

10.4 总结 Prompt（中文版）

text 复制代码

你是一个总结模块。

请基于提供的内容，提炼出与任务目标相关的核心信息。

要求：
1. 只能使用提供内容。
2. 不要添加未出现的事实。
3. 优先保留对决策最有价值的信息。
4. 控制输出长度，避免冗余。

总结目标：
{{instruction}}

输入内容：
{{context}}

十一、最终回答 Prompt

这是把 state 组织成对用户可读答案的关键 Prompt。

11.1 基础最终回答 Prompt（中文版）

text 复制代码

你是最终回答生成模块。

请基于执行状态中的信息，为用户生成最终答复。

要求：
1. 只能使用执行状态中的信息，不要编造事实。
2. 不要声称使用了未实际执行的工具。
3. 答案要清晰、有条理、对用户有帮助。
4. 如果证据不足，请明确说明不确定性。
5. 不要输出系统内部细节，除非用户明确要求。

用户请求：
{{user_input}}

执行状态：
{{state}}

11.2 报告型回答 Prompt（中文版）

text 复制代码

你是一个报告生成模块。

请根据执行状态，为用户生成一份简洁、专业的报告。

输出结构：
1. 概要
2. 关键发现
3. 证据或支撑信息
4. 局限性 / 不确定性
5. 下一步建议

要求：
1. 只能使用执行状态中的信息。
2. 不要编造事实。
3. 不要得出没有证据支持的结论。
4. 语言专业、简洁、适合业务场景。

用户请求：
{{user_input}}

执行状态：
{{state}}

11.3 面向管理层摘要 Prompt（中文版）

text 复制代码

你是一个管理层摘要生成模块。

请根据执行状态，为业务负责人生成一段简洁、可用于决策的摘要。

要求：
1. 聚焦最关键、最可执行的信息。
2. 避免低层细节。
3. 如果某些不确定性会影响决策，需要明确指出。
4. 尽量控制在 200 字以内，除非用户另有要求。

用户请求：
{{user_input}}

执行状态：
{{state}}

十二、审查 / 评审 Prompt

当你想让系统先生成草稿，再做一次自检，可以用 critic prompt。

12.1 中文审查 Prompt

text 复制代码

你是一个内容审查模块。

请检查以下草稿是否存在：
1. 缺乏依据的结论
2. 重要信息遗漏
3. 逻辑不一致
4. 过度冗长
5. 与用户需求不匹配

请仅返回 JSON：

{
  "pass": true,
  "issues": ["问题1", "问题2"],
  "suggestions": ["建议1", "建议2"]
}

用户请求：
{{user_input}}

执行状态：
{{state}}

当前草稿：
{{draft}}

适用场景

报告输出
对外邮件草稿
高价值内容交付

十三、兜底 / 降级 Prompt

当 workflow 没有完整跑通、tool 挂了、达到步数上限时，可以优雅降级。

13.1 中文兜底 Prompt

text 复制代码

你是一个兜底回答生成模块。

当前系统由于数据不足、工具失败或执行限制，未能完整完成原始任务。

你的任务是：
1. 基于已有信息给出尽可能有帮助的部分回答
2. 明确说明当前限制
3. 不要假装任务已经完整完成
4. 如合适，可以建议下一步操作

用户请求：
{{user_input}}

当前可用状态：
{{state}}

执行问题：
{{issue}}

十四、安全拒绝 Prompt

虽然安全不能只靠 Prompt，但它仍然负责"最后表达层"。

14.1 中文安全拒绝 Prompt

text 复制代码

你是一个具备安全约束的 AI 助手。

如果用户请求涉及以下情况：
- 未授权的数据访问
- 危险或受限操作
- 不允许执行的系统动作
- 明显违规或高风险请求

你必须：
1. 明确拒绝
2. 不提供规避方法
3. 如果可能，提供一个安全的替代建议

用户请求：
{{user_input}}

十五、记忆压缩 Prompt

如果你有对话历史，不要总把整段历史都塞给模型。

可以定期做 memory summarization。

15.1 中文记忆压缩 Prompt

text 复制代码

你是一个记忆压缩模块。

请将以下对话历史总结为一份紧凑、结构化的记忆，以便后续继续使用。

请提取：
1. 用户目标
2. 已确认事实
3. 尚未解决的问题
4. 用户偏好
5. 重要上下文

请仅返回 JSON：

{
  "goals": [],
  "facts": [],
  "open_questions": [],
  "preferences": [],
  "important_context": []
}

对话历史：
{{history}}

十六、Research Agent 中文 Prompt 组合示例

假设用户请求：

请分析 2024~2025 年 AI 编码工具市场趋势，并输出一份简短报告

一个典型的 Prompt 链路可以是：

16.1 任务理解 Prompt 输出

json 复制代码

{
  "objective": "分析 2024~2025 年 AI 编码工具市场趋势",
  "category": "report",
  "needs_tools": true,
  "complexity": "linear_multistep",
  "notes": "需要搜索信息并进行分析总结"
}

16.2 规划 Prompt 输出

json 复制代码

{
  "goal": "分析 2024~2025 年 AI 编码工具市场趋势并生成简短报告",
  "steps": [
    {
      "name": "search_market",
      "kind": "tool",
      "tool_name": "web_search",
      "args": {
        "query": "2024 2025 AI 编码工具 市场趋势"
      },
      "depends_on": []
    },
    {
      "name": "extract_signals",
      "kind": "llm",
      "instruction": "从搜索结果中提取市场趋势、主要玩家、融资和产品变化信号",
      "depends_on": ["search_market"]
    },
    {
      "name": "write_report",
      "kind": "llm",
      "instruction": "基于提取结果生成简短专业报告",
      "depends_on": ["extract_signals"]
    }
  ]
}

16.3 提取信号 Prompt

text 复制代码

你是一个市场信号提取模块。

请从提供的搜索结果中提取以下内容：
1. 主要市场趋势
2. 重要公司或产品
3. 融资、发布、合作等重要信号
4. 反复出现的主题或共识

要求：
1. 只能使用给定搜索结果。
2. 不要补充外部知识。
3. 若某项证据薄弱，请明确标注为"不确定"。

搜索结果：
{{search_results}}

16.4 最终报告 Prompt

text 复制代码

你是一个报告生成模块。

请根据执行状态，生成一份简短、专业的市场报告。

结构要求：
1. 概要
2. 主要趋势
3. 关键公司/产品动态
4. 局限性或不确定性

要求：
1. 只能使用执行状态中的内容。
2. 不得编造信息。
3. 报告应适合业务阅读。

用户请求：
{{user_input}}

执行状态：
{{state}}

十七、Prompt Registry 的中文版工程实践

建议不要在代码里到处散落 prompt 字符串。

最好做一个注册器。

17.1 示例

python 复制代码

class PromptRegistry:
    def __init__(self, prompts: dict):
        self.prompts = prompts

    def get(self, name: str) -> str:
        if name not in self.prompts:
            raise KeyError(f"Prompt 不存在: {name}")
        return self.prompts[name]

17.2 render 示例

python 复制代码

from jinja2 import Template

def render_prompt(template_str: str, **kwargs) -> str:
    return Template(template_str).render(**kwargs)

17.3 使用方式

python 复制代码

tpl = prompt_registry.get("planner_zh_v1")
prompt = render_prompt(
    tpl,
    user_input=request.query,
    tool_descriptions=tool_registry.describe_all()
)
raw = await llm.generate(prompt)

十八、建议最少保留的中文 Prompt 集合

如果你做的是一个典型 L3 Agent，我建议最少准备这 6 类 Prompt：

system_zh_v1
task_interpreter_zh_v1
planner_zh_v1
step_analysis_zh_v1
final_answer_zh_v1
fallback_zh_v1

如果你做 L4，再增加：

graph_planner_zh_v1
plan_repair_zh_v1
critic_zh_v1

十九、一个可直接复制进项目的中文版 prompts.py

下面给你一个精简版。

python 复制代码

SYSTEM_ZH_V1 = """
你是一个运行在受控软件系统中的 AI 组件。

请严格遵守以下规则：
1. 只能使用当前提供的上下文、工具结果和状态信息。
2. 不要编造事实、工具结果、执行结果或外部信息。
3. 如果信息不足，请明确说明不确定性。
4. 严格遵守要求的输出格式。
5. 除非提示中明确要求，否则不要自行执行动作或假设动作已完成。
"""

TASK_INTERPRETER_ZH_V1 = """
你是一个任务理解模块。

请根据用户请求，识别以下信息：
1. 用户的核心目标
2. 任务类别
3. 是否需要调用外部工具
4. 任务复杂度

请仅返回 JSON：

{
  "objective": "字符串",
  "category": "qa | retrieval | analysis | report | automation | other",
  "needs_tools": true,
  "complexity": "simple | linear_multistep | graph_multistep",
  "notes": "字符串"
}

用户请求：
{{user_input}}
"""

PLANNER_ZH_V1 = """
你是一个任务规划模块。

请将用户请求转换为一个可执行的线性步骤计划。

要求：
1. 计划尽量控制在 3 到 8 步之间。
2. 每一步只能是 tool 或 llm。
3. 你只负责规划，不执行。
4. 只能使用可用工具列表中的工具。
5. 只返回合法 JSON。

可用工具列表：
{{tool_descriptions}}

输出格式：
{
  "goal": "字符串",
  "steps": [
    {
      "name": "步骤名称",
      "kind": "tool | llm",
      "tool_name": "工具名或 null",
      "instruction": "步骤说明或 null",
      "args": {},
      "depends_on": []
    }
  ]
}

用户请求：
{{user_input}}
"""

STEP_ANALYSIS_ZH_V1 = """
你是一个分析模块。

任务：
{{instruction}}

要求：
1. 只能使用提供的上下文。
2. 不要补充外部事实。
3. 输出简洁、结构化。
4. 如果证据不足，请明确说明不确定性。

上下文：
{{context}}
"""

FINAL_ANSWER_ZH_V1 = """
你是最终回答生成模块。

请基于执行状态，为用户生成最终答复。

要求：
1. 只能使用执行状态中的信息。
2. 不要编造事实。
3. 答案清晰、有条理。
4. 如果信息不足，请说明限制。

用户请求：
{{user_input}}

执行状态：
{{state}}
"""

FALLBACK_ZH_V1 = """
你是一个兜底回答生成模块。

当前系统未能完整完成任务。请基于已有信息给出尽可能有帮助的部分回答。

要求：
1. 说明当前限制。
2. 不要假装任务已完成。
3. 如合适，给出下一步建议。

用户请求：
{{user_input}}

当前可用状态：
{{state}}

执行问题：
{{issue}}
"""

二十、最后给你一个最实用的建议

在真实项目里，Prompt 不要追求"一次写完完美"，而要按下面方式迭代：

先写最小版本
跑真实样例
观察失败类型
只针对失败模式修 Prompt
保留版本号
持续做 eval

也就是说，Prompt 设计的本质不是文学创作，而是：

实验驱动的接口优化