4.2 幻觉抑制策略

[1. 提高输入信息质量](#1. 提高输入信息质量)

[2. 结构化Prompt工程](#2. 结构化Prompt工程)

[3. 高级Prompt技巧](#3. 高级Prompt技巧)

[1. 事实核验](#1. 事实核验)

[2. 输出格式与结构化](#2. 输出格式与结构化)

[3. 逻辑与推理验证](#3. 逻辑与推理验证)

[4. 人工审查与反馈闭环](#4. 人工审查与反馈闭环)

本文详细介绍大语言模型（LLM）的幻觉抑制策略，重点围绕 Prompt 引导（事前干预） 和 后处理（事后纠正） 两大核心方向展开。

首先，我们需要明确什么是幻觉。LLM幻觉是指模型生成的看似合理但与既定事实、输入源或内部逻辑不一致的内容。

这是指在向模型提交查询时，通过精心设计提示词来引导其生成更准确、更可靠的回答。核心目标是激活模型的内在知识，并设定严格的生成规则。

这是在模型生成文本后，采用外部手段进行检测、核查和修正的策略。

这是最核心的后处理策略。可分为几个层次：

内部一致性检查：检查长文本输出中是否存在前后矛盾（例如，一个人物在开头是30岁，结尾变成25岁）。
外部知识库查询：
检索增强生成：在生成过程中或生成后，使用搜索引擎、专业数据库（如维基百科API、学术论文库）或企业内部知识库，对回答中的关键实体、日期、数据、主张进行自动检索与比对。
流程：从输出中提取关键事实 -> 使用API进行并行查询 -> 比较模型输出与检索结果 -> 标记差异。
多模型交叉验证：使用另一个或几个LLM（最好是不同架构或训练数据）对同一问题生成回答，并比较结果的一致性。分歧点往往提示了潜在的幻觉。

在实际应用中，通常会组合使用上述策略，形成一个**"防御-检测-修正"** 的完整管道：

防御阶段：精心设计的Prompt（提供上下文、要求分步推理、自我质疑） + RAG（在生成时即引入真实文档）。
检测阶段：
- 解析模型的结构化输出。
- 对confidence低的陈述进行外部知识库检索。
- 检查输出内部及与上下文之间的逻辑一致性。
修正阶段：
- 如果发现可修正的错误，自动触发重写或提供带有纠正说明的补充文本。
- 对于无法确定或高风险的内容，直接标记"需要人工核查"或"信息未经充分证实"。

Prompt引导 成本低、灵活，但高度依赖技巧，且无法完全杜绝幻觉。
后处理（特别是事实核验） 更可靠，但计算成本和延迟更高，且依赖于外部知识源的覆盖范围和实时性。
根本挑战 ：LLM在本质上是一个"下一个词预测器"，其设计目标不是"追求真理"。因此，幻觉是其固有特性而非缺陷 。所有抑制策略都是在工程层面进行约束和补偿，而不能根除。

最佳实践 是：结合使用Prompt工程与检索增强生成（RAG）作为第一道防线，再辅以轻量级的自动后处理检查，并在关键应用中保留人工监督的最终裁决权。 随着AI对齐和模型架构的进步（如更好的训练数据、推理时间干预技术），我们有望看到模型本身产生幻觉的倾向性逐步降低。