NLP高频面试题（十三）——什么是大模型幻觉，如何解决大模型幻觉

所谓大模型幻觉，是指LLM在生成文本时出现看似流畅合理但实际上却偏离事实甚至无中生有的内容。这不仅严重影响了模型输出的可靠性，在某些敏感领域（如医疗、法律）可能造成严重后果。本文将深入分析大模型幻觉产生的原因、分类与检测方法，并提出有效的解决策略，帮助更好地理解并应对这一挑战。

大模型幻觉（Hallucination）是指大型语言模型在生成文本时，虽然看似流畅、合理，但实际内容却可能毫无根据甚至与事实相悖。这种现象俗称为"一本正经的胡说八道"，严重影响了模型生成内容的可信度。

比如，在医疗咨询应用中，如果模型产生幻觉并生成错误诊断信息，可能危及患者生命安全。因此，了解并有效应对大模型幻觉变得非常必要。

不过值得注意的是，幻觉并非完全有害，在某些需要创造力的情景下，如艺术创作或故事生成，适度的幻觉可能激发创新和想象力。

大模型幻觉产生的原因主要包括以下几点：

幻觉通常可分为两大类：

进一步，从表现形式看，还可以细分为事实性错误、忠诚度问题（如违背指令或上下文）和自我矛盾三类。

幻觉检测的主要方法包括：

针对幻觉产生的原因和类型，可以采取以下缓解措施：

优化数据质量：构建更高质量、低噪声的数据集，通过消重技术避免重复数据，通过专业审核降低数据错误和偏见。
引入外部知识验证（检索增强）：
- 在生成文本后，通过检索外部知识库验证并修正。
- 使用链式检索方法，逐步验证复杂问题，降低幻觉的发生。
改进解码策略：
- 使用事实核心采样（Factual-nucleus sampling），在句子后半段逐渐降低随机性，以增强事实准确性。
- 使用SelfCheckGPT方法，通过多次随机生成和自我验证，筛除可能的幻觉内容。
模型编辑技术：
- 直接对模型参数进行编辑，以修正错误知识（如ROME、MEMIT方法）。
- 增加外部模块或额外参数，实时修正模型知识边界。
自我校验与反思机制：
- Chain-of-Verification（验证链）通过多次提问校验生成结果。
- Self-Reflection（自我反思）让模型不断迭代反思并修正自己的答案。