AI核心知识24——大语言模型之AI 幻觉（简洁且通俗易懂版）

AI 幻觉 (Hallucination) 是大语言模型最著名、也是最让人头疼的一个缺陷。

用一句最通俗的话来形容，就是："一本正经地胡说八道"。

当模型生成的内容看起来逻辑通顺、语气自信、语法完美，但内容完全是捏造的、错误的或者根本不存在的时候，我们就说 AI 出现了"幻觉"。

幻觉之所以危险，是因为 AI 在胡扯时非常自信。它不会说"我不确定"，而是会像一个权威专家一样告诉你错误答案。

常见的幻觉类型：

捏造事实：
- 用户问： "请介绍一下2024年诺贝尔物理学奖得主张三丰的生平。"
- AI 答： "张三丰，著名物理学家，2024年因发现量子纠缠的新态而获奖，毕业于麻省理工学院..."
- 真相： 张三丰是武侠小说人物，根本没得奖。但 AI 为了配合你的提问，顺着话茬编了一套简历。
编造文献：
- 学术界最头痛的问题。如果你让 AI 写论文综述，它经常会列出作者存在、杂志存在、格式完美，但文章标题根本不存在的参考文献。
逻辑错乱：
- 用户问： "林黛玉倒拔垂杨柳的情节体现了她什么性格？"
- AI 答： "这体现了林黛玉豪爽、力大无穷的一面..."
- 真相： 只有鲁智深才倒拔垂杨柳。AI 把不同书里的情节串味了。

这要回到我们之前聊过的**"预测下一个 Token"**的原理上。

AI 不是搜索引擎，它没有"真伪"的概念，只有"概率"的概念。

模糊的记忆（JPEG 压缩比喻）：

科幻作家 Ted Chiang 有一个精彩的比喻：大模型就像是互联网文本的一张"模糊的 JPEG 图片"。

它记住了大概的轮廓（比如诺贝尔奖得主的简历通常长什么样），但丢失了精确的像素（具体是谁得了奖）。当它试图"还原"图像时，它会用最符合逻辑的像素去填补空白，结果就是"脑补"出了假细节。
讨好型人格：

在 RLHF（人类反馈强化学习）阶段，AI 被训练为"要对用户有帮助"。

有时候，承认"我不知道"会被模型认为是一种失败。为了让用户满意，它宁愿编造一个看起来合理的答案，也不愿留白。
源头数据污染：

如果训练数据里本身就充满了错误的网文、谣言，AI 也会照单全收。

虽然目前无法彻底消除幻觉，但我们可以通过以下手段控制它：

降低 Temperature (温度)：

把温度参数调低，让 AI 少一点创造力，多一点保守。
改善 Prompt (提示工程)：
- 明确告诉 AI："如果你不知道答案，请直接说不知道，不要编造。"（这招非常管用！）
- 提供参考文本：把文章发给它，要求它"仅根据我提供的文章回答问题"。
使用 RAG (检索增强生成)：

这是目前企业界解决幻觉的主流技术。让 AI 先去搜索真实的数据库，拿着真实资料再来回答你。

AI 幻觉是生成式 AI 的"双刃剑"。

因此，永远不要盲目相信 AI 给出的事实性信息，核实（Verify）永远是必要的。