大模型知识之幻觉

空城雀2025-12-20 18:41

文章目录

一、原理基础-何为幻觉
二、幻觉的类型
三、根本原因是什么
四、怎么解决

上一轮工业革命已成历史，
这一轮智能革命正在眼前。
这一次，不做旁观者，做深度参与者。
关注我，一起学习大模型。

一、原理基础-何为幻觉

模型生成看似合理、连贯，但事实上不准确或完全虚假的信息。它不是"胡说八道"，而是"一本正经地胡说八道"。

比如你问他天气怎么样？

他回复你今天天气晴朗，温度在20-25度之间，体感舒服，建议去户外走走。

你兴高采烈的打开门，发现外面瓢泼大雨。

作为人类，针对"今天天气晴朗，温度在20-25度之间，体感舒服，建议去户外走走。"这句话来说，人类可以判断这句话语法毫无问题，流畅自然，但实际上，它的内容完全是错的。

因为它所吐出的答案是模型在"内部模式"驱动下产生的虚构，类似于人类的"想象"或"错觉"，所以叫幻觉。

二、幻觉的类型

上面的例子可以归为事实性幻觉，其他类型还有

事实性幻觉：捏造事实、日期、数据、引用不存在的论文等。
输入矛盾幻觉：生成与提供的输入信息相悖的内容。
逻辑/任务幻觉：在推理步骤中引入错误，或未能忠实遵循指令。

三、根本原因是什么

模型本质：大语言模型是"下一个词预测器 "，其目标是生成概率上最可能/流畅的文本，而不是追求真实性。
知识局限：训练数据不完整、存在偏见或过时。
提示与语境：模糊、矛盾的指令或过长的上下文会诱发幻觉。

四、怎么解决

不好解决，因为它本身的机制就是"下一个词预测器 "，只能在一定范围内去控制
1. 预防阶段：

提示工程：明确指令（"请仅根据以下信息回答"）、提供上下文、要求标注不确定性。
思维链/分步：要求模型展示推理过程，便于人类检查逻辑漏洞。

2. 增强阶段：

检索增强生成（RAG）：为模型实时注入来自权威知识库的准确信息，从根本上减少"无中生有"。这是最有效、最主流的工程解决方案。所以知识库很重要。

3. 事后检查：

外部验证：对关键输出进行人工或自动化的事实核查、交叉验证。

上一篇：深入理解 Model Context Protocol (MCP)：从原理到实践

下一篇：表格识别技术：通过深度学习方法，实现精准还原纸质表格的结构、内容与格式，并直接导出为可编辑的Excel文件

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04OpenClaw + 飞书（Feishu）环境搭建指南 05Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 06OpenClaw优化飞书API 额度已耗尽问题 07Window 10部署openclaw报错node.exe : npm error code 128 08Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 09OpenClaw大龙虾机器人完整安装教程 10OpenClaw 接入阿里云百炼 Coding Plan 指南