大模型知识之幻觉

文章目录

上一轮工业革命已成历史,
这一轮智能革命正在眼前。
这一次,不做旁观者,做深度参与者。
关注我,一起学习大模型。

一、原理基础-何为幻觉

模型生成看似合理、连贯,但事实上不准确或完全虚假的信息。它不是"胡说八道",而是"一本正经地胡说八道"。

比如你问他天气怎么样?

他回复你今天天气晴朗,温度在20-25度之间,体感舒服,建议去户外走走。

你兴高采烈的打开门,发现外面瓢泼大雨。

作为人类,针对"今天天气晴朗,温度在20-25度之间,体感舒服,建议去户外走走。"这句话来说,人类可以判断这句话语法毫无问题,流畅自然,但实际上,它的内容完全是错的。

因为它所吐出的答案是模型在"内部模式"驱动下产生的虚构,类似于人类的"想象"或"错觉",所以叫幻觉。

二、幻觉的类型

上面的例子可以归为事实性幻觉,其他类型还有

  1. 事实性幻觉:捏造事实、日期、数据、引用不存在的论文等。
  2. 输入矛盾幻觉:生成与提供的输入信息相悖的内容。
  3. 逻辑/任务幻觉:在推理步骤中引入错误,或未能忠实遵循指令。

三、根本原因是什么

  1. 模型本质:大语言模型是"下一个词预测器 ",其目标是生成概率上最可能/流畅的文本,而不是追求真实性
  2. 知识局限:训练数据不完整、存在偏见或过时。
  3. 提示与语境:模糊、矛盾的指令或过长的上下文会诱发幻觉。

四、怎么解决

不好解决,因为它本身的机制就是"下一个词预测器 ",只能在一定范围内去控制
1. 预防阶段:

  • 提示工程:明确指令("请仅根据以下信息回答")、提供上下文、要求标注不确定性。
  • 思维链/分步:要求模型展示推理过程,便于人类检查逻辑漏洞。

2. 增强阶段:

  • 检索增强生成(RAG):为模型实时注入来自权威知识库的准确信息,从根本上减少"无中生有"。这是最有效、最主流的工程解决方案。所以知识库很重要

3. 事后检查:

  • 外部验证:对关键输出进行人工或自动化的事实核查、交叉验证。
相关推荐
vlln16 小时前
【论文速读】递归语言模型 (Recursive Language Models): 将上下文作为环境的推理范式
人工智能·语言模型·自然语言处理
玄同76521 小时前
告别 AgentExecutor:LangChain v1.0+ Agent 模块深度迁移指南与实战全解析
人工智能·语言模型·自然语言处理·langchain·nlp·agent·智能体
阿杰学AI1 天前
AI核心知识74——大语言模型之ReAct 范式(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·agent·react范式
2501_948120151 天前
大语言模型与爬虫技术融合的智能数据采集系统
人工智能·爬虫·语言模型
DisonTangor1 天前
美团龙猫开源LongCat-Flash-Lite
人工智能·语言模型·自然语言处理·开源·aigc
AI浩1 天前
PaddleOCR-VL-1.5:迈向用于鲁棒真实场景文档解析的多任务9亿参数视觉语言模型
人工智能·语言模型·自然语言处理
小芳矶1 天前
【langgraph+postgres】用于生产环境的langgraph短期记忆的存取(postgreSQL替代InMemorySaver)
数据库·postgresql·语言模型
阿杰学AI1 天前
AI核心知识73——大语言模型之Shared Vector Space(简洁且通俗易懂版)
人工智能·机器学习·ai·语言模型·自然语言处理·aigc·共享向量空间
Loo国昌2 天前
【Transformer解析】第二阶段:深度解析Encoder、Decoder与Encoder-Decoder架构
人工智能·后端·深度学习·算法·语言模型·自然语言处理·transformer
Hugging Face2 天前
推出 AnyLanguageModel:在 Apple 平台统一本地与远程大语言模型的 API
人工智能·语言模型·自然语言处理