大语言模型(LLM)应用开篇 | RAG方法论概述 | 构建知识库探索

大型语言模型应用开篇 | RAG技术 | 构建知识库探索

1、大语言模型(LLM)应用开篇

现在是2025年,DeepSeek凭借卓越的技术实力脱颖而出,Agent(智能体)工作流和专业垂直领域大模型的微调成为了最热门的研究方向之一。

大语言模型的幻觉(hallucination):指通用大语言模型(LLM)在生成内容时,产生看似合理但实际上不准确或不符合事实的信息。这种现象是当前LLM面临的重要挑战之一。

幻觉产生的原因

  • 大模型的生成机制,大语言模型基于大量数据训练,并通过预测下一个词的概率来生成文本,因此可能会产生语法通顺但事实不准确的内容。
  • 训练数据的质量问题:如果训练数据中包含错误或过时的信息,模型可能会学习并传播这些错误,导致幻觉现象的出现。

缓解 LLM 幻觉的方法,也是大模型的应用方式:

  • 检索增强生成(RAG):通过从专业知识库中检索相关信息,结合用户提问,让大模型基于准确的数据生成符合事实的内容,从而减少幻觉现象。
  • 微调(Finetune):利用专业知识库对大模型进行重新训练,优化其在特定领域的理解和生成能力,使其能够更准确地回答专业问题。

几个专业名词

  • Eval:大模型评估(Evaluation),指对大模型性能、能力或效果的系统性测试与分析,是目前业界的一大难点。

  • Agent:智能体,垂直大模型的应用程序,能够解决某一方面的专业问题。

2、RAG技术

RAG(Retrieval-Augmented Generation)(检索,增强,生成):从外部知识库中检索相关信息,作为用户提问的上下文信息,一起输入到LLM中,使LLM生成符合事实内容的方法技术。可以类比为:开卷考试。

其中:

  • 检索:查询数据库
  • 增强:扩充提示词
  • 生成:结合LLM生成文本内容

2.1 基于RAG实现知识库问答系统的基本步骤

  1. 创建知识库:
    • 收集数据:收集PDF、MD等不同格式的数据
    • 数据清洗:去除噪声、重复项和无关信息
    • 文本分割:将文本分割成较小的片段chunks
    • 文本向量化:使用文本嵌入(Embedding)模型。将文本片段转成向量形式
    • 构建向量数据库
  2. 设计检索模块:
    • 问题向量化:使用文本嵌入模型,将用户的提问转成向量形式
    • 相似度检索:计算问题向量和文本片段向量的向量相似度(使用余弦相似度),找到相应的文本片段向量
    • 上下文结合:将相应的文本片段向量和问题向量结合成为提示词(prompt
  3. 生成内容:将提示词输入LLM中,生成相应的文本内容

2.2 RAG与其他技术的关系与区别

RAG 与 LangChain 的关系与区别:

使用 LangChain 技术可以构建以大语言模型为核心的工作流,可以使用 LangChain 技术实现 RAG 系统 。区别: RAG 是一个方法论,LangChain 是一个框架,LangChain 可以实现 RAG 系统,也可以实现其他围绕 LLM 的工作流系统。

RAG 与 LlamaIndex 的关系与区别:

LlamaIndex 可以将用户提供的文档转化为结构化索引,支持快速语义搜索,为 RAG 提供高质量的外部知识输入。

相关推荐
_BugMan1 天前
【大模型】理论基础(1):函数与神经网络
人工智能·深度学习·神经网络
AI模块工坊1 天前
CVPR 即插即用 | PConv:重新定义高效卷积,一个让模型“跑”得更快、更省的新范式
人工智能·深度学习·计算机视觉·transformer
lzjava20241 天前
Spring AI加DeepSeek实现一个Prompt聊天机器人
人工智能·spring·prompt
fanstuck1 天前
AI辅助数学建模有哪些优势?
人工智能·数学建模·语言模型·aigc
一只安1 天前
从零开发AI(不依赖任何模型)
人工智能·python
11年老程序猿在线搬砖1 天前
如何搭建自己的量化交易平台
大数据·人工智能·python·自动交易·量化交易系统
Elastic 中国社区官方博客1 天前
Elasticsearch 开放推理 API 增加了对 Google 的 Gemini 模型的支持
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·googlecloud
周杰伦_Jay1 天前
【实战|旅游知识问答RAG系统全链路解析】从配置到落地(附真实日志数据)
大数据·人工智能·分布式·机器学习·架构·旅游·1024程序员节
架构技术专栏1 天前
大模型安全:从对齐问题到对抗性攻击的深度分析
人工智能
麻雀无能为力1 天前
深度学习计算
人工智能·深度学习