大语言模型(LLM)应用开篇 | RAG方法论概述 | 构建知识库探索

大型语言模型应用开篇 | RAG技术 | 构建知识库探索

1、大语言模型(LLM)应用开篇

现在是2025年,DeepSeek凭借卓越的技术实力脱颖而出,Agent(智能体)工作流和专业垂直领域大模型的微调成为了最热门的研究方向之一。

大语言模型的幻觉(hallucination):指通用大语言模型(LLM)在生成内容时,产生看似合理但实际上不准确或不符合事实的信息。这种现象是当前LLM面临的重要挑战之一。

幻觉产生的原因

  • 大模型的生成机制,大语言模型基于大量数据训练,并通过预测下一个词的概率来生成文本,因此可能会产生语法通顺但事实不准确的内容。
  • 训练数据的质量问题:如果训练数据中包含错误或过时的信息,模型可能会学习并传播这些错误,导致幻觉现象的出现。

缓解 LLM 幻觉的方法,也是大模型的应用方式:

  • 检索增强生成(RAG):通过从专业知识库中检索相关信息,结合用户提问,让大模型基于准确的数据生成符合事实的内容,从而减少幻觉现象。
  • 微调(Finetune):利用专业知识库对大模型进行重新训练,优化其在特定领域的理解和生成能力,使其能够更准确地回答专业问题。

几个专业名词

  • Eval:大模型评估(Evaluation),指对大模型性能、能力或效果的系统性测试与分析,是目前业界的一大难点。

  • Agent:智能体,垂直大模型的应用程序,能够解决某一方面的专业问题。

2、RAG技术

RAG(Retrieval-Augmented Generation)(检索,增强,生成):从外部知识库中检索相关信息,作为用户提问的上下文信息,一起输入到LLM中,使LLM生成符合事实内容的方法技术。可以类比为:开卷考试。

其中:

  • 检索:查询数据库
  • 增强:扩充提示词
  • 生成:结合LLM生成文本内容

2.1 基于RAG实现知识库问答系统的基本步骤

  1. 创建知识库:
    • 收集数据:收集PDF、MD等不同格式的数据
    • 数据清洗:去除噪声、重复项和无关信息
    • 文本分割:将文本分割成较小的片段chunks
    • 文本向量化:使用文本嵌入(Embedding)模型。将文本片段转成向量形式
    • 构建向量数据库
  2. 设计检索模块:
    • 问题向量化:使用文本嵌入模型,将用户的提问转成向量形式
    • 相似度检索:计算问题向量和文本片段向量的向量相似度(使用余弦相似度),找到相应的文本片段向量
    • 上下文结合:将相应的文本片段向量和问题向量结合成为提示词(prompt
  3. 生成内容:将提示词输入LLM中,生成相应的文本内容

2.2 RAG与其他技术的关系与区别

RAG 与 LangChain 的关系与区别:

使用 LangChain 技术可以构建以大语言模型为核心的工作流,可以使用 LangChain 技术实现 RAG 系统 。区别: RAG 是一个方法论,LangChain 是一个框架,LangChain 可以实现 RAG 系统,也可以实现其他围绕 LLM 的工作流系统。

RAG 与 LlamaIndex 的关系与区别:

LlamaIndex 可以将用户提供的文档转化为结构化索引,支持快速语义搜索,为 RAG 提供高质量的外部知识输入。

相关推荐
yzx991013几秒前
集成学习实际案例
人工智能·机器学习·集成学习
CodeJourney.2 分钟前
DeepSeek与WPS的动态数据可视化图表构建
数据库·人工智能·信息可视化
jndingxin2 分钟前
OpenCV 图形API(62)特征检测-----在图像中查找最显著的角点函数goodFeaturesToTrack()
人工智能·opencv·计算机视觉
努力犯错5 分钟前
昆仑万维开源SkyReels-V2,解锁无限时长电影级创作,总分83.9%登顶V-Bench榜单
大数据·人工智能·语言模型·开源
小华同学ai11 分钟前
40.8K star!让AI帮你读懂整个互联网:Crawl4AI开源爬虫工具深度解析
人工智能
文慧的科技江湖24 分钟前
图文结合 - 光伏系统产品设计PRD文档 -(慧哥)慧知开源充电桩平台
人工智能·开源·储能·训练·光伏·推理
白熊18829 分钟前
【计算机视觉】CV实战项目 - 基于YOLOv5与DeepSORT的智能交通监控系统:原理、实战与优化
人工智能·yolo·计算机视觉
gis收藏家41 分钟前
几何编码:启用矢量模式地理空间机器学习
人工智能·机器学习
不吃酸的柠檬1 小时前
MATLAB 中的图形绘制
人工智能·机器学习·matlab