大语言模型（LLM）应用开篇 | RAG方法论概述 | 构建知识库探索

在下_诸葛2025-03-30 1:06

大型语言模型应用开篇 | RAG技术 | 构建知识库探索

1、大语言模型（LLM）应用开篇
2、RAG技术
- [2.1 基于RAG实现知识库问答系统的基本步骤](#2.1 基于RAG实现知识库问答系统的基本步骤)
- [2.2 RAG与其他技术的关系与区别](#2.2 RAG与其他技术的关系与区别)

1、大语言模型（LLM）应用开篇

现在是2025年，DeepSeek凭借卓越的技术实力脱颖而出，Agent（智能体）工作流和专业垂直领域大模型的微调成为了最热门的研究方向之一。

大语言模型的幻觉（hallucination）：指通用大语言模型（LLM）在生成内容时，产生看似合理但实际上不准确或不符合事实的信息。这种现象是当前LLM面临的重要挑战之一。

幻觉产生的原因：

大模型的生成机制，大语言模型基于大量数据训练，并通过预测下一个词的概率来生成文本，因此可能会产生语法通顺但事实不准确的内容。
训练数据的质量问题：如果训练数据中包含错误或过时的信息，模型可能会学习并传播这些错误，导致幻觉现象的出现。

缓解 LLM 幻觉的方法，也是大模型的应用方式：

检索增强生成（RAG）：通过从专业知识库中检索相关信息，结合用户提问，让大模型基于准确的数据生成符合事实的内容，从而减少幻觉现象。
微调（Finetune）：利用专业知识库对大模型进行重新训练，优化其在特定领域的理解和生成能力，使其能够更准确地回答专业问题。

几个专业名词：

Eval：大模型评估（Evaluation），指对大模型性能、能力或效果的系统性测试与分析，是目前业界的一大难点。
Agent：智能体，垂直大模型的应用程序，能够解决某一方面的专业问题。

2、RAG技术

RAG（Retrieval-Augmented Generation）（检索，增强，生成）：从外部知识库中检索相关信息，作为用户提问的上下文信息，一起输入到LLM中，使LLM生成符合事实内容的方法技术。可以类比为：开卷考试。

其中：

检索：查询数据库
增强：扩充提示词
生成：结合LLM生成文本内容

2.1 基于RAG实现知识库问答系统的基本步骤

创建知识库：
- 收集数据：收集PDF、MD等不同格式的数据
- 数据清洗：去除噪声、重复项和无关信息
- 文本分割：将文本分割成较小的片段chunks
- 文本向量化：使用文本嵌入（Embedding）模型。将文本片段转成向量形式
- 构建向量数据库
设计检索模块：
- 问题向量化：使用文本嵌入模型，将用户的提问转成向量形式
- 相似度检索：计算问题向量和文本片段向量的向量相似度（使用余弦相似度），找到相应的文本片段向量
- 上下文结合：将相应的文本片段向量和问题向量结合成为提示词（prompt）
生成内容：将提示词输入LLM中，生成相应的文本内容

2.2 RAG与其他技术的关系与区别

RAG 与 LangChain 的关系与区别：

使用 LangChain 技术可以构建以大语言模型为核心的工作流，可以使用 LangChain 技术实现 RAG 系统。区别： RAG 是一个方法论，LangChain 是一个框架，LangChain 可以实现 RAG 系统，也可以实现其他围绕 LLM 的工作流系统。

RAG 与 LlamaIndex 的关系与区别：

LlamaIndex 可以将用户提供的文档转化为结构化索引，支持快速语义搜索，为 RAG 提供高质量的外部知识输入。

上一篇：Java课程设计（双人对战游戏）持续更新......

下一篇：构建大语言模型应用：数据准备（第二部分）

热门推荐

01UV安装并设置国内源 02Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 03DeepSeek更新！速览DeepSeek V3.1新特性 04KGG转MP3工具|非KGM文件|解密音频 05蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 06【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）072025最新国内服务器可用docker源仓库地址大全（2025年8月更新）08阿里开源首个图像生成基础模型——Qwen-Image本地部署教程，超强中文渲染能力刷新SOTA！09NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 10TRAE 规则（Rules）配置指南：个人习惯、团队规范与最佳实践