AI学习_03_LangChain_RAG基础概念

LangChain是什么

LangChain是一个开发LLM相关业务功能的集大成者，是一个Python的第三方库，提供了各种功能的API。

提供：

LangChain是后续学习RAG开发的主力框架

python 复制代码

pip install langchain langchain-community langchain-ollama dashscope chromadb

通用的基础大模型存在一些问题：

解释：

RAG(Retrieval-Augmented Generation)即检索增强生成，为大模型提供了从特定数据源检索到的信息，以此来修正模型的答案。可以总结为一个公式：RAG = 检索技术 + LLM 提示。

RAG标准流程：

RAG有两条线：

RAG 标准流程由索引（Indexing）、检索（Retriever）和生成（Generation）三个核心阶段组成。

详细流程：

索引阶段，通过处理多种来源多种格式的文档提取其中文本，将其切分为标准长度的文本块（chunk），并进行嵌入向量化（embedding），向量存储在向量数据库（vector database）中。
- 加载文件
- 内容提取
- 文本分割，形成chunk
- 文本向量化
- 存向量数据库
检索阶段，用户输入的查询（query）被转化为向量表示，通过相似度匹配从向量数据库中检索出最相关的文本块。
- query向量化
- 在文本向量中匹配出与问句向量相似的top_k个
生成阶段，检索到的相关文本与原始查询共同构成提示词（Prompt），输入大语言模型（LLM），生成精确且具备上下文关联的回答。
- 匹配出的文本作为上下文和问题一起添加到prompt中
- 提交给LLM生成答案