大语言模型添加Rag

一、 什么是 RAG?

大语言模型(如 GLM-4)虽然博学,但有两个致命伤:

  1. 幻觉问题:它会一本正经地胡说八道。

  2. 知识滞后:它不知道你公司昨天的会议纪要,也不知道你个人的私密文档。

RAG 的核心逻辑是:当用户提问时,系统先去你的**私有数据库(ChromaDB)**里检索相关的片段,然后把这些片段和问题一起塞给 AI,让 AI "根据以下参考资料回答问题"。

二、 RAG 的核心流程(五大步骤)

实现 RAG 就像把一本书存进图书馆再借出来的过程:

  1. 加载 (Loading):读取你的文档(PDF、Markdown、TXT 等)。

  2. 分割 (Splitting):由于 AI 一次读不了太长的内容,需要把文档切成 500-1000 字的小块。

  3. 向量化 (Embedding):这是最神奇的一步。利用 Embedding 模型将文字转化为一串数字(向量)。语义相近的话,数字距离就近。

  4. 存储 (Storing) :把这些数字存进 ChromaDB(向量数据库)。

  5. 检索与生成 (Retrieval & Generation)

    • 用户问:"我的项目里前端用了什么技术?"

    • 系统把这个问题也变成向量,去数据库里找最匹配的段落。

    • 将找出的段落 + 原问题发给 GLM-4。

三、 使用 LangChain + ChromaDB 的技术实现

在你的 pythonProject1 后端项目中,你可以按照以下思路集成:

1. 技术栈分工

  • LangChain:框架"胶水",负责串联加载、分割、检索和调用 LLM 的整个流水线。

  • ChromaDB:轻量级向量数据库,负责存储文档向量并进行相似度搜索。

  • Embedding 模型:建议继续使用智谱 AI 提供的 Embedding 接口,保持生态一致。

2. 核心代码逻辑(示意)

你需要安装依赖:

python 复制代码
pip install langchain langchain-community chromadb zhipuai
python 复制代码
from langchain_community.vectorstores import Chroma
from langchain_community.document_loaders import TextLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.embeddings import ZhipuAIEmbeddings

# 1. 加载并切分文档
loader = TextLoader("你的技术文档.md")
documents = loader.load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
texts = text_splitter.split_documents(documents)

# 2. 向量化并存入 ChromaDB
embeddings = ZhipuAIEmbeddings(api_key="你的API_KEY")
vector_db = Chroma.from_documents(documents=texts, embedding=embeddings, persist_directory="./chroma_db")

# 3. 检索
query = "项目的前端框架是什么?"
docs = vector_db.similarity_search(query)

# 4. 构建增强后的 Prompt
context = "\n".join([doc.page_content for doc in docs])
enhanced_prompt = f"请基于以下背景资料回答问题:\n{context}\n\n问题:{query}"

3. 数学原理简述


四、 RAG 有什么用?

  1. 极低成本的"训练":你不需要花费几十万去微调(Fine-tuning)模型,只需把文档扔进数据库,AI 就能学习新知识。

  2. 准确性与溯源:AI 的回答可以要求它标注"来源:技术文档第三章",减少胡编乱造。

  3. 数据安全:敏感文档存在本地 ChromaDB 中,只有检索到的相关片段会发给云端 AI,比直接把全文发给 AI 更安全。

相关推荐
测试_AI_一辰2 小时前
AI测试工程笔记:AI Agent评测体系设计(从数据集到质量验证)
人工智能·笔记·功能测试·自动化·ai编程
新缸中之脑2 小时前
模型蒸馏综合指南
人工智能
CoderJia程序员甲2 小时前
GitHub 热榜项目 - 日榜(2026-03-17)
人工智能·ai·大模型·github·ai教程
实在智能RPA2 小时前
2026年企业与必要部署智能体吗?深度拆解AI Agent重构生产力的技术路线与选型逻辑
人工智能·重构
深小乐2 小时前
从 AI Skills 学实战技能(一):如何获取抖音、B 站、微博等平台热点话题
人工智能
balmtv2 小时前
Claude国内镜像站实测:可扩展监督与宪法AI,推理架构的范式革命
人工智能·机器学习·架构
AustinCyy2 小时前
【论文笔记】Learning to Retrieve In-Context Examples for Large Language Models
论文阅读·人工智能·语言模型
Dxy12393102162 小时前
PyTorch的自定义学习率调度器详细介绍
人工智能·pytorch·学习
RuiBo_Qiu2 小时前
【LLM进阶-后训练&部署】1. 大语言模型全参数微调:从前向推理到反向传播的底层原理解析
人工智能·算法·语言模型·自然语言处理·ai-native