大语言模型添加Rag

一、 什么是 RAG?

大语言模型(如 GLM-4)虽然博学,但有两个致命伤:

  1. 幻觉问题:它会一本正经地胡说八道。

  2. 知识滞后:它不知道你公司昨天的会议纪要,也不知道你个人的私密文档。

RAG 的核心逻辑是:当用户提问时,系统先去你的**私有数据库(ChromaDB)**里检索相关的片段,然后把这些片段和问题一起塞给 AI,让 AI "根据以下参考资料回答问题"。

二、 RAG 的核心流程(五大步骤)

实现 RAG 就像把一本书存进图书馆再借出来的过程:

  1. 加载 (Loading):读取你的文档(PDF、Markdown、TXT 等)。

  2. 分割 (Splitting):由于 AI 一次读不了太长的内容,需要把文档切成 500-1000 字的小块。

  3. 向量化 (Embedding):这是最神奇的一步。利用 Embedding 模型将文字转化为一串数字(向量)。语义相近的话,数字距离就近。

  4. 存储 (Storing) :把这些数字存进 ChromaDB(向量数据库)。

  5. 检索与生成 (Retrieval & Generation)

    • 用户问:"我的项目里前端用了什么技术?"

    • 系统把这个问题也变成向量,去数据库里找最匹配的段落。

    • 将找出的段落 + 原问题发给 GLM-4。

三、 使用 LangChain + ChromaDB 的技术实现

在你的 pythonProject1 后端项目中,你可以按照以下思路集成:

1. 技术栈分工

  • LangChain:框架"胶水",负责串联加载、分割、检索和调用 LLM 的整个流水线。

  • ChromaDB:轻量级向量数据库,负责存储文档向量并进行相似度搜索。

  • Embedding 模型:建议继续使用智谱 AI 提供的 Embedding 接口,保持生态一致。

2. 核心代码逻辑(示意)

你需要安装依赖:

python 复制代码
pip install langchain langchain-community chromadb zhipuai
python 复制代码
from langchain_community.vectorstores import Chroma
from langchain_community.document_loaders import TextLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.embeddings import ZhipuAIEmbeddings

# 1. 加载并切分文档
loader = TextLoader("你的技术文档.md")
documents = loader.load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
texts = text_splitter.split_documents(documents)

# 2. 向量化并存入 ChromaDB
embeddings = ZhipuAIEmbeddings(api_key="你的API_KEY")
vector_db = Chroma.from_documents(documents=texts, embedding=embeddings, persist_directory="./chroma_db")

# 3. 检索
query = "项目的前端框架是什么?"
docs = vector_db.similarity_search(query)

# 4. 构建增强后的 Prompt
context = "\n".join([doc.page_content for doc in docs])
enhanced_prompt = f"请基于以下背景资料回答问题:\n{context}\n\n问题:{query}"

3. 数学原理简述


四、 RAG 有什么用?

  1. 极低成本的"训练":你不需要花费几十万去微调(Fine-tuning)模型,只需把文档扔进数据库,AI 就能学习新知识。

  2. 准确性与溯源:AI 的回答可以要求它标注"来源:技术文档第三章",减少胡编乱造。

  3. 数据安全:敏感文档存在本地 ChromaDB 中,只有检索到的相关片段会发给云端 AI,比直接把全文发给 AI 更安全。

相关推荐
aqi0044 分钟前
15天学会AI应用开发(七)有了大模型为什么还要引入RAG
人工智能·python·大模型·ai编程·ai应用
用户5191495848452 小时前
libcurl Headers API 释放后重利用漏洞:跨请求复用头句柄导致堆内存安全风险
人工智能·aigc
踩蚂蚁2 小时前
自定义语音唤醒词:从训练到部署的完整链路实践
人工智能
用户5191495848452 小时前
CVE-2025-1094 PostgreSQL SQL注入与WebSocket劫持远程代码执行利用工具
人工智能·aigc
IT_陈寒3 小时前
SpringBoot自动配置这个坑,我踩进去又爬出来了
前端·人工智能·后端
冬奇Lab14 小时前
Agent 系列(23):Web Agent——让 Agent 真正浏览网页
人工智能·llm·agent
冬奇Lab14 小时前
每日一个开源项目(第135篇):codebase-memory-mcp - 给 AI Agent 一张代码库的知识图谱
人工智能·开源·llm