大语言模型添加Rag

一、 什么是 RAG?

大语言模型(如 GLM-4)虽然博学,但有两个致命伤:

  1. 幻觉问题:它会一本正经地胡说八道。

  2. 知识滞后:它不知道你公司昨天的会议纪要,也不知道你个人的私密文档。

RAG 的核心逻辑是:当用户提问时,系统先去你的**私有数据库(ChromaDB)**里检索相关的片段,然后把这些片段和问题一起塞给 AI,让 AI "根据以下参考资料回答问题"。

二、 RAG 的核心流程(五大步骤)

实现 RAG 就像把一本书存进图书馆再借出来的过程:

  1. 加载 (Loading):读取你的文档(PDF、Markdown、TXT 等)。

  2. 分割 (Splitting):由于 AI 一次读不了太长的内容,需要把文档切成 500-1000 字的小块。

  3. 向量化 (Embedding):这是最神奇的一步。利用 Embedding 模型将文字转化为一串数字(向量)。语义相近的话,数字距离就近。

  4. 存储 (Storing) :把这些数字存进 ChromaDB(向量数据库)。

  5. 检索与生成 (Retrieval & Generation)

    • 用户问:"我的项目里前端用了什么技术?"

    • 系统把这个问题也变成向量,去数据库里找最匹配的段落。

    • 将找出的段落 + 原问题发给 GLM-4。

三、 使用 LangChain + ChromaDB 的技术实现

在你的 pythonProject1 后端项目中,你可以按照以下思路集成:

1. 技术栈分工

  • LangChain:框架"胶水",负责串联加载、分割、检索和调用 LLM 的整个流水线。

  • ChromaDB:轻量级向量数据库,负责存储文档向量并进行相似度搜索。

  • Embedding 模型:建议继续使用智谱 AI 提供的 Embedding 接口,保持生态一致。

2. 核心代码逻辑(示意)

你需要安装依赖:

python 复制代码
pip install langchain langchain-community chromadb zhipuai
python 复制代码
from langchain_community.vectorstores import Chroma
from langchain_community.document_loaders import TextLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.embeddings import ZhipuAIEmbeddings

# 1. 加载并切分文档
loader = TextLoader("你的技术文档.md")
documents = loader.load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
texts = text_splitter.split_documents(documents)

# 2. 向量化并存入 ChromaDB
embeddings = ZhipuAIEmbeddings(api_key="你的API_KEY")
vector_db = Chroma.from_documents(documents=texts, embedding=embeddings, persist_directory="./chroma_db")

# 3. 检索
query = "项目的前端框架是什么?"
docs = vector_db.similarity_search(query)

# 4. 构建增强后的 Prompt
context = "\n".join([doc.page_content for doc in docs])
enhanced_prompt = f"请基于以下背景资料回答问题:\n{context}\n\n问题:{query}"

3. 数学原理简述


四、 RAG 有什么用?

  1. 极低成本的"训练":你不需要花费几十万去微调(Fine-tuning)模型,只需把文档扔进数据库,AI 就能学习新知识。

  2. 准确性与溯源:AI 的回答可以要求它标注"来源:技术文档第三章",减少胡编乱造。

  3. 数据安全:敏感文档存在本地 ChromaDB 中,只有检索到的相关片段会发给云端 AI,比直接把全文发给 AI 更安全。

相关推荐
魔术师Grace1 天前
从传统企业架构到 OPC 模式,AI 到底改变了什么?
人工智能·程序员
沪漂阿龙1 天前
LangGraph 持久化完全指南:从零搭建永不丢失状态的 AI Agent 系统
人工智能·流程图
杨浦老苏1 天前
大模型安全接入网关LinkAI
人工智能·docker·ai·群晖·隐私保护
档案宝档案管理1 天前
权限分级管控,全程可追溯,筑牢会计档案安全防线
运维·网络·人工智能
Chat_zhanggong3451 天前
主推RK3567J作用有哪些?
人工智能·嵌入式硬件
qq_411262421 天前
四博 AI 机械臂台灯智能音箱方案:让台灯具备视觉、语音、动作和学习陪伴能力
人工智能·语音识别
AI+程序员在路上1 天前
VS Code 完全使用指南:下载、安装、核心功能与 内置AI 编程助手实战
开发语言·人工智能·windows·开源
coderyi1 天前
Agent协作简析
人工智能
霍小毛1 天前
破局工业数据孤岛!数字孪生+AI智慧设备资产管理平台,重构智能运维新范式
人工智能·重构
向量引擎1 天前
向量引擎的新时代:从OpenClaw、Hermes到GPT Image 2与龙虾(Lobster)模型的深度对比与应用
人工智能·gpt·aigc·api·ai编程·key·api调用