本地搭建检索增强生成(RAG)大模型知识库项目

创建单独的python环境

conda create -n python311 python=3.11.7

conda activate python311

拉取仓库

git clone https://github.com/chatchat-space/Langchain-Chatchat.git

如果下载不了,本地运行代理 v2ray -config config.json

#git设置代理

git config --global http.proxy 127.0.0.1:1090

#取消代理

git config --global --unset http.proxy

进入目录

cd Langchain-Chatchat

安装全部依赖

pip install -r requirements.txt

pip install -r requirements_api.txt

pip install -r requirements_webui.txt

为了支持离线下载

pip install -U huggingface_hub

编辑环境变量

vim ~/.bashrc

在末尾加上

export HF_ENDPOINT=https://hf-mirror.com

使环境变量生效

source ~/.bashrc

下载模型

huggingface-cli download --resume-download THUDM/chatglm3-6b --local-dir chatglm3-6b

huggingface-cli download --resume-download BAAI/bge-large-zh --local-dir bge-large-zh

快速复制配置文件

python copy_config_example.py

修改配置文件

vim configs/model_config.py

修改model目录

MODEL_ROOT_PATH = ""

改为

MODEL_ROOT_PATH = "/root/model"

修改模型,对embedding_model_dict和llm_model_dict参数进行修改。

embedding_model_dict = {

"ernie-tiny": "nghuyong/ernie-3.0-nano-zh",

"ernie-base": "nghuyong/ernie-3.0-base-zh",

"text2vec": "/your_path/text2vec"

}

llm_model_dict = {

"chatyuan": "ClueAI/ChatYuan-large-v2",

"chatglm-6b-int4-qe": "THUDM/chatglm-6b-int4-qe",

"chatglm-6b-int4": "THUDM/chatglm-6b-int4",

"chatglm-6b-int8": "THUDM/chatglm-6b-int8",

"chatglm-6b": "/your_path/chatglm-6b", }

我的text2vec 路径是 /root/model/bge-large-zh

我的chatglm-6b 路径是 /root/model/chatglm3-6b

初始化自己的知识库

python init_database.py --recreate-vs

轻量级启动,使用在线模型和emddings,这个有webui界面操作

python startup.py -a --lite

更加轻量启动,只启动api相关

python startup.py --all-api

参考链接:

1.离线下载huggingface模型

https://blog.csdn.net/weixin_43431218/article/details/135403324

2.基于 ChatGLM-6B 搭建个人专属知识库

https://developer.aliyun.com/article/1212941?spm=a2c6h.12873639.article-detail.7.5b5b1ca7PgM0ht

3.项目文档

https://github.com/chatchat-space/Langchain-Chatchat/wiki/

相关推荐
胡少侠734 分钟前
ReAct Agent:手写 Thought-Action-Observe 循环,从工具调用到真正的 Agent
ai·agent·react·rag
木斯佳3 小时前
前端八股文面经大全:Bilibili 前端实习面(2026-03-20)·深度解析
前端·sse·ssr·rag
小程故事多_804 小时前
重构 RAG 质量标准,一套可落地、可量化的全维度评估框架
人工智能·重构·aigc·ai编程·rag
无极低码13 小时前
ecGlypher新手安装分步指南(标准化流程)
人工智能·算法·自然语言处理·大模型·rag
洛阳泰山18 小时前
MaxKB4j Docker Compose 部署指南
java·docker·llm·springboot·rag·maxkb4j
大傻^1 天前
Spring AI 2.0 企业级 RAG 架构:混合检索、重排序与多模态知识库
人工智能·spring·架构·多模态·rag·混合检索·重排序
大模型RAG和Agent技术实践1 天前
破译Word文档的“语义黑盒”:企业级DOCX RAG架构演进与全链路实战(完整源代码)
人工智能·架构·大模型·word·智能问答·rag
大傻^1 天前
LangChain4j 核心抽象:ChatMessage、UserMessage 与模型无关设计
人工智能·rag·langchain4j
人工智能培训咨询叶梓1 天前
SYNCHECK:提升检索增强型语言模型的可信度
人工智能·深度学习·语言模型·大模型·检索增强·多模态·rag
supericeice1 天前
GraphRAG 和 RAG 的区别:企业知识问答什么时候该升级到 GraphRAG
数据库·知识图谱·rag·graphrag