ragflow 构建本地知识库指南

目录

[1. 安装基础环境](#1. 安装基础环境)

[2. 安装vllm启动本地模型](#2. 安装vllm启动本地模型)

[3. 配置本地知识库](#3. 配置本地知识库)

[4. 扩展](#4. 扩展)


官方文档 https://ragflow.com.cn/docs/

1. 安装基础环境

复制代码
curl -SL https://github.com/docker/compose/releases/download/v2.30.3/docker-compose-linux-x86_64 -o /usr/local/bin/docker-compose
#将可执行权限赋予安装目标路径中的独立二进制文件
sudo chmod +x /usr/local/bin/docker-compose
sudo ln -s /usr/local/bin/docker-compose /usr/bin/docker-compose
sudo sysctl -w vm.max_map_count=262144
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
git checkout -f v0.23.0
使用预构建的 Docker 镜像并启动服务器

# Use CPU for DeepDoc tasks:
docker compose -f docker-compose.yml up -d

一共五个容器,如果镜像拉取不下来可以去 https://docker.aityp.com/ 手动先pull下来,把镜像tag改成 docker-compose-base.yml 里面的内容

默认数据都在docker的volume下面,可以改docker-compose-base.yml自定义目录

默认端口80;.env文件可以改端口

2. 安装vllm启动本地模型

ollmam比较简单新手建议使用可以参考:https://likaiyuan00.github.io/2025/05/12/%E9%83%A8%E7%BD%B2%E6%9C%AC%E5%9C%B0%E5%A4%A7%E6%A8%A1%E5%9E%8B/

集成

https://github.com/infiniflow/ragflow/blob/main/docs/guides/models/deploy_local_llm.mdx

bash 复制代码
#https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
#vllm启动Embedding和llm模型
#python3.12 pip install vllm modelscope

modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B --local_dir /mnt/DeepSeek-R1-Distill-Qwen-1.5B

source vllm/bin/activate

vllm serve /mnt/Qwen3-Embedding-8B/ --host 0.0.0.0

CUDA_VISIBLE_DEVICES=1 vllm serve /mnt/DeepSeek-R1-Distill-Qwen-1.5B/ --port 8001 --host 0.0.0.0
#如果知识库文本较多,需要提升召回质量可以再跑一个Rerank模型去排序

3. 配置本地知识库

一定要点下面的保存,发现已经去检索知识库了

4. 扩展

如果想用代码自定义开发可以使用 LlamaIndex

LlamaIndex - LlamaIndex 框架

相关推荐
火山引擎开发者社区14 小时前
火山AgentPlan/CodingPlan同步上线GLM-5.2
人工智能
冬奇Lab15 小时前
Skill 系列(05):Skill 工作流串联——4 种模式实测,并发加速 1.5x
人工智能·开源
冬奇Lab15 小时前
每日一个开源项目(第141篇):hiring-agent - HackerRank 开源了他们的简历评分系统,你的简历能得几分?
人工智能·面试·开源
甲维斯16 小时前
又升级咯!坦克大战2026,科技与复古并存!
前端·人工智能·游戏开发
姗姗来迟了18 小时前
用React Hook封装AI对话状态
人工智能
Goodbye18 小时前
从 Token 到 Embedding:LLM 核心基础深度解析
javascript·人工智能
阿瑞IT18 小时前
AI Agent 在甘特计划变更场景中的动态响应工程实践
人工智能
用户9385156350718 小时前
工具调用背后:LLM 如何突破“缸中大脑”,操控真实世界?
javascript·人工智能