ragflow 构建本地知识库指南

目录

[1. 安装基础环境](#1. 安装基础环境)

[2. 安装vllm启动本地模型](#2. 安装vllm启动本地模型)

[3. 配置本地知识库](#3. 配置本地知识库)

[4. 扩展](#4. 扩展)


官方文档 https://ragflow.com.cn/docs/

1. 安装基础环境

复制代码
curl -SL https://github.com/docker/compose/releases/download/v2.30.3/docker-compose-linux-x86_64 -o /usr/local/bin/docker-compose
#将可执行权限赋予安装目标路径中的独立二进制文件
sudo chmod +x /usr/local/bin/docker-compose
sudo ln -s /usr/local/bin/docker-compose /usr/bin/docker-compose
sudo sysctl -w vm.max_map_count=262144
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
git checkout -f v0.23.0
使用预构建的 Docker 镜像并启动服务器

# Use CPU for DeepDoc tasks:
docker compose -f docker-compose.yml up -d

一共五个容器,如果镜像拉取不下来可以去 https://docker.aityp.com/ 手动先pull下来,把镜像tag改成 docker-compose-base.yml 里面的内容

默认数据都在docker的volume下面,可以改docker-compose-base.yml自定义目录

默认端口80;.env文件可以改端口

2. 安装vllm启动本地模型

ollmam比较简单新手建议使用可以参考:https://likaiyuan00.github.io/2025/05/12/%E9%83%A8%E7%BD%B2%E6%9C%AC%E5%9C%B0%E5%A4%A7%E6%A8%A1%E5%9E%8B/

集成

https://github.com/infiniflow/ragflow/blob/main/docs/guides/models/deploy_local_llm.mdx

bash 复制代码
#https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
#vllm启动Embedding和llm模型
#python3.12 pip install vllm modelscope

modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B --local_dir /mnt/DeepSeek-R1-Distill-Qwen-1.5B

source vllm/bin/activate

vllm serve /mnt/Qwen3-Embedding-8B/ --host 0.0.0.0

CUDA_VISIBLE_DEVICES=1 vllm serve /mnt/DeepSeek-R1-Distill-Qwen-1.5B/ --port 8001 --host 0.0.0.0
#如果知识库文本较多,需要提升召回质量可以再跑一个Rerank模型去排序

3. 配置本地知识库

一定要点下面的保存,发现已经去检索知识库了

4. 扩展

如果想用代码自定义开发可以使用 LlamaIndex

LlamaIndex - LlamaIndex 框架

相关推荐
暴躁小师兄数据学院3 分钟前
【AI大数据工程师特训笔记】第14讲:Linux操作系统与shell脚本
大数据·人工智能·笔记
linyanRPA5 分钟前
影刀RPA+Python店群自动化实战:自研环境隔离引擎,200店铺并发不卡不串号
python·自动化·rpa
tedcloud12312 分钟前
cc-switch评测:多AI Coding Agent管理工具详解
数据库·人工智能·sql·学习·自动化
高洁0119 分钟前
大模型落地行业第一线
人工智能·数据挖掘·transformer·virtualenv·知识图谱
weixin_3975740931 分钟前
AI Agent三层架构设计原理
人工智能·dubbo
机 _ 长33 分钟前
YOLO12-Mamba:融合MambaVision思想的目标检测创新实践
人工智能·目标检测·计算机视觉
阿里云大数据AI技术36 分钟前
阿里云 ES AI 多模态搜索(百炼)
人工智能
活跃的煤矿打工人41 分钟前
【星海出品】大模型微调-Part-One
人工智能·语言模型·gpu算力
coldstarry43 分钟前
sheng的学习笔记-AI-xgboost
人工智能·机器学习·boosting
2601_959986241 小时前
M4Markets:把工具可用性做到位——逻辑梳理与提示整理
大数据·人工智能