下一代开源 RAG 引擎,让你的 AI 检索与推理能力直接起飞
在大模型席卷各行各业的当下,企业对 "让 AI 读懂自家文档" 的需求愈发迫切 ------ 但市面上多数 RAG 工具要么卡在 "文档读不懂、信息提不出" 的浅层处理,要么依赖付费服务导致成本高企。
直到星哥发现了ragflow这款开源神器,才算真正解决了 "深度文档理解 + 低成本落地" 的核心痛点。
今天就带大家好好拆解下,这款基于深度文档理解的 RAG 引擎,到底能给企业和开发者带来什么惊喜。
一、RAGFlow 是什么?
RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,通过融合前沿的 RAG 技术与 Agent 能力,为大型语言模型提供卓越的上下文层。它提供可适配任意规模企业的端到端 RAG 工作流,凭借融合式上下文引擎与预置的 Agent 模板,助力开发者以极致效率与精度将复杂数据转化为高可信、生产级的人工智能系统。
简单说,ragflow 是一款开源的检索增强生成(RAG)引擎,核心定位是 "让 AI 能真正'读懂'复杂文档,再生成精准回答"。和传统 RAG 工具只做 "关键词匹配" 不同,它的核心优势落在 "深度文档理解" 上 ------ 不管是 PDF 里的表格、Word 里的多级标题,还是 PPT 里的图文组合,它都能拆解成结构化信息,避免了 "找得到文档、却抽不出关键信息" 的尴尬。
它的目标很直接:让复杂数据转化为高精度、可落地的 AI 系统,无论是个人项目还是企业级应用,都能快速部署。
核心亮点:
- • 融合 Agent 能力:不仅能检索,还能执行任务、调用工具。
- • 企业级可扩展性:支持从个人开发到大规模生产环境的平滑迁移。
- • 预置模板与工作流:减少重复造轮子,快速构建业务场景。

img
二、安装RAGFlow
系统:Linux
1. 环境要求
- • CPU ≥ 4 核
- • 内存 ≥ 16 GB
- • 磁盘 ≥ 50 GB
- • Docker ≥ 24.0.0 & Docker Compose ≥ v2.26.1
确保系统已安装 Docker ≥ 24.0.0 且 Docker Compose ≥ v2.26.1 ,以满足容器编排需求。同时需配置系统参数 vm.max_map_count
≥ 262144(Elasticsearch 运行必需),检查与设置命令如下:
- • 检查当前值:
sysctl vm.max_map_count
- • 临时设置:
sudo sysctl -w vm.max_map_count=262144
(重启后失效) - • 永久生效:编辑
/etc/sysctl.conf
文件,添加vm.max_map_count=262144
并执行sudo sysctl -p
2. 安装步骤
bash
# 克隆仓库
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
# 启动服务(CPU 版本)
docker compose -f docker-compose.yml up -d
由于测试机的80和443端口被占用了,所以需要修改端口号
vi docker-compose.yml
把80和443改成 880和 8443
- ${SVR_HTTP_PORT}:9380
- 880:80
- 8443:443
# GPU 加速版本
docker compose -f docker-compose-gpu.yml up -d
如果你遇到 Docker 镜像拉不下来的问题,可以在 docker/.env 文件内根据变量 RAGFLOW_IMAGE 的注释提示选择华为云或者阿里云的相应镜像。
bash
华为云镜像名:swr.cn-north-4.myhuaweicloud.com/infiniflow/ragflow
阿里云镜像名:registry.cn-hangzhou.aliyuncs.com/infiniflow/ragflow
vi docker/.env

img
再执行
markdown
docker compose -f docker-compose.yml up -d
服务器启动成功后服务器状态:
docker logs -f ragflow-server
报错:
ini
✘ redis Error context canceled 1.1s error pulling image configuration: download failed after attempts=1: toomanyrequests: too many requests
把阿里的改成华为的

img
3. 访问服务
浏览器访问 IP+端口号
,即可进入 RAGFlow 管理界面。

img
点击注册按钮
4.登录页面
再登录即可进入RAGFlow后台

img
5.系统状态

img
6.设置大模型

img
查看docker状态
bash
docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
d6d392f925af swr.cn-north-4.myhuaweicloud.com/infiniflow/ragflow:nightly-slim "./entrypoint.sh" 8 minutes ago Up 8 minutes 0.0.0.0:5678-5679->5678-5679/tcp, :::5678-5679->5678-5679/tcp, 0.0.0.0:9380->9380/tcp, :::9380->9380/tcp, 0.0.0.0:9382->9382/tcp, :::9382->9382/tcp, 0.0.0.0:880->80/tcp, :::880->80/tcp, 0.0.0.0:8443->443/tcp, :::8443->443/tcp ragflow-server
57504a5df5f0 elasticsearch:8.11.3 "/bin/tini -- /usr/l..." 8 minutes ago Up 8 minutes (healthy) 9300/tcp, 0.0.0.0:1200->9200/tcp, :::1200->9200/tcp ragflow-es-01
4e481e75a912 quay.io/minio/minio:RELEASE.2025-06-13T11-33-47Z "/usr/bin/docker-ent..." 8 minutes ago Up 8 minutes (healthy) 0.0.0.0:9000-9001->9000-9001/tcp, :::9000-9001->9000-9001/tcp ragflow-minio
e943a5bfeac4 mysql:8.0.39 "docker-entrypoint.s..." 8 minutes ago Up 8 minutes (healthy) 33060/tcp, 0.0.0.0:5455->3306/tcp, :::5455->3306/tcp ragflow-mysql
bb599ec58494 valkey/valkey:8 "docker-entrypoint.s..." 8 minutes ago Up 8 minutes (healthy) 0.0.0.0:6379->6379/tcp, :::6379->6379/tcp ragflow-redis
三、系统架构概览
RAGFlow 的架构由以下核心模块组成:
- • 数据接入层:支持多种数据源接入与解析
- • 检索与索引引擎:默认 Elasticsearch,可切换到 Infinity
- • Agent 执行层:支持多步推理、工具调用、代码执行
- • 可视化管理界面:方便非技术人员参与数据管理与调优
架构设计的重点是解耦 与可扩展性,方便根据业务需求替换或扩展模块。
四、应用场景
- • 企业知识库问答:快速构建内部知识问答系统
- • 多模态文档解析:支持 PDF、图片、扫描件等复杂文档
- • 智能客服与业务助手:结合 Agent 实现自动化任务处理
- • 跨语言检索与推理:支持多语言查询与回答
五、星哥的观点
RAGFlow 不只是一个 RAG 引擎,它更像是一个AI 应用加速器。
对于想要快速落地 AI 检索与推理能力的团队来说,它的开源、可扩展、可视化特性非常有吸引力。
尤其是它的 Agent 能力,让 RAG 不再只是"查找答案",而是能执行任务、调用外部工具、完成多步推理。
如果你正打算构建一个高精度、可追溯、可扩展的 AI 系统,RAGFlow 值得你花时间深入研究。
参考:
less
- [RAGFlow 官方 GitHub 仓库](https://github.com/infiniflow/ragflow)
- [RAGFlow 在线 Demo](https://demo.ragflow.io/)
写文不易,如果你都看到了这里,请点个赞和在看,分享给更多的朋友;也别忘了关注星哥玩云!这里有满满的干货分享,还有轻松有趣的技术交流~点个赞、分享给身边的小伙伴,一起成长,一起玩转技术世界吧! 😊