在ubuntu22.04上部署RagFlow一个深度文档理解的开源 RAG

RAGFlow 是一个基于深度文档理解的开源 RAG(Retrieval-Augmented Generation)引擎。它为任何规模的企业提供简化的 RAG 工作流程,结合 LLM(大型语言模型)以提供真实的问答功能,并由来自各种复杂格式数据的有根据的引用提供支持。

主要特点

1、"品质进,品质出"

基于深度文档理解,从具有复杂格式的非结构化数据中提取知识。

找到"数据大海捞针",字面上是无限的令牌。

2、 基于模板的分块

智能且可解释。

大量模板选项可供选择。

3、 接地引文,减少幻觉

文本分块的可视化,允许人为干预。

快速查看关键参考文献和可追溯的引文,以支持有根据的答案。

4、 与异构数据源的兼容性

支持 Word、幻灯片、excel、txt、图像、扫描副本、结构化数据、网页等。

5、 自动化且轻松的 RAG 工作流程

简化的 RAG 编排可满足个人和大型企业的需求。

可配置的 LLM 以及嵌入模型。

多次召回与融合重新排名配对。

直观的 API,可与业务无缝集成。

下面我们就开始介绍部署

一、软件硬件要求

CPU >= 4 核

RAM >= 16 GB

磁盘 >= 50 GB

Docker >= 24.0.0 和 Docker Compose >= v2.26.1

Docker安装

复制代码
sudo apt-get install docker.io

docker-compose的安装

复制代码
curl -L "https://github.com/docker/compose/releases/download/v2.29.1/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose

设置系统参数

复制代码
systemctl enable docker
systemctl start docker

二、以docker方式安装RagFlow

1、系统参数设置

复制代码
# In this case, we set it to 262144:
$ sudo sysctl -w vm.max_map_count=262144

2、克隆代码

复制代码
$ git clone https://github.com/infiniflow/ragflow.git

3、构建预构建的 Docker 镜像并启动服务器:

复制代码
$ cd ragflow/docker
$ chmod +x ./entrypoint.sh
$ docker compose up -d

如果你非常幸运,但么执行完上面就安装完了,但因为众所周知的不知道什么原因,如果无法下载docker镜像文件,小伙伴可以从我们百度网盘下载:

链接:https://pan.baidu.com/s/1afq0C2fTyoctU2df2Uhs8g?pwd=jw5f

提取码:jw5f

下载后,执行下面的导入镜像文件

复制代码
#下载五个docker文件,并安装
docker load -i [文件名]

然后再执行:

复制代码
$ cd ragflow/docker
$ chmod +x ./entrypoint.sh
$ docker compose up -d

三:运行及设置

运行直接打开浏览器,输入IP地下即可。

http://ip:80

首次登录,需要注册一个帐号。

四:设置LLM

这里就具体说了,我是选了本地的ollama,

使用本地ollama,这里的API-Key可以不填。

五:结束语

我们先后介绍了FastGPT、Flowise和今天我们介绍的RagFlow。大家可以对比测试一下,看看哪个功能更多,更好用。

相关推荐
ClouGence4 小时前
CloudDM 3.1.0 发布:初始化、驱动管理与升级体验全面优化
docker·开源·数据库管理·企业开发·数据库工具·数据库运维
GPUStack5 小时前
没有 GPU,还能跑大模型吗?vLLM vs llama.cpp 实测对比
人工智能·开源
该昵称用户已存在5 小时前
开源赋能数据资产化:MyEMS 能源中台的碳数据治理与价值释放设计
开源·能源
云樱梦海6 小时前
FunASR:阿里达摩院开源的工业级语音识别工具包(4 款模型 + Gradio 可视化)
人工智能·开源·语音识别
X54先生(人文科技)7 小时前
《元创力》纪实录·桥段刻舟遗碑:当“唯一解”的文明抵达终点
人工智能·开源·开源协议·零知识证明
DisonTangor7 小时前
微软重磅开源 Lens: 重新思考基础文本到图像模型的训练效率
人工智能·microsoft·ai作画·开源·aigc
星栈7 小时前
我把售后模块砍到只剩 64 行:Rust 全栈 CRM 的 MVP 取舍实录
前端·后端·开源
darkb1rd8 小时前
Odysseus:私有化 AI 工作流部署实战指南
开源·github·好物分享
智碳未来科技有限公司8 小时前
双碳时代的工业能源数字化:智碳 EMS 开源系统技术解析与实践
开源·能源·能源管理系统·开源能源管理系统·能碳管理系统·绿色工厂申报
数据法师8 小时前
BeeCount技术深度解析:一款开源免费的本地化智能记账工具
开源