【win10+RAGFlow+Ollama】搭建本地大模型助手(教程+源码)

一、RAGFlow简介

RAGFlow是一个基于对文档深入理解的开源RAG(Retrieval-augmented Generation,检索增强生成)引擎。


主要作用: 让用户创建自有知识库,根据设定的参数对知识库中的文件进行切块处理,用户向大模型提问时,RAGFlow先查找自有知识库中的切块内容,接着把查找到的知识库数据输入到对话大模型中再生成内容输出。

平台特点: 支持丰富的文件类型,如Word、PPT、excel表格、csv/txt、图片、PDF、结构化数据、网页等 。

平台Demo链接: https://demo.ragflow.io.

二、win10 系统本地化部署 RAGFlow 平台

2.1 部署思路

复制代码
1、通过win10系统自带的wsl构建linux虚拟环境;
2、通过docker desktop实现docker环境部署
3、通过ollama实现大模型底座下载管理;
4、将ragflow平台下载到本地linux环境进行运行部署,使用ollama中的大模型能力;
5、自己构建业务数据训练本地大模型;
6、测试训练结果。

2.2 环境要求

复制代码
CPU >= 4 cores
RAM >= 16 GB
Disk >= 50 GB
Docker >= 24.0.0 & Docker Compose >= v2.26.1

2.3 前置条件(win10 环境设置)

可通过代码或者自己配置实现环境设置。
(1)代码修改

复制代码
// 启用适用于 Linux 的 Windows 子系统
dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart

//检查运行 WSL 2 的要求
//若要更新到 WSL 2,需要运行 Windows 10。
// 对于 x64 系统:版本 1903 或更高版本,采用 内部版本 18362 或更高版本。
// 对于 ARM64 系统:版本 2004
// 或更高版本,采用 内部版本 19041 或更高版本。
// 低于 18362 的版本不支持 WSL 2。使用 Windows Update 助手更新 Windows 版本。

//启用虚拟机功能
dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart

//开启"虚拟机平台"后需要重启电脑生效。

//将 WSL 2 设置为默认版本
wsl --set-default-version 2

//查看当前wsl版本列表
wsl --list --verbose

(2)手动配置

注意:开启以上功能需要重启

2.4 开始部署

2.4.1安装Docker

(一)下载Docker安装包

链接: https://docs.docker.com/desktop/setup/install/windows-install/
(二)安装Docker

直接下一步安装就行。
(三)安装Docker成功

2.4.2利用wsl安装ubuntu系统

(一)更新wsl

复制代码
//更新一下可以解决很多后面的问题,自己安装的时候没有更新,搞了很久。
wsl --update


(二)利用 wsl 安装 Ubuntu

复制代码
//安装ubuntu命令
wsl --install -d ubuntu

//安装成功以后会自动提醒创建用户,按照要求创建用户、设置密码
//使用刚创建的账户登录
//因为docker一些操作需要root账户,但是这时候不知道root 密码,通过命令修改密码

sudo passwd
//输入当前登录账户的密码,然后输入新密码,这时候可以使用新密码登录root账户
su root

//至此linux环境安装成功。

(三)建议安装windows terminal,操作wsl安装的系统

复制代码
windows terminal的操作界面会比默认的CMD看起来舒服一点,而且方便单独操作虚拟系统。

(四)按照建议修改系统参数

按照官方建议调整vm.max_map_count参数

复制代码
sysctl vm.max_map_count
sudo sysctl -w vm.max_map_count=262144

(四)下载 ragflow

RAGFlow官方链接: https://infiniflow.cn/docs/v0.7.0/

复制代码
git clone https://github.com/infiniflow/ragflow.git

注意:如果出现下列问题可修改hosts文件解决

复制代码
文件位置:
C:\Windows\System32\drivers\etc
最下方添加:
10.10.211.68 www.github.com

如果效果不明显,可自己调整延迟最低的ip映射

复制代码
访问以下地址查看本地延迟情况,然后选择延迟最低的。
https://ping.chinaz.com/github.com


注意:如果出现下载慢导致下载失败,可使用以下办法尝试解决

2.4.3 安装 RagFlow

官方链接:RagFlow

复制代码
#配置要求
CPU >= 4 核
RAM >= 16 GB
Disk >= 50 GB
Docker >= 24.0.0 & Docker Compose >= v2.26.1
如果你并没有在本机安装 Docker(Windows、Mac,或者 Linux), 可以参考文档 Install Docker Engine 自行安装。

#克隆仓库
git clone https://github.com/infiniflow/ragflow.git

文件比较大,需要下载一段时间,下载完成后:
# 进入下载目录
cd ragflow
#运行ragflow
 docker compose -f docker/docker-compose.yml up -d
 # 注意:这里需要启动本地docker desktop 应用,不然无法执行。

下载、运行成功以后,会在docker desktop 管理端看到以下镜像信息。
复制代码
# 注册账号
登录127.0.0.1:80  进行注册账号登录

2.4.4 安装 Ollama

复制代码
管网下载并安装[Ollama](https://ollama.com/)。
具体安装过程自行查找,安装成功以后可按照以下方式进行验证。
输入以下链接查询服务是否i东
http://127.0.0.1:11434/
复制代码
#根据个人电脑配置情况下载需要的大模型,这里推荐使用qwen2或者qwen2.5,模型大小从效果考虑建设使用7b以上,但是本地设备配置不够的话,可以使用1.5b尝试效果。
#模型下载安装命令(win10中安装)
#列出模型
ollama list
#删除模型
ollama rm 
#显示模型信息
ollama show  
 #下载运行qwen2:7b
 ollama run qwen2:7b
#下载Embedding模型,一个免费的中文的向量化模型
ollama pull shaw/dmeta-embedding-zh

2.4.5 准备个人数据

复制代码
这里提供一个训练数据下载地址,里面有一些业务的训练数据。
https://huggingface.co/InfiniFlow

也可以完全自己构建训练数据集,数据训练格式参考如下:

2.4.6 运行RagFlow

1、注册账户。http://127.0.0.1/login![,](https://i-blog.csdnimg.cn/direct/4e2c99254aa3443280e7735ca6de7346.png)

2、创建知识库

3、配置数据库
4、解析数据集

5、问答测试(我这里使用的是医疗数据,如我没有进行数据训练,测试将无结果)

相关推荐
q_q王18 分钟前
Ubuntu源码版comfyui的安装
大模型·文生图·comfyui·工作流·图生视频
hi,编程哥1 小时前
Docker、ECS 与 K8s 网段冲突:解决跨服务通信中的路由问题
docker·容器·kubernetes
How_doyou_do1 小时前
项目全栈实战-基于智能体、工作流、API模块化Docker集成的创业分析平台
运维·docker·容器
HuggingFace3 小时前
大模型评估排障指南 | 关于可复现性
大模型·llm
AI大模型顾潇3 小时前
[特殊字符] 本地部署DeepSeek大模型:安全加固与企业级集成方案
数据库·人工智能·安全·大模型·llm·微调·llama
simple_whu5 小时前
开启WSL的镜像网络模式
windows·wsl
xbd_zc6 小时前
【Jenkins简单自动化部署案例:基于Docker和Harbor的自动化部署流程记录】
docker·自动化·jenkins·harbor
Coding的叶子6 小时前
React Agent:从零开始构建 AI 智能体|React Flow 实战・智能体开发・低代码平台搭建
人工智能·大模型·工作流·智能体·react flow
我的璨宝宝啊7 小时前
linux小主机搭建自己的nas(三)docker安装nextcloud
linux·运维·docker
大米☋7 小时前
GitLab搭建与使用(SSH和Docker)两种方式
docker·ssh·gitlab