【win10+RAGFlow+Ollama】搭建本地大模型助手(教程+源码)

一、RAGFlow简介

RAGFlow是一个基于对文档深入理解的开源RAG(Retrieval-augmented Generation,检索增强生成)引擎。


主要作用: 让用户创建自有知识库,根据设定的参数对知识库中的文件进行切块处理,用户向大模型提问时,RAGFlow先查找自有知识库中的切块内容,接着把查找到的知识库数据输入到对话大模型中再生成内容输出。

平台特点: 支持丰富的文件类型,如Word、PPT、excel表格、csv/txt、图片、PDF、结构化数据、网页等 。

平台Demo链接: https://demo.ragflow.io.

二、win10 系统本地化部署 RAGFlow 平台

2.1 部署思路

复制代码
1、通过win10系统自带的wsl构建linux虚拟环境;
2、通过docker desktop实现docker环境部署
3、通过ollama实现大模型底座下载管理;
4、将ragflow平台下载到本地linux环境进行运行部署,使用ollama中的大模型能力;
5、自己构建业务数据训练本地大模型;
6、测试训练结果。

2.2 环境要求

复制代码
CPU >= 4 cores
RAM >= 16 GB
Disk >= 50 GB
Docker >= 24.0.0 & Docker Compose >= v2.26.1

2.3 前置条件(win10 环境设置)

可通过代码或者自己配置实现环境设置。
(1)代码修改

复制代码
// 启用适用于 Linux 的 Windows 子系统
dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart

//检查运行 WSL 2 的要求
//若要更新到 WSL 2,需要运行 Windows 10。
// 对于 x64 系统:版本 1903 或更高版本,采用 内部版本 18362 或更高版本。
// 对于 ARM64 系统:版本 2004
// 或更高版本,采用 内部版本 19041 或更高版本。
// 低于 18362 的版本不支持 WSL 2。使用 Windows Update 助手更新 Windows 版本。

//启用虚拟机功能
dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart

//开启"虚拟机平台"后需要重启电脑生效。

//将 WSL 2 设置为默认版本
wsl --set-default-version 2

//查看当前wsl版本列表
wsl --list --verbose

(2)手动配置

注意:开启以上功能需要重启

2.4 开始部署

2.4.1安装Docker

(一)下载Docker安装包

链接: https://docs.docker.com/desktop/setup/install/windows-install/
(二)安装Docker

直接下一步安装就行。
(三)安装Docker成功

2.4.2利用wsl安装ubuntu系统

(一)更新wsl

复制代码
//更新一下可以解决很多后面的问题,自己安装的时候没有更新,搞了很久。
wsl --update


(二)利用 wsl 安装 Ubuntu

复制代码
//安装ubuntu命令
wsl --install -d ubuntu

//安装成功以后会自动提醒创建用户,按照要求创建用户、设置密码
//使用刚创建的账户登录
//因为docker一些操作需要root账户,但是这时候不知道root 密码,通过命令修改密码

sudo passwd
//输入当前登录账户的密码,然后输入新密码,这时候可以使用新密码登录root账户
su root

//至此linux环境安装成功。

(三)建议安装windows terminal,操作wsl安装的系统

复制代码
windows terminal的操作界面会比默认的CMD看起来舒服一点,而且方便单独操作虚拟系统。

(四)按照建议修改系统参数

按照官方建议调整vm.max_map_count参数

复制代码
sysctl vm.max_map_count
sudo sysctl -w vm.max_map_count=262144

(四)下载 ragflow

RAGFlow官方链接: https://infiniflow.cn/docs/v0.7.0/

复制代码
git clone https://github.com/infiniflow/ragflow.git

注意:如果出现下列问题可修改hosts文件解决

复制代码
文件位置:
C:\Windows\System32\drivers\etc
最下方添加:
10.10.211.68 www.github.com

如果效果不明显,可自己调整延迟最低的ip映射

复制代码
访问以下地址查看本地延迟情况,然后选择延迟最低的。
https://ping.chinaz.com/github.com


注意:如果出现下载慢导致下载失败,可使用以下办法尝试解决

2.4.3 安装 RagFlow

官方链接:RagFlow

复制代码
#配置要求
CPU >= 4 核
RAM >= 16 GB
Disk >= 50 GB
Docker >= 24.0.0 & Docker Compose >= v2.26.1
如果你并没有在本机安装 Docker(Windows、Mac,或者 Linux), 可以参考文档 Install Docker Engine 自行安装。

#克隆仓库
git clone https://github.com/infiniflow/ragflow.git

文件比较大,需要下载一段时间,下载完成后:
# 进入下载目录
cd ragflow
#运行ragflow
 docker compose -f docker/docker-compose.yml up -d
 # 注意:这里需要启动本地docker desktop 应用,不然无法执行。

下载、运行成功以后,会在docker desktop 管理端看到以下镜像信息。
复制代码
# 注册账号
登录127.0.0.1:80  进行注册账号登录

2.4.4 安装 Ollama

复制代码
管网下载并安装[Ollama](https://ollama.com/)。
具体安装过程自行查找,安装成功以后可按照以下方式进行验证。
输入以下链接查询服务是否i东
http://127.0.0.1:11434/
复制代码
#根据个人电脑配置情况下载需要的大模型,这里推荐使用qwen2或者qwen2.5,模型大小从效果考虑建设使用7b以上,但是本地设备配置不够的话,可以使用1.5b尝试效果。
#模型下载安装命令(win10中安装)
#列出模型
ollama list
#删除模型
ollama rm 
#显示模型信息
ollama show  
 #下载运行qwen2:7b
 ollama run qwen2:7b
#下载Embedding模型,一个免费的中文的向量化模型
ollama pull shaw/dmeta-embedding-zh

2.4.5 准备个人数据

复制代码
这里提供一个训练数据下载地址,里面有一些业务的训练数据。
https://huggingface.co/InfiniFlow

也可以完全自己构建训练数据集,数据训练格式参考如下:

2.4.6 运行RagFlow

1、注册账户。http://127.0.0.1/login![,](https://i-blog.csdnimg.cn/direct/4e2c99254aa3443280e7735ca6de7346.png)

2、创建知识库

3、配置数据库
4、解析数据集

5、问答测试(我这里使用的是医疗数据,如我没有进行数据训练,测试将无结果)

相关推荐
芥子沫34 分钟前
《玩转Docker》[应用篇13]:Docker安装部署Emby及使用技巧:家庭媒体服务器
docker·视频·emby
居7然42 分钟前
Attention注意力机制:原理、实现与优化全解析
人工智能·深度学习·大模型·transformer·embedding
爱宇阳2 小时前
从容器化到自动化:Spring Boot 项目 Docker 部署与 GitLab CI/CD 集成 Harbor 全流程
spring boot·docker·自动化
大千AI助手2 小时前
探索LoSA:动态低秩稀疏自适应——大模型高效微调的新突破
人工智能·神经网络·lora·大模型·llm·大千ai助手·稀疏微调
PKNLP4 小时前
07.docker介绍与常用命令
运维·docker·容器
人工智能训练5 小时前
在ubuntu系统中如何将docker安装在指定目录
linux·运维·服务器·人工智能·ubuntu·docker·ai编程
大模型教程6 小时前
30分钟内搞定!在本地电脑上部署属于你自己的大模型
llm·agent·ollama
爱宇阳6 小时前
Java Spring Boot 项目 Docker 容器化部署教程
java·spring boot·docker
掘根6 小时前
【Docker】网络
网络·docker·容器
爱宇阳7 小时前
从容器化到自动化:Vue3 项目 Docker 部署与 GitLab CI/CD 集成 Harbor 全流程
docker·自动化·gitlab