LLM之RAG实战(四十四)| rag-chatbot:支持Huggingface和Ollama任意模型的多PDF本地RAG方案

特点:

  • 支持本地运行和Kaggle (new)运行
  • 支持HuggingfaceOllama 的任意模型
  • Process multiple PDF inputs.
  • Chat with multiples languages (Coming soon).
  • Simple UI with Gradio.

一、安装使用

1.1 Kaggle(推荐)

Step1:把https://github.com/datvodinh/rag-chatbot/blob/main/notebooks/kaggle.ipynb脚本导入到Kaggle。

Step2:把<YOUR_NGROK_TOKEN>替换为自己的token。

1.2 本地安装

a)克隆项目

复制代码
git clone https://github.com/datvodinh/rag-chatbot.gitcd rag-chatbot

b)安装

Docker方式

复制代码
docker compose up --build

脚本方式(Ollama, Ngrok, python package)

复制代码
source ./scripts/install_extra.sh

手动安装

Step1:Ollama
Step2:Ngrok

Step3:安装rag_chatbot包

复制代码
source ./scripts/install.sh

c)启动

复制代码
source ./scripts/run.sh

或者

复制代码
python -m rag_chatbot --host localhost

使用Ngrok

复制代码
source ./scripts/run.sh --ngrok

此时,会下载大模型

大模型的配置文件:https://github.com/datvodinh/rag-chatbot/blob/main/rag_chatbot/setting/setting.py

LLM默认是:llama3:8b-instruct-q8_0

Embedding模型默认是:BAAI/bge-large-en-v1.5

此时,登录http://0.0.0.0:7860即可访问:

参考文献:

1\] https://github.com/datvodinh/rag-chatbot

相关推荐
读创商闻几秒前
解锁强劲算力,数聚红芯 AI 智算服务器甄选指南
运维·服务器·人工智能
三掌柜666几秒前
自主智能体开发实战:Skills 从原理到工程化落地
人工智能
袁煦丞 cpolar内网穿透实验室1 分钟前
Remotion让视频创作告别剪按钮——AI生成视频+像素级精准控制!cpolar内网穿透实验室第700个成功挑战
人工智能·音视频·远程工作·内网穿透·cpolar·安全内网连接
wtsolutions2 分钟前
QMT 知识库 XtQuant知识库 使用文档 pdf
pdf·知识库·文档·qmt
AI品信智慧数智人3 分钟前
AI赋能智慧文旅新赛道✨数字人定制专属伴游管家,重塑出游新体验
大数据·人工智能
空圆小生9 分钟前
基于 Python+Vue3 的 AI 人脸识别门禁考勤系统
开发语言·人工智能·python
寺中人14 分钟前
华为韬(τ)定律:后摩尔时代,中国定义芯片新规则
人工智能·物联网·华为·韬定律
悟纤14 分钟前
AI音乐制作女团舞台MV详细教程
人工智能·seedance2.0·happyhorse·ai mv·ai音乐mv·seedance2.1
weixin_4280053015 分钟前
C#调用 AI学习从0开始-第1阶段(基础与工具)-第7天多轮对话记忆
人工智能·学习·c#·多轮对话·千问api调用
机器之心15 分钟前
Speech LLM 的下一个突破口:你的语音大模型可以是个「带韵律的文本模型」
人工智能·openai