LLM之RAG实战(四十四)| rag-chatbot:支持Huggingface和Ollama任意模型的多PDF本地RAG方案

特点:

  • 支持本地运行和Kaggle (new)运行
  • 支持HuggingfaceOllama 的任意模型
  • Process multiple PDF inputs.
  • Chat with multiples languages (Coming soon).
  • Simple UI with Gradio.

一、安装使用

1.1 Kaggle(推荐)

Step1:把https://github.com/datvodinh/rag-chatbot/blob/main/notebooks/kaggle.ipynb脚本导入到Kaggle。

Step2:把<YOUR_NGROK_TOKEN>替换为自己的token。

1.2 本地安装

a)克隆项目

复制代码
git clone https://github.com/datvodinh/rag-chatbot.gitcd rag-chatbot

b)安装

Docker方式

复制代码
docker compose up --build

脚本方式(Ollama, Ngrok, python package)

复制代码
source ./scripts/install_extra.sh

手动安装

Step1:Ollama
Step2:Ngrok

Step3:安装rag_chatbot包

复制代码
source ./scripts/install.sh

c)启动

复制代码
source ./scripts/run.sh

或者

复制代码
python -m rag_chatbot --host localhost

使用Ngrok

复制代码
source ./scripts/run.sh --ngrok

此时,会下载大模型

大模型的配置文件:https://github.com/datvodinh/rag-chatbot/blob/main/rag_chatbot/setting/setting.py

LLM默认是:llama3:8b-instruct-q8_0

Embedding模型默认是:BAAI/bge-large-en-v1.5

此时,登录http://0.0.0.0:7860即可访问:

参考文献:

1 https://github.com/datvodinh/rag-chatbot

相关推荐
继续商行几秒前
Go 内存逃逸分析与零内存分配优化:pprof 火焰图实战排查
人工智能
宝贝儿好2 分钟前
【LLM】第四章:项目实操案例:文本情感分析
人工智能·深度学习·神经网络·机器学习·自然语言处理·lstm
智塑未来2 分钟前
2026商用护眼显示器性价比研判:飞利浦舒视蓝4.0与圆偏光技术的健康价值解析
人工智能
继续商行4 分钟前
探秘 Go 动态数组:pprof 排查大数据切片 GC 停顿
人工智能
OBiO20134 分钟前
如何利用AAV精准靶向血管平滑肌细胞(VSMCs)?
人工智能
lwyingdao5 分钟前
Codex接入国产大模型,三步配置,无需OpenAI账号
人工智能·ai编程·ai工具
团象科技7 分钟前
出海企业算力适配调研:深度学习模型云端搭建的落地观察
人工智能·深度学习
kft13148 分钟前
04 — AI 测试用例生成与评审实战
人工智能·测试用例
无心水8 分钟前
【Harness:落地实战】24、Harness CI/CD+GitOps深度实战:智能交付与渐进发布——企业级云原生DevOps全解析
人工智能·ci/cd·云原生·openclaw·harness·hermes·honcho
AI学长10 分钟前
数据集|二维码目标检测QRCodeDetection
人工智能·目标检测·计算机视觉·二维码目标检测