从零开始构建一个 RAG + Flask 问答系统

🧠 用 Flask + HuggingFace + OpenRouter 打造一个免费的 RAG 问答系统(完整教学)

✅ 项目介绍

我们要做一个网页,可以上传 .txt 文档,然后问它问题,它会回答你。

这个功能背后用了 AI 模型,但我们不会花钱,全程使用免费的模型和服务!


🧱 步骤一:准备环境

1. 创建一个新文件夹

复制代码
mkdir rag_flask_app
cd rag_flask_app

2. 创建并激活虚拟环境(可选但推荐)

复制代码
conda create -n rag_env python=3.10 -y
conda activate rag_env

3. 安装依赖

创建一个 requirements.txt 文件:

复制代码
flask
llama-index>=0.10.0
sentence-transformers
llama-index-embeddings-huggingface
openai

安装依赖:

复制代码
pip install -r requirements.txt

📁 步骤二:构建项目结构

复制代码
mkdir templates
mkdir uploads
touch app.py templates/index.html

🧠 步骤三:写入核心代码

🔹 app.py(主逻辑)

复制代码
from flask import Flask, render_template, request
import os
from llama_index.core import SimpleDirectoryReader, VectorStoreIndex
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.llms.openai import OpenAI
from llama_index.core.settings import Settings

# 初始化 Flask
app = Flask(__name__)
UPLOAD_FOLDER = 'uploads'
os.makedirs(UPLOAD_FOLDER, exist_ok=True)

# 设置模型
embed_model = HuggingFaceEmbedding(model_name="all-MiniLM-L6-v2")  # 本地嵌入模型
llm = OpenAI(
    api_base="https://openrouter.ai/api/v1",
    api_key="sk-or-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",  # 👉 填你的 OpenRouter Key
    model="gpt-3.5-turbo"
)

# 应用到 LlamaIndex 设置
Settings.embed_model = embed_model
Settings.llm = llm

index = None

@app.route('/', methods=['GET', 'POST'])
def index_page():
    global index
    response = ""

    if request.method == 'POST':
        if 'file' in request.files:
            file = request.files['file']
            filepath = os.path.join(UPLOAD_FOLDER, file.filename)
            file.save(filepath)

            documents = SimpleDirectoryReader(UPLOAD_FOLDER).load_data()
            index = VectorStoreIndex.from_documents(documents)
            response = "Document uploaded and indexed!"

        elif 'question' in request.form and index is not None:
            question = request.form['question']
            query_engine = index.as_query_engine()
            response = query_engine.query(question).response

    return render_template("index.html", response=response)

if __name__ == '__main__':
    app.run(debug=True)

🔹 templates/index.html(网页界面)

复制代码
<!DOCTYPE html>
<html>
<head>
    <title>RAG Web App</title>
</head>
<body>
    <h1>🧠 RAG + LLM Document QA</h1>

    <form method="POST" enctype="multipart/form-data">
        <p><strong>Upload a .txt document:</strong></p>
        <input type="file" name="file" required>
        <input type="submit" value="Upload">
    </form>

    <form method="POST">
        <p><strong>Ask a question about the document:</strong></p>
        <input type="text" name="question" required style="width:300px;">
        <input type="submit" value="Ask">
    </form>

    <h2>Answer:</h2>
    <p>{{ response }}</p>
</body>
</html>

🔑 步骤四:获取免费 OpenRouter Key

  1. 注册:https://openrouter.ai

  2. 登录后点击右上角头像 → API Keys

  3. 创建新 key,会像这样:

    复制代码
    sk-or-v1-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
  4. app.py 中粘贴进去替换


🚀 步骤五:运行你的应用!

在终端里运行:

复制代码
python app.py

打开浏览器访问: 👉 http://127.0.0.1:5000


🧪 测试流程

  1. 上传一个 .txt 文档(例如一段英文文章)

  2. 输入问题,比如:

    • "What is the main topic?"

    • "Who is the author?"

  3. 系统会返回基于文档的智能回答 ✅

相关推荐
一个处女座的程序猿18 小时前
LLMs之SLMs:《Small Language Models are the Future of Agentic AI》的翻译与解读
人工智能·自然语言处理·小语言模型·slms
档案宝档案管理21 小时前
档案宝:企业合同档案管理的“安全保险箱”与“效率加速器”
大数据·数据库·人工智能·安全·档案·档案管理
IT_Beijing_BIT1 天前
TensorFlow Keras
人工智能·tensorflow·keras
mit6.8241 天前
[手机AI开发sdk] 安卓上的Linux环境
人工智能·智能手机
张较瘦_1 天前
[论文阅读] AI + 教育 | AI赋能“三个课堂”的破局之道——具身认知与技术路径深度解读
论文阅读·人工智能
小雨青年1 天前
Cursor 项目实战:AI播客策划助手(二)—— 多轮交互打磨播客文案的技术实现与实践
前端·人工智能·状态模式·交互
西西弗Sisyphus1 天前
线性代数 - 初等矩阵
人工智能·线性代数·机器学习
王哈哈^_^1 天前
【数据集】【YOLO】【目标检测】共享单车数据集,共享单车识别数据集 3596 张,YOLO自行车识别算法实战训推教程。
人工智能·算法·yolo·目标检测·计算机视觉·视觉检测·毕业设计
仙人掌_lz1 天前
Multi-Agent的编排模式总结/ Parlant和LangGraph差异对比
人工智能·ai·llm·原型模式·rag·智能体
背包客研究1 天前
如何在机器学习中使用特征提取对表格数据进行处理
人工智能·机器学习