基于混合检索RAG的食品生产质量问答系统(BGE_BM25_大语言模型)

一、项目演示视频

b站演示视频与部署教程视频(点击这里)

https://www.bilibili.com/video/BV1phJs6oEB4/?share_source=copy_web\&vd_source=31c839f46a9a845dd6dd641cbd5c2ac1

项目简介

本项目是一个面向食品生产质量领域的智能问答系统,采用前后端分离架构,集成 BGE 向量检索、BM25 关键词检索与 RRF 融合混合 RAG 技术。系统对文档进行双粒度 chunk 切分并建立本地向量索引与 BM25 倒排索引,结合通义千问大语言模型实现精准的知识检索与自然语言问答,并支持文档管理、检索索引管理、知识检索调试、产品档案(含过敏原标注)、生产记录管理等功能,为食品生产质量管理提供智能化知识服务。

二、技术栈

前端:Vue 3.5 + TypeScript 5.7 + Element Plus 2.9 + Pinia + Vite 6.1 + ECharts 5.6 + Axios

后端:Flask + SQLite 3 + BGE(bge-base-zh-v1.5) + FAISS + BM25 + 通义千问 API

三、功能模块

核心创新点

  1. 混合检索 RAG:BGE fine/standard 双粒度向量检索 + BM25 关键词检索,RRF 融合排序
  2. 本地索引:FAISS 向量索引与 BM25 倒排索引
  3. 四路并行检索:BGE fine、BGE standard、BM25 与 SQLite 产品/生产记录结构化匹配
  4. 多模态问答:支持上传产品图片进行识别和问答(qwen3-vl-flash 模型)
  5. 检索索引管理:增量/全量构建、自定义单条知识索引、索引统计与片段预览
  6. 知识检索调试:管理员可独立查看混合、BGE、BM25 检索效果
  7. 异步索引构建:支持全量重建与增量构建,任务异步执行并实时查询进度
  8. 产品全链路管理:产品档案(含过敏原字段)与生产批次记录一体化管理

核心功能模块

  1. 用户管理:注册登录、JWT 认证、角色分权、个人信息管理
  2. 文档管理:多格式上传、目录分类、AI 摘要、MD5 去重、索引片段预览
  3. 检索索引管理:增量/全量构建、自定义单条索引、索引统计
  4. 智能问答:多轮对话、RRF 结果展示、多模态问答、Word 导出
  5. 知识检索调试:混合(RRF)、BGE 双粒度、BM25 三种检索模式
  6. 产品信息管理:CRUD、过敏原标注、图片上传、统计分析
  7. 生产记录管理:批次 CRUD、多图上传、多维度统计
  8. 数据统计:用户数、文档数、会话数、产品数、生产记录数趋势可视化

应用场景

  1. 食品生产工艺知识查询:预制菜加工、饮料灌装、烘焙焙烤等工艺要点及 HACCP 控制点
  2. 产品质量标准咨询:GB 标准、检测指标、过敏原标注要求等专业知识
  3. 生产批次追溯:通过产品档案和生产记录快速定位批次信息、质检状态
  4. 专业知识文档管理:上传和管理食品生产质量相关技术文档,构建检索索引
  5. 新员工培训辅助:通过智能问答快速了解食品生产质量领域专业知识

四、项目链接

羊羊小栈-基于混合检索RAG的食品生产质量问答系统(BGE_BM25_大语言模型).zip

链接: https://pan.baidu.com/s/1ugHSzgPfeV6xlKQsBkJy4w?pwd=b23c 提取码: b23c

  1. 完整系统源码
    (1)前端源码(web-vue)
    (2)后端与算法端源码(web-flask)
  2. 项目启动教程
    (1)环境安装教程(视频+文档)
    (2)系统启动教程(视频+文档)
  3. 项目文档
    (1)系统介绍文档
    (2)数据库开发文档
    (3)API 接口文档
    (4)系统使用注意事项
    (5)软件开发文档
  4. 系统PPT
    (1)系统架构图
    (2)混合检索数据流图
    (3)逻辑时序图
    (4)功能模块概要图
    (5)检索索引构建流程图
    (6)数据库 ER 图
相关推荐
katttt_9 小时前
卡特加特的玄武大模型和其他模型的差异化在哪里?
人工智能·私有化部署·智能体平台·玄武大模型
一次旅行15 小时前
AI 前沿日报 | 2026年7月3日 星期五
人工智能·github·ai编程
A153625515 小时前
装配具身机器人品牌推荐 工业装配场景选型指南与艾利特方案
大数据·人工智能·机器人
LLWZAI15 小时前
想要稳定变现,先跨过朱雀 AI 这道门槛
大数据·人工智能
安吉升科技15 小时前
商业场景智能客流统计摄像系统的关键技术机理解析
人工智能
古城小栈15 小时前
为啥说:训练用BF16,推理用FP16
人工智能·算法·机器学习
KaMeidebaby15 小时前
卡梅德生物技术快报|蛋白 N 端测序在重组贻贝融合蛋白表征中的应用,解决原核表达序列偏移工艺难题
前端·人工智能·物联网·算法·百度
TMT星球15 小时前
从像素复刻到行动控制:具身世界模型的底层逻辑探索
人工智能·深度学习·机器学习
ccimao631615 小时前
散户做财报整理、研报阅读、复盘记录,各类AI工具适配环节梳理
大数据·人工智能
派叔15 小时前
老字号营销服务商技术解构:三类方案的架构逻辑与选型评估
大数据·人工智能·搜索引擎·架构·产品运营·流量运营