手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了“实时代码监控”

手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了"实时代码监控"

前言 :最近 DeepSeek 很火,API 便宜又好用。但接入项目后我发现一个痛点:它不懂我的私有代码 。每次问业务逻辑,它只能瞎编。微调模型太贵且麻烦,于是我决定用最朴素的技术栈------Python Watchdog + ChromaDB + Spring Boot,手搓一个能"实时监听代码变更"的本地知识库。


1. 痛点:AI 的"失忆症"与"幻觉"

接入 DeepSeek V3 后,我兴冲冲地问它:"SysUser 模块的权限校验逻辑是怎样的?"

它一本正经地回复:"在 Spring Security 中,通常使用 UserDetailsService..."

不对! 我的项目用的是 Sa-Token,而且权限逻辑写在自定义切面里。

AI 并没有读过我的代码,它只有通用知识。

为了解决这个问题,通常有两条路:

  1. 超长 Context:每次提问把几百个文件全塞进 Prompt。(贵,且慢)
  2. RAG (检索增强生成):把代码切片存进向量库,问什么查什么。(精准,高效)

我选择了方案 2。但市面上的 RAG 方案大多是离线的------代码改了,需要手动重新跑一遍脚本更新索引。这太反人类了 。我想要的是:我在 IDEA 里改了代码,Ctrl+S 保存,AI 的脑子下一秒就自动同步了。

2. 架构设计:跨语言的"左右互搏"

为了实现"实时同步",我设计了如下架构:

  • 右脑 (Python) :负责"看"和"记"。
    • Watchdog:监听文件系统事件(增删改移动)。
    • JavaParser:正则提取 Java 类、方法、注解。
    • ChromaDB:本地向量存储(无需安装服务器,嵌入式运行)。
  • 左脑 (Java) :负责"听"和"说"。
    • Spring Boot:处理用户 HTTP 请求。
    • SSE:流式推送 AI 回复。

3. 核心实现:给代码库装上"监控探头"

3.1 第一步:监听文件变更 (Python)

使用 Python 的 watchdog 库,我们可以轻松捕获文件系统的任何风吹草动。

python 复制代码
# file_watcher.py
class CodeChangeHandler(FileSystemEventHandler):
    def on_modified(self, event):
        if event.src_path.endswith(".java"):
            print(f"[监测到修改] {event.src_path}")
            # 1. 删除旧向量
            self.db.delete_by_source(os.path.basename(event.src_path))
            # 2. 解析新代码
            chunks = self.parser.parse_file(event.src_path)
            # 3. 存入向量库
            self.db.add_documents(chunks)

这段代码的核心逻辑是:增量更新。只处理变动的文件,而不是每次全量扫描,效率极高。

3.2 第二步:本地向量存储 (ChromaDB)

为什么选 ChromaDB?因为它不用装 Docker ,不用配环境,pip install 就能用,数据直接存成 .sqlite3.bin 文件,非常适合个人开发者。

python 复制代码
# vector_store.py
import chromadb

class VectorStore:
    def __init__(self):
        # 数据直接持久化到本地目录
        self.client = chromadb.PersistentClient(path="./chroma_db")
        self.collection = self.client.get_or_create_collection(name="codebase")

    def query(self, question, n_results=3):
        # 自动计算问题的 Embedding 并检索相似代码块
        results = self.collection.query(
            query_texts=[question],
            n_results=n_results
        )
        return results['documents'][0]

3.3 第三步:Java 后端的"上下文注入"

在 Spring Boot 中,当用户发起提问时,我们先偷偷去 Python 那里查一下。

java 复制代码
// SysAiController.java
public SseEmitter chatStream(String question) {
    // 1. 调用 Python 接口检索相关代码
    String context = ragService.retrieve(question);
    
    // 2. 组装 System Prompt
    String systemPrompt = "你是一个 Java 专家。请参考以下代码回答问题:\n" + context;
    
    // 3. 请求 DeepSeek API
    return deepSeekClient.streamChat(systemPrompt, question);
}

4. 遇到的坑与优化

坑 1:AI 记不住上一句话

接入 RAG 后,AI 回答准确了,但如果你追问"那这个方法怎么优化?",它会懵:"哪个方法?"
解决 :引入 Redis 记录 sessionId 对应的最近 10 轮对话,每次请求不仅带上 RAG 代码块,还要带上 Redis 里的历史记录。

坑 2:日志太丑

监控这些复杂的异步任务(监听、检索、推送),控制台日志乱飞。
解决 :我在 v0.1.6 版本中专门做了一个监控大屏 。用 ECharts 实时展示 Token 消耗和检索耗时,甚至把服务器的 CPU/内存状态也做进去了,采用 Glassmorphism (毛玻璃) 风格,瞬间治愈强迫症。

5. 总结与源码

这套"本地 RAG"架构,最大的优势就是轻量实时。不需要庞大的运维成本,非常适合个人项目或小团队开发工具。

如果你对这套 Spring Boot + Python (Watchdog/Chroma) + Vue3 的完整实现感兴趣,我已经将其整理并开源在我的脚手架项目中。

项目中还包含:

  • DeepSeek V3 纯净集成
  • 前端代码生成器 (基于字典)
  • 毛玻璃风格监控大屏

源码获取

希望这个思路能给你带来启发!

相关推荐
大数据在线2 小时前
布局Agentic AI,亚马逊云科技组合拳再升级
人工智能·openai·亚马逊云科技·智能体·agentic ai
皮皮学姐分享-ppx6 小时前
政府绿色采购数据库(2015-2024.3)
大数据·网络·数据库·人工智能·制造
GIS数据转换器6 小时前
基于3D GIS的监控视频精准标定平台
人工智能·物联网·3d·音视频·无人机·知识图谱
珺毅同学6 小时前
YOLO生成预测json标签迁移问题
python·yolo·json
骑士雄师6 小时前
18.4 长期记忆可修改版
python
专注VB编程开发20年6 小时前
AI 生成C# WinForm 窗体 = 目前就是垃圾
开发语言·人工智能·c#
深小乐7 小时前
Claude Fable5 尝鲜,效果挺不错
人工智能
~小先生~7 小时前
Python从入门到放弃(一)
开发语言·python
Nayxxu7 小时前
Gemini + RAG 企业知识库教程:从文档切片到答案生成
运维·人工智能
冬奇Lab7 小时前
真正的 AI-Native Workflow 是什么?——四个判断测试
人工智能·agent