手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了“实时代码监控”

手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了"实时代码监控"

前言 :最近 DeepSeek 很火,API 便宜又好用。但接入项目后我发现一个痛点:它不懂我的私有代码 。每次问业务逻辑,它只能瞎编。微调模型太贵且麻烦,于是我决定用最朴素的技术栈------Python Watchdog + ChromaDB + Spring Boot,手搓一个能"实时监听代码变更"的本地知识库。


1. 痛点:AI 的"失忆症"与"幻觉"

接入 DeepSeek V3 后,我兴冲冲地问它:"SysUser 模块的权限校验逻辑是怎样的?"

它一本正经地回复:"在 Spring Security 中,通常使用 UserDetailsService..."

不对! 我的项目用的是 Sa-Token,而且权限逻辑写在自定义切面里。

AI 并没有读过我的代码,它只有通用知识。

为了解决这个问题,通常有两条路:

  1. 超长 Context:每次提问把几百个文件全塞进 Prompt。(贵,且慢)
  2. RAG (检索增强生成):把代码切片存进向量库,问什么查什么。(精准,高效)

我选择了方案 2。但市面上的 RAG 方案大多是离线的------代码改了,需要手动重新跑一遍脚本更新索引。这太反人类了 。我想要的是:我在 IDEA 里改了代码,Ctrl+S 保存,AI 的脑子下一秒就自动同步了。

2. 架构设计:跨语言的"左右互搏"

为了实现"实时同步",我设计了如下架构:

  • 右脑 (Python) :负责"看"和"记"。
    • Watchdog:监听文件系统事件(增删改移动)。
    • JavaParser:正则提取 Java 类、方法、注解。
    • ChromaDB:本地向量存储(无需安装服务器,嵌入式运行)。
  • 左脑 (Java) :负责"听"和"说"。
    • Spring Boot:处理用户 HTTP 请求。
    • SSE:流式推送 AI 回复。

3. 核心实现:给代码库装上"监控探头"

3.1 第一步:监听文件变更 (Python)

使用 Python 的 watchdog 库,我们可以轻松捕获文件系统的任何风吹草动。

python 复制代码
# file_watcher.py
class CodeChangeHandler(FileSystemEventHandler):
    def on_modified(self, event):
        if event.src_path.endswith(".java"):
            print(f"[监测到修改] {event.src_path}")
            # 1. 删除旧向量
            self.db.delete_by_source(os.path.basename(event.src_path))
            # 2. 解析新代码
            chunks = self.parser.parse_file(event.src_path)
            # 3. 存入向量库
            self.db.add_documents(chunks)

这段代码的核心逻辑是:增量更新。只处理变动的文件,而不是每次全量扫描,效率极高。

3.2 第二步:本地向量存储 (ChromaDB)

为什么选 ChromaDB?因为它不用装 Docker ,不用配环境,pip install 就能用,数据直接存成 .sqlite3.bin 文件,非常适合个人开发者。

python 复制代码
# vector_store.py
import chromadb

class VectorStore:
    def __init__(self):
        # 数据直接持久化到本地目录
        self.client = chromadb.PersistentClient(path="./chroma_db")
        self.collection = self.client.get_or_create_collection(name="codebase")

    def query(self, question, n_results=3):
        # 自动计算问题的 Embedding 并检索相似代码块
        results = self.collection.query(
            query_texts=[question],
            n_results=n_results
        )
        return results['documents'][0]

3.3 第三步:Java 后端的"上下文注入"

在 Spring Boot 中,当用户发起提问时,我们先偷偷去 Python 那里查一下。

java 复制代码
// SysAiController.java
public SseEmitter chatStream(String question) {
    // 1. 调用 Python 接口检索相关代码
    String context = ragService.retrieve(question);
    
    // 2. 组装 System Prompt
    String systemPrompt = "你是一个 Java 专家。请参考以下代码回答问题:\n" + context;
    
    // 3. 请求 DeepSeek API
    return deepSeekClient.streamChat(systemPrompt, question);
}

4. 遇到的坑与优化

坑 1:AI 记不住上一句话

接入 RAG 后,AI 回答准确了,但如果你追问"那这个方法怎么优化?",它会懵:"哪个方法?"
解决 :引入 Redis 记录 sessionId 对应的最近 10 轮对话,每次请求不仅带上 RAG 代码块,还要带上 Redis 里的历史记录。

坑 2:日志太丑

监控这些复杂的异步任务(监听、检索、推送),控制台日志乱飞。
解决 :我在 v0.1.6 版本中专门做了一个监控大屏 。用 ECharts 实时展示 Token 消耗和检索耗时,甚至把服务器的 CPU/内存状态也做进去了,采用 Glassmorphism (毛玻璃) 风格,瞬间治愈强迫症。

5. 总结与源码

这套"本地 RAG"架构,最大的优势就是轻量实时。不需要庞大的运维成本,非常适合个人项目或小团队开发工具。

如果你对这套 Spring Boot + Python (Watchdog/Chroma) + Vue3 的完整实现感兴趣,我已经将其整理并开源在我的脚手架项目中。

项目中还包含:

  • DeepSeek V3 纯净集成
  • 前端代码生成器 (基于字典)
  • 毛玻璃风格监控大屏

源码获取

希望这个思路能给你带来启发!

相关推荐
冬奇Lab3 小时前
Hook 机制实战:让 ClaudeCode 主动通知你
ai编程·claude
浪子小院3 小时前
ModelEngine 智能体全流程开发实战:从 0 到 1 搭建多协作办公助手
大数据·人工智能
程序员打怪兽3 小时前
详解YOLOv8网络结构
人工智能·深度学习
Yuer20253 小时前
全国首例“AI 幻觉”侵权案判了:这不是 AI 准不准的问题,而是谁该为 AI 负责
人工智能·edca os·可控ai
爱打代码的小林3 小时前
基于 MediaPipe 实现实时面部关键点检测
python·opencv·计算机视觉
码路飞3 小时前
语音 AI Agent 延迟优化实战:我是怎么把响应时间从 2 秒干到 500ms 以内的
ai编程
一切尽在,你来3 小时前
1.1 AI大模型应用开发和Langchain的关系
人工智能·langchain
lucky67073 小时前
Spring Boot集成Kafka:最佳实践与详细指南
spring boot·kafka·linq
极客小云4 小时前
【ComfyUI API 自动化利器:comfyui_xy Python 库使用详解】
网络·python·自动化·comfyui