手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了“实时代码监控”

手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了"实时代码监控"

前言 :最近 DeepSeek 很火,API 便宜又好用。但接入项目后我发现一个痛点:它不懂我的私有代码 。每次问业务逻辑,它只能瞎编。微调模型太贵且麻烦,于是我决定用最朴素的技术栈------Python Watchdog + ChromaDB + Spring Boot,手搓一个能"实时监听代码变更"的本地知识库。


1. 痛点:AI 的"失忆症"与"幻觉"

接入 DeepSeek V3 后,我兴冲冲地问它:"SysUser 模块的权限校验逻辑是怎样的?" 它一本正经地回复:"在 Spring Security 中,通常使用 UserDetailsService..."

不对! 我的项目用的是 Sa-Token,而且权限逻辑写在自定义切面里。 AI 并没有读过我的代码,它只有通用知识。

为了解决这个问题,通常有两条路:

  1. 超长 Context:每次提问把几百个文件全塞进 Prompt。(贵,且慢)
  2. RAG (检索增强生成):把代码切片存进向量库,问什么查什么。(精准,高效)

我选择了方案 2。但市面上的 RAG 方案大多是离线的------代码改了,需要手动重新跑一遍脚本更新索引。这太反人类了 。我想要的是:我在 IDEA 里改了代码,Ctrl+S 保存,AI 的脑子下一秒就自动同步了。

2. 架构设计:跨语言的"左右互搏"

为了实现"实时同步",我设计了如下架构:

  • 右脑 (Python) :负责"看"和"记"。
    • Watchdog:监听文件系统事件(增删改移动)。
    • JavaParser:正则提取 Java 类、方法、注解。
    • ChromaDB:本地向量存储(无需安装服务器,嵌入式运行)。
  • 左脑 (Java) :负责"听"和"说"。
    • Spring Boot:处理用户 HTTP 请求。
    • SSE:流式推送 AI 回复。

3. 核心实现:给代码库装上"监控探头"

3.1 第一步:监听文件变更 (Python)

使用 Python 的 watchdog 库,我们可以轻松捕获文件系统的任何风吹草动。

python 复制代码
# file_watcher.py
class CodeChangeHandler(FileSystemEventHandler):
    def on_modified(self, event):
        if event.src_path.endswith(".java"):
            print(f"[监测到修改] {event.src_path}")
            # 1. 删除旧向量
            self.db.delete_by_source(os.path.basename(event.src_path))
            # 2. 解析新代码
            chunks = self.parser.parse_file(event.src_path)
            # 3. 存入向量库
            self.db.add_documents(chunks)

这段代码的核心逻辑是:增量更新。只处理变动的文件,而不是每次全量扫描,效率极高。

3.2 第二步:本地向量存储 (ChromaDB)

为什么选 ChromaDB?因为它不用装 Docker ,不用配环境,pip install 就能用,数据直接存成 .sqlite3.bin 文件,非常适合个人开发者。

python 复制代码
# vector_store.py
import chromadb

class VectorStore:
    def __init__(self):
        # 数据直接持久化到本地目录
        self.client = chromadb.PersistentClient(path="./chroma_db")
        self.collection = self.client.get_or_create_collection(name="codebase")

    def query(self, question, n_results=3):
        # 自动计算问题的 Embedding 并检索相似代码块
        results = self.collection.query(
            query_texts=[question],
            n_results=n_results
        )
        return results['documents'][0]

3.3 第三步:Java 后端的"上下文注入"

在 Spring Boot 中,当用户发起提问时,我们先偷偷去 Python 那里查一下。

java 复制代码
// SysAiController.java
public SseEmitter chatStream(String question) {
    // 1. 调用 Python 接口检索相关代码
    String context = ragService.retrieve(question);
    
    // 2. 组装 System Prompt
    String systemPrompt = "你是一个 Java 专家。请参考以下代码回答问题:\n" + context;
    
    // 3. 请求 DeepSeek API
    return deepSeekClient.streamChat(systemPrompt, question);
}

4. 遇到的坑与优化

坑 1:AI 记不住上一句话

接入 RAG 后,AI 回答准确了,但如果你追问"那这个方法怎么优化?",它会懵:"哪个方法?" 解决 :引入 Redis 记录 sessionId 对应的最近 10 轮对话,每次请求不仅带上 RAG 代码块,还要带上 Redis 里的历史记录。

坑 2:日志太丑

监控这些复杂的异步任务(监听、检索、推送),控制台日志乱飞。 解决 :我在 v0.1.6 版本中专门做了一个监控大屏 。用 ECharts 实时展示 Token 消耗和检索耗时,甚至把服务器的 CPU/内存状态也做进去了,采用 Glassmorphism (毛玻璃) 风格,瞬间治愈强迫症。

5. 总结与源码

这套"本地 RAG"架构,最大的优势就是轻量实时。不需要庞大的运维成本,非常适合个人项目或小团队开发工具。

如果你对这套 Spring Boot + Python (Watchdog/Chroma) + Vue3 的完整实现感兴趣,我已经将其整理并开源在我的脚手架项目中。

项目中还包含:

  • DeepSeek V3 纯净集成
  • 前端代码生成器 (基于字典)
  • 毛玻璃风格监控大屏

源码获取

希望这个思路能给你带来启发!

相关推荐
用户3414081991255 小时前
/dev/binder 详解
后端
Gopher_HBo5 小时前
Go进阶之recover
后端
程序员布吉岛6 小时前
写了 10 年 MyBatis,一直以为“去 XML”=写注解,直到看到了这个项目
后端
却尘6 小时前
一篇小白也能看懂的 Go 字符串拼接 & Builder & cap 全家桶
后端·go
茶杯梦轩6 小时前
从零起步学习Redis || 第七章:Redis持久化方案的实现及底层原理解析(RDB快照与AOF日志)
redis·后端
QZQ541886 小时前
重构即时IM项目13:优化消息通路(下)
后端
柠檬味拥抱6 小时前
揭秘Cookie操纵:深入解析模拟登录与维持会话技巧
后端
不想打工的码农6 小时前
MyBatis-Plus多数据源实战:被DBA追着改配置后,我肝出这份避坑指南(附动态切换源码)
java·后端
ZeroTaboo6 小时前
rmx:给 Windows 换一个能用的删除
前端·后端