手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了“实时代码监控”

手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了"实时代码监控"

前言 :最近 DeepSeek 很火,API 便宜又好用。但接入项目后我发现一个痛点:它不懂我的私有代码 。每次问业务逻辑,它只能瞎编。微调模型太贵且麻烦,于是我决定用最朴素的技术栈------Python Watchdog + ChromaDB + Spring Boot,手搓一个能"实时监听代码变更"的本地知识库。


1. 痛点:AI 的"失忆症"与"幻觉"

接入 DeepSeek V3 后,我兴冲冲地问它:"SysUser 模块的权限校验逻辑是怎样的?"

它一本正经地回复:"在 Spring Security 中,通常使用 UserDetailsService..."

不对! 我的项目用的是 Sa-Token,而且权限逻辑写在自定义切面里。

AI 并没有读过我的代码,它只有通用知识。

为了解决这个问题,通常有两条路:

  1. 超长 Context:每次提问把几百个文件全塞进 Prompt。(贵,且慢)
  2. RAG (检索增强生成):把代码切片存进向量库,问什么查什么。(精准,高效)

我选择了方案 2。但市面上的 RAG 方案大多是离线的------代码改了,需要手动重新跑一遍脚本更新索引。这太反人类了 。我想要的是:我在 IDEA 里改了代码,Ctrl+S 保存,AI 的脑子下一秒就自动同步了。

2. 架构设计:跨语言的"左右互搏"

为了实现"实时同步",我设计了如下架构:

  • 右脑 (Python) :负责"看"和"记"。
    • Watchdog:监听文件系统事件(增删改移动)。
    • JavaParser:正则提取 Java 类、方法、注解。
    • ChromaDB:本地向量存储(无需安装服务器,嵌入式运行)。
  • 左脑 (Java) :负责"听"和"说"。
    • Spring Boot:处理用户 HTTP 请求。
    • SSE:流式推送 AI 回复。

3. 核心实现:给代码库装上"监控探头"

3.1 第一步:监听文件变更 (Python)

使用 Python 的 watchdog 库,我们可以轻松捕获文件系统的任何风吹草动。

python 复制代码
# file_watcher.py
class CodeChangeHandler(FileSystemEventHandler):
    def on_modified(self, event):
        if event.src_path.endswith(".java"):
            print(f"[监测到修改] {event.src_path}")
            # 1. 删除旧向量
            self.db.delete_by_source(os.path.basename(event.src_path))
            # 2. 解析新代码
            chunks = self.parser.parse_file(event.src_path)
            # 3. 存入向量库
            self.db.add_documents(chunks)

这段代码的核心逻辑是:增量更新。只处理变动的文件,而不是每次全量扫描,效率极高。

3.2 第二步:本地向量存储 (ChromaDB)

为什么选 ChromaDB?因为它不用装 Docker ,不用配环境,pip install 就能用,数据直接存成 .sqlite3.bin 文件,非常适合个人开发者。

python 复制代码
# vector_store.py
import chromadb

class VectorStore:
    def __init__(self):
        # 数据直接持久化到本地目录
        self.client = chromadb.PersistentClient(path="./chroma_db")
        self.collection = self.client.get_or_create_collection(name="codebase")

    def query(self, question, n_results=3):
        # 自动计算问题的 Embedding 并检索相似代码块
        results = self.collection.query(
            query_texts=[question],
            n_results=n_results
        )
        return results['documents'][0]

3.3 第三步:Java 后端的"上下文注入"

在 Spring Boot 中,当用户发起提问时,我们先偷偷去 Python 那里查一下。

java 复制代码
// SysAiController.java
public SseEmitter chatStream(String question) {
    // 1. 调用 Python 接口检索相关代码
    String context = ragService.retrieve(question);
    
    // 2. 组装 System Prompt
    String systemPrompt = "你是一个 Java 专家。请参考以下代码回答问题:\n" + context;
    
    // 3. 请求 DeepSeek API
    return deepSeekClient.streamChat(systemPrompt, question);
}

4. 遇到的坑与优化

坑 1:AI 记不住上一句话

接入 RAG 后,AI 回答准确了,但如果你追问"那这个方法怎么优化?",它会懵:"哪个方法?"
解决 :引入 Redis 记录 sessionId 对应的最近 10 轮对话,每次请求不仅带上 RAG 代码块,还要带上 Redis 里的历史记录。

坑 2:日志太丑

监控这些复杂的异步任务(监听、检索、推送),控制台日志乱飞。
解决 :我在 v0.1.6 版本中专门做了一个监控大屏 。用 ECharts 实时展示 Token 消耗和检索耗时,甚至把服务器的 CPU/内存状态也做进去了,采用 Glassmorphism (毛玻璃) 风格,瞬间治愈强迫症。

5. 总结与源码

这套"本地 RAG"架构,最大的优势就是轻量实时。不需要庞大的运维成本,非常适合个人项目或小团队开发工具。

如果你对这套 Spring Boot + Python (Watchdog/Chroma) + Vue3 的完整实现感兴趣,我已经将其整理并开源在我的脚手架项目中。

项目中还包含:

  • DeepSeek V3 纯净集成
  • 前端代码生成器 (基于字典)
  • 毛玻璃风格监控大屏

源码获取

希望这个思路能给你带来启发!

相关推荐
蕤葳-几秒前
AI证书在面试中的价值分析
人工智能
SuperEugene7 分钟前
Python 异步 async/await:为什么 AI 框架大量使用?| 基础篇
开发语言·人工智能·python
QYR_118 分钟前
预计2032年全球智能换电站市场销售额将突破62.88亿美元
人工智能·市场调研
我不是小upper11 分钟前
相关≠因果!机器学习中皮尔逊相关检验的完整流程
人工智能·算法·机器学习
云烟成雨TD12 分钟前
Spring AI 1.x 系列【28】基于内存和 MySQL 的多轮对话实现案例
java·人工智能·spring
耿雨飞12 分钟前
DeerFlow 系列教程 第五篇 | 配置与 Docker 部署全指南:从香港首建到内陆迁移
人工智能·deer-flow·llm应用开发平台
SMF191913 分钟前
【uv】Python包管理器uv安装和应用
开发语言·python·uv
gergul13 分钟前
在llama-cpp-python中使用自己编译的llama.cpp,解决pip install llama-cpp-python报错
python·llama·llama.cpp·llamacpppython
深蓝轨迹13 分钟前
#Python零基础机器学习入门教程
人工智能·python·机器学习
EMQX14 分钟前
S3 正在吞噬一切:AI 时代的基础软件架构革命
人工智能·物联网·mqtt·flowmq