手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了"实时代码监控"
前言 :最近 DeepSeek 很火,API 便宜又好用。但接入项目后我发现一个痛点:它不懂我的私有代码 。每次问业务逻辑,它只能瞎编。微调模型太贵且麻烦,于是我决定用最朴素的技术栈------Python Watchdog + ChromaDB + Spring Boot,手搓一个能"实时监听代码变更"的本地知识库。

1. 痛点:AI 的"失忆症"与"幻觉"
接入 DeepSeek V3 后,我兴冲冲地问它:"SysUser 模块的权限校验逻辑是怎样的?" 它一本正经地回复:"在 Spring Security 中,通常使用 UserDetailsService..."
不对! 我的项目用的是 Sa-Token,而且权限逻辑写在自定义切面里。 AI 并没有读过我的代码,它只有通用知识。
为了解决这个问题,通常有两条路:
- 超长 Context:每次提问把几百个文件全塞进 Prompt。(贵,且慢)
- RAG (检索增强生成):把代码切片存进向量库,问什么查什么。(精准,高效)
我选择了方案 2。但市面上的 RAG 方案大多是离线的------代码改了,需要手动重新跑一遍脚本更新索引。这太反人类了 。我想要的是:我在 IDEA 里改了代码,Ctrl+S 保存,AI 的脑子下一秒就自动同步了。
2. 架构设计:跨语言的"左右互搏"
为了实现"实时同步",我设计了如下架构:
- 右脑 (Python) :负责"看"和"记"。
- Watchdog:监听文件系统事件(增删改移动)。
- JavaParser:正则提取 Java 类、方法、注解。
- ChromaDB:本地向量存储(无需安装服务器,嵌入式运行)。
- 左脑 (Java) :负责"听"和"说"。
- Spring Boot:处理用户 HTTP 请求。
- SSE:流式推送 AI 回复。
3. 核心实现:给代码库装上"监控探头"
3.1 第一步:监听文件变更 (Python)
使用 Python 的 watchdog 库,我们可以轻松捕获文件系统的任何风吹草动。
python
# file_watcher.py
class CodeChangeHandler(FileSystemEventHandler):
def on_modified(self, event):
if event.src_path.endswith(".java"):
print(f"[监测到修改] {event.src_path}")
# 1. 删除旧向量
self.db.delete_by_source(os.path.basename(event.src_path))
# 2. 解析新代码
chunks = self.parser.parse_file(event.src_path)
# 3. 存入向量库
self.db.add_documents(chunks)
这段代码的核心逻辑是:增量更新。只处理变动的文件,而不是每次全量扫描,效率极高。
3.2 第二步:本地向量存储 (ChromaDB)
为什么选 ChromaDB?因为它不用装 Docker ,不用配环境,pip install 就能用,数据直接存成 .sqlite3 和 .bin 文件,非常适合个人开发者。
python
# vector_store.py
import chromadb
class VectorStore:
def __init__(self):
# 数据直接持久化到本地目录
self.client = chromadb.PersistentClient(path="./chroma_db")
self.collection = self.client.get_or_create_collection(name="codebase")
def query(self, question, n_results=3):
# 自动计算问题的 Embedding 并检索相似代码块
results = self.collection.query(
query_texts=[question],
n_results=n_results
)
return results['documents'][0]
3.3 第三步:Java 后端的"上下文注入"
在 Spring Boot 中,当用户发起提问时,我们先偷偷去 Python 那里查一下。
java
// SysAiController.java
public SseEmitter chatStream(String question) {
// 1. 调用 Python 接口检索相关代码
String context = ragService.retrieve(question);
// 2. 组装 System Prompt
String systemPrompt = "你是一个 Java 专家。请参考以下代码回答问题:\n" + context;
// 3. 请求 DeepSeek API
return deepSeekClient.streamChat(systemPrompt, question);
}
4. 遇到的坑与优化
坑 1:AI 记不住上一句话
接入 RAG 后,AI 回答准确了,但如果你追问"那这个方法怎么优化?",它会懵:"哪个方法?" 解决 :引入 Redis 记录 sessionId 对应的最近 10 轮对话,每次请求不仅带上 RAG 代码块,还要带上 Redis 里的历史记录。
坑 2:日志太丑
监控这些复杂的异步任务(监听、检索、推送),控制台日志乱飞。 解决 :我在 v0.1.6 版本中专门做了一个监控大屏 。用 ECharts 实时展示 Token 消耗和检索耗时,甚至把服务器的 CPU/内存状态也做进去了,采用 Glassmorphism (毛玻璃) 风格,瞬间治愈强迫症。

5. 总结与源码
这套"本地 RAG"架构,最大的优势就是轻量 且实时。不需要庞大的运维成本,非常适合个人项目或小团队开发工具。
如果你对这套 Spring Boot + Python (Watchdog/Chroma) + Vue3 的完整实现感兴趣,我已经将其整理并开源在我的脚手架项目中。
项目中还包含:
- ✅ DeepSeek V3 纯净集成
- ✅ 前端代码生成器 (基于字典)
- ✅ 毛玻璃风格监控大屏
源码获取:
- Gitee : gitee.com/cs_shuang/S...
- GitHub : github.com/328pikapika...
希望这个思路能给你带来启发!