基于 Spring Boot 4 + LangChain4j 1.11 + Ollama + Qdrant +MCP 的一体化 多Agentic 智能体,RAG 系统
本文结合笔者企业级项目,重新抽象,开发,一个真正"开箱即用"的企业级智能知识库系统。它不仅支持标准 RAG 问答,更融合了 Agentic 智能体架构 、MCP 文件沙盒 、金融专用算子 和 混合模型路由,提供从文档上传到复杂推理的完整闭环体验。
1. 总览:技术栈与核心能力 ✨
| 维度 | 技术选型 | 能力说明 |
|---|---|---|
| 后端框架 | Spring Boot 4 + SQLite | 轻量级持久化,无需额外数据库,生产可切换为其他数据,如mysql,pgsql |
| AI 引擎 | LangChain4j 1.11 | 支持 Agentic 工具调用、流式响应、上下文记忆 |
| 语言模型 | Ollama(qwen2.5:7b) + 可选 DashScope(qwen-plus) |
本地私有部署 + 云端高性能混合 |
| 嵌入模型 | Ollama(qwen3-embedding:0.6b) |
固定使用本地,保障数据不出域,高性能,降低成本 |
| 向量库 | Qdrant(1024 维) | 自动建集、高效检索(minScore=0.5) |
| 前端界面 | 纯静态 HTML/JS | 毛玻璃效果 + 渐变设计,5 大功能页面,少依赖,轻量化。 |
| 特色能力 | 🎯 10+ 领域文档管理 🧠 Agentic 多工具协作 📊 金融计算(IRR/债券/期权) 📎 MCP 文件分析 🌤️ 天气/时间查询 | 企业场景全覆盖 |
2. 端到端架构 🚀
💡 关键设计 :嵌入模型始终走本地 Ollama ,确保敏感文档向量化过程完全私有;仅生成模型可动态路由。
3. 模块深度解析
3.1 RAG 检索增强生成 📄
- 入口 :
RagService - 流程 :
- 用户提问 → 本地
qwen3-embedding生成向量; - Qdrant 检索 top5 相似段落(
min-score: 0.5); - 拼接上下文 → 路由至 LLM(本地/云端)→ 流式返回带引用的回答。
- 用户提问 → 本地
- 文档支持 :PDF/TXT 自动分块(
chunk-size: 500,overlap: 50),元数据含文件名便于溯源。
3.2 Agentic 智能体对话 ⭐
基于 LangChain4j Agentic 架构,实现自主决策与工具协作:
- 记忆机制 :
MessageWindowChatMemory,滑动窗口管理最近2 × context-window-size条消息(默认 20 条)。 - 内置工具集 (Agent 自主调用):
searchKnowledge():向量知识库检索readFile() / listDirectory() / searchFiles():MCP 文件系统操作calculate():数学表达式求值(exp4j)calculateAmortization():贷款摊销计划getIRR() / getBondPrice() / getOptionPrice():金融专用计算getCurrentTime()/getWeather():实时信息查询
- 执行追踪 :
AgentExecutionInfo记录完整思考链,前端可展示"Agent 正在读取文件...调用 Black-Scholes..."。
3.3 混合模型路由策略 🔀
通过 ModelRouterService 实现智能分流:
| 策略 | 配置示例 | 适用场景 |
|---|---|---|
| PERCENTAGE | aliyun: 30, local: 70 |
测试环境、负载均衡 |
| BUSINESS_TYPE | aliyun-types: [COMPLEX_QUERY, LONG_CONTEXT] local-types: [TOOL_CALLING, SIMPLE_QA] |
生产推荐:复杂任务上云,工具调用走本地 |
✅ 安全兜底:若未配置 DashScope API Key,自动 100% 路由至本地 Ollama。
3.4 MCP 风格文件沙盒 📎
受 Model Context Protocol (MCP) 启发,实现安全文件交互:
- 路径隔离 :所有文件存于
uploads/{conversationId}/,按会话隔离。 - 安全防护 :
- 限制根目录(
mcp-allowed-directory) - 防目录遍历(
..被规范化) - 大文件(>5KB)自动截断预览
- 限制根目录(
- 典型场景 : 用户上传《信访政策.pdf》 → Agent 调用
readFile()读取 → 结合searchKnowledge()检索知识库 → 对比分析合规性。
3.5 现代化前端界面 🎨
5 个功能页面,统一采用渐变设计 + 毛玻璃效果:
| 页面 | 功能亮点 | 截图预览 |
|---|---|---|
📁 文件上传 /upload.html |
- 支持 PDF / TXT 上传 - 自动分块 + 向量化入库 Qdrant - 可指定领域标签(如 FINANCE) |
![]() |
💬 智能问答 /chat.html |
- 标准 RAG 流式对话 - 回答自动标注引用来源(文件名 + 片段) - 响应速度快,体验流畅 | ![]() |
🤖 Agentic 对话 /agent-chat.html |
- 智能体自主调用工具(文件/计算/检索等) - 实时展示执行轨迹:模型选择 → 工具调用 → 结果整合 - 支持复杂多步推理 | ![]() |
📚 领域文档管理 /domain.html |
- 管理 10+ 领域知识库(如 TECH, FINANCE, POLICY) - 查看各领域文档数量与状态 - 支持异步处理进度反馈 也可以改造为mq等方式作为ai服务,接受数据存储知识库。 |
![]() |
🗃️ Qdrant 管理 /qdrant.html |
- 查看现有向量集合(Collections) - 创建新集合(自动配置 1024 维) - 调试向量存储状态 | ![]() |
4. 快速启动与配置 ⚙️
4.1 本地全栈运行
# 1. 启动 Ollama 并拉取模型
ollama serve
ollama pull qwen2.5:7b
ollama pull qwen3-embedding:0.6b
# 2. 启动 Qdrant
docker run -d -p 6333:6333 -p 6334:6334 qdrant/qdrant
# 3. 运行应用
mvn spring-boot:run
# 4. 访问系统
open http://localhost:8080
4.2 关键配置 (application.yaml)
# 模型路由(生产建议 BUSINESS_TYPE)
model-router:
strategy: BUSINESS_TYPE
business-type:
aliyun-types: [COMPLEX_QUERY, LONG_CONTEXT]
local-types: [SIMPLE_QA, TOOL_CALLING]
# RAG 参数
rag:
chunk-size: 500
chunk-overlap: 50
max-results: 5
min-score: 0.5
# Agent 安全沙盒
agent:
context-window-size: 10
mcp-allowed-directory: ./uploads # 严格限制!
mcp-file-enabled: true
🔑 DashScope 配置 :设置环境变量
DASHSCOPE_API_KEY即可启用云端模型。
5. 企业级细节与扩展点 💡
- 金融计算深度支持 :
- 投资分析:IRR(牛顿法)、NPV、摊销计划
- 债券:定价、到期收益率(YTM)、久期、凸度
- 期权:Black-Scholes 模型 + Greeks(Delta/Gamma/Vega)
- 📚 详见 Financial-Calculation-Guide.md
- 领域知识管理 :支持
TECHNOLOGY、FINANCE等 10+ 领域,异步处理入库。 - 可扩展建议 :
- 安全 :反向代理层增加上传大小限制,收紧
mcp-allowed-directory - 可观测性 :将
AgentExecutionInfo接入日志系统,构建完整审计链 - 前端:当前静态页可无缝替换为 React/Vue SPA,后端 SSE 接口已就绪
- 安全 :反向代理层增加上传大小限制,收紧
6. 结语:为什么这个项目值得尝试? ✅
"不是 Demo,而是基于已有企业级实现剥离出来的可落地的企业级知识底座。"
- 全栈私有化:Ollama + Qdrant + SQLite,无外部依赖;
- Agentic Ready :不止问答,更能自主调用工具、分析文件、执行计算;
- 场景覆盖广:从通用 RAG 到金融/政务等垂直领域;
- 开箱即用:5 分钟启动,5 个页面覆盖核心需求;
- 灵活扩展:模型、工具、路由策略均可插拔。
无论是搭建内部知识库、智能客服,还是探索 Agentic AI 应用,这个项目都提供了生产级参考实现。立即克隆,开启您的企业智能之旅!
🔗 项目地址:https://github.com/IdeasForLife/knowledge
⭐ 如果对你有帮助,欢迎 Star 支持!
🚀 最近计划:MCP 智能体 × 企业运维生态
项目目标提供各种ai实际能力,目前正在开发 MCP(Model Context Protocol)智能体在自动化运维场景的深度集成 ,目标是构建一个具备自主感知、诊断与操作能力的 AI 运维助手。目前已规划对接以下核心系统,实现可插拔的ai能力:
- 代码与协作:GitLab(PR 分析、CI 状态查询)、飞书文档(故障复盘知识检索)
- 日志与监控:阿里云日志服务(SLS)、ClickHouse(高性能日志分析)、SkyWalking(分布式链路追踪),CAT(美团开源的监控平台)
- 基础设施:Kubernetes(Pod 状态、事件查询、资源扩缩容建议)
- 命令执行 :安全沙盒化的
cat/grep/kubectl等类 CLI 工具调用 - arthas线上pod jvm等数据收集
通过统一的 MCP 工具接口,智能体可跨系统关联上下文------例如:
"用户反馈服务变慢" → 自动查询 SkyWalking 链路 → 定位慢接口 → 拉取 Kubernetes Pod 日志 → 分析 ClickHouse 中的错误日志聚合 → 生成根因假设。
🔍 智能归因引擎 正在开发中,未来将支持基于多源数据的自动根因定位与修复建议,真正实现 "观测即行动" 的 AIOps 闭环。敬请期待!





