SpringBoot + LangChain4j 打造企业级 RAG 智能知识库,多工具集成方案

基于 Spring Boot 4 + LangChain4j 1.11 + Ollama + Qdrant +MCP 的一体化 多Agentic 智能体,RAG 系统

本文结合笔者企业级项目,重新抽象,开发,一个真正"开箱即用"的企业级智能知识库系统。它不仅支持标准 RAG 问答,更融合了 Agentic 智能体架构MCP 文件沙盒金融专用算子混合模型路由,提供从文档上传到复杂推理的完整闭环体验。


1. 总览:技术栈与核心能力 ✨

维度 技术选型 能力说明
后端框架 Spring Boot 4 + SQLite 轻量级持久化,无需额外数据库,生产可切换为其他数据,如mysql,pgsql
AI 引擎 LangChain4j 1.11 支持 Agentic 工具调用、流式响应、上下文记忆
语言模型 Ollama(qwen2.5:7b) + 可选 DashScope(qwen-plus 本地私有部署 + 云端高性能混合
嵌入模型 Ollama(qwen3-embedding:0.6b 固定使用本地,保障数据不出域,高性能,降低成本
向量库 Qdrant(1024 维) 自动建集、高效检索(minScore=0.5)
前端界面 纯静态 HTML/JS 毛玻璃效果 + 渐变设计,5 大功能页面,少依赖,轻量化。
特色能力 🎯 10+ 领域文档管理 🧠 Agentic 多工具协作 📊 金融计算(IRR/债券/期权) 📎 MCP 文件分析 🌤️ 天气/时间查询 企业场景全覆盖

2. 端到端架构 🚀

💡 关键设计 :嵌入模型始终走本地 Ollama ,确保敏感文档向量化过程完全私有;仅生成模型可动态路由。


3. 模块深度解析

3.1 RAG 检索增强生成 📄

  • 入口RagService
  • 流程
    1. 用户提问 → 本地 qwen3-embedding 生成向量;
    2. Qdrant 检索 top5 相似段落(min-score: 0.5);
    3. 拼接上下文 → 路由至 LLM(本地/云端)→ 流式返回带引用的回答。
  • 文档支持 :PDF/TXT 自动分块(chunk-size: 500, overlap: 50),元数据含文件名便于溯源。

3.2 Agentic 智能体对话 ⭐

基于 LangChain4j Agentic 架构,实现自主决策与工具协作:

  • 记忆机制MessageWindowChatMemory,滑动窗口管理最近 2 × context-window-size 条消息(默认 20 条)。
  • 内置工具集 (Agent 自主调用):
    • searchKnowledge():向量知识库检索
    • readFile() / listDirectory() / searchFiles():MCP 文件系统操作
    • calculate():数学表达式求值(exp4j)
    • calculateAmortization():贷款摊销计划
    • getIRR() / getBondPrice() / getOptionPrice():金融专用计算
    • getCurrentTime() / getWeather():实时信息查询
  • 执行追踪AgentExecutionInfo 记录完整思考链,前端可展示"Agent 正在读取文件...调用 Black-Scholes..."。

3.3 混合模型路由策略 🔀

通过 ModelRouterService 实现智能分流:

策略 配置示例 适用场景
PERCENTAGE aliyun: 30, local: 70 测试环境、负载均衡
BUSINESS_TYPE aliyun-types: [COMPLEX_QUERY, LONG_CONTEXT] local-types: [TOOL_CALLING, SIMPLE_QA] 生产推荐:复杂任务上云,工具调用走本地

安全兜底:若未配置 DashScope API Key,自动 100% 路由至本地 Ollama。


3.4 MCP 风格文件沙盒 📎

Model Context Protocol (MCP) 启发,实现安全文件交互:

  • 路径隔离 :所有文件存于 uploads/{conversationId}/,按会话隔离。
  • 安全防护
    • 限制根目录(mcp-allowed-directory
    • 防目录遍历(.. 被规范化)
    • 大文件(>5KB)自动截断预览
  • 典型场景 : 用户上传《信访政策.pdf》 → Agent 调用 readFile() 读取 → 结合 searchKnowledge() 检索知识库 → 对比分析合规性。

3.5 现代化前端界面 🎨

5 个功能页面,统一采用渐变设计 + 毛玻璃效果

页面 功能亮点 截图预览
📁 文件上传 /upload.html - 支持 PDF / TXT 上传 - 自动分块 + 向量化入库 Qdrant - 可指定领域标签(如 FINANCE
💬 智能问答 /chat.html - 标准 RAG 流式对话 - 回答自动标注引用来源(文件名 + 片段) - 响应速度快,体验流畅
🤖 Agentic 对话 /agent-chat.html - 智能体自主调用工具(文件/计算/检索等) - 实时展示执行轨迹:模型选择 → 工具调用 → 结果整合 - 支持复杂多步推理
📚 领域文档管理 /domain.html - 管理 10+ 领域知识库(如 TECH, FINANCE, POLICY) - 查看各领域文档数量与状态 - 支持异步处理进度反馈 也可以改造为mq等方式作为ai服务,接受数据存储知识库。
🗃️ Qdrant 管理 /qdrant.html - 查看现有向量集合(Collections) - 创建新集合(自动配置 1024 维) - 调试向量存储状态

4. 快速启动与配置 ⚙️

4.1 本地全栈运行

复制代码
# 1. 启动 Ollama 并拉取模型
ollama serve
ollama pull qwen2.5:7b
ollama pull qwen3-embedding:0.6b

# 2. 启动 Qdrant
docker run -d -p 6333:6333 -p 6334:6334 qdrant/qdrant

# 3. 运行应用
mvn spring-boot:run

# 4. 访问系统
open http://localhost:8080

4.2 关键配置 (application.yaml)

复制代码
# 模型路由(生产建议 BUSINESS_TYPE)
model-router:
  strategy: BUSINESS_TYPE
  business-type:
    aliyun-types: [COMPLEX_QUERY, LONG_CONTEXT]
    local-types: [SIMPLE_QA, TOOL_CALLING]

# RAG 参数
rag:
  chunk-size: 500
  chunk-overlap: 50
  max-results: 5
  min-score: 0.5

# Agent 安全沙盒
agent:
  context-window-size: 10
  mcp-allowed-directory: ./uploads  # 严格限制!
  mcp-file-enabled: true

🔑 DashScope 配置 :设置环境变量 DASHSCOPE_API_KEY 即可启用云端模型。


5. 企业级细节与扩展点 💡

  • 金融计算深度支持
    • 投资分析:IRR(牛顿法)、NPV、摊销计划
    • 债券:定价、到期收益率(YTM)、久期、凸度
    • 期权:Black-Scholes 模型 + Greeks(Delta/Gamma/Vega)
    • 📚 详见 Financial-Calculation-Guide.md
  • 领域知识管理 :支持 TECHNOLOGYFINANCE 等 10+ 领域,异步处理入库。
  • 可扩展建议
    • 安全 :反向代理层增加上传大小限制,收紧 mcp-allowed-directory
    • 可观测性 :将 AgentExecutionInfo 接入日志系统,构建完整审计链
    • 前端:当前静态页可无缝替换为 React/Vue SPA,后端 SSE 接口已就绪

6. 结语:为什么这个项目值得尝试? ✅

"不是 Demo,而是基于已有企业级实现剥离出来的可落地的企业级知识底座。"

  • 全栈私有化:Ollama + Qdrant + SQLite,无外部依赖;
  • Agentic Ready :不止问答,更能自主调用工具、分析文件、执行计算
  • 场景覆盖广:从通用 RAG 到金融/政务等垂直领域;
  • 开箱即用:5 分钟启动,5 个页面覆盖核心需求;
  • 灵活扩展:模型、工具、路由策略均可插拔。

无论是搭建内部知识库、智能客服,还是探索 Agentic AI 应用,这个项目都提供了生产级参考实现。立即克隆,开启您的企业智能之旅!

🔗 项目地址:https://github.com/IdeasForLife/knowledge

⭐ 如果对你有帮助,欢迎 Star 支持!

🚀 最近计划:MCP 智能体 × 企业运维生态

项目目标提供各种ai实际能力,目前正在开发 MCP(Model Context Protocol)智能体在自动化运维场景的深度集成 ,目标是构建一个具备自主感知、诊断与操作能力的 AI 运维助手。目前已规划对接以下核心系统,实现可插拔的ai能力:

  • 代码与协作:GitLab(PR 分析、CI 状态查询)、飞书文档(故障复盘知识检索)
  • 日志与监控:阿里云日志服务(SLS)、ClickHouse(高性能日志分析)、SkyWalking(分布式链路追踪),CAT(美团开源的监控平台)
  • 基础设施:Kubernetes(Pod 状态、事件查询、资源扩缩容建议)
  • 命令执行 :安全沙盒化的 cat / grep / kubectl 等类 CLI 工具调用
  • arthas线上pod jvm等数据收集

通过统一的 MCP 工具接口,智能体可跨系统关联上下文------例如:

"用户反馈服务变慢" → 自动查询 SkyWalking 链路 → 定位慢接口 → 拉取 Kubernetes Pod 日志 → 分析 ClickHouse 中的错误日志聚合 → 生成根因假设。

🔍 智能归因引擎 正在开发中,未来将支持基于多源数据的自动根因定位与修复建议,真正实现 "观测即行动" 的 AIOps 闭环。敬请期待!

相关推荐
百锦再3 小时前
Java中的日期时间API详解:从Date、Calendar到现代时间体系
java·开发语言·spring boot·struts·spring cloud·junit·kafka
树码小子3 小时前
图书管理系统(2)图书列表接口
spring boot·mybatis·图书管理系统
Coder_Boy_4 小时前
Java高级_资深_架构岗 核心知识点——高并发模块(底层+实践+最佳实践)
java·开发语言·人工智能·spring boot·分布式·微服务·架构
马克Markorg5 小时前
基于LLM的大模型的RAG(检索增强生成)实现对比
python·大模型·agent·rag·企业级知识库的框架·rag 知识库
健康平安的活着5 小时前
AI之Toolcalling的使用案例(langchain4j+springboot)
人工智能·spring boot·后端
百锦再6 小时前
Java IO详解:File、FileInputStream与FileOutputStream
java·开发语言·jvm·spring boot·spring cloud·kafka·maven
百锦再6 小时前
Java InputStream和OutputStream实现类完全指南
java·开发语言·spring boot·python·struts·spring cloud·kafka
deephub6 小时前
深入RAG架构:分块策略、混合检索与重排序的工程实现
人工智能·python·大语言模型·rag
树码小子7 小时前
图书管理系统(3)修改图书接口
spring boot·mybatis·图书管理系统