MaxKB4j 近三月开发进展速览:从 RAG 引擎到全能 AI 工作流平台

MaxKB4j 近三月开发进展速览:从 RAG 引擎到全能 AI 工作流平台

时间跨度 :2026 年 3 月 --- 2026 年 5 月

提交数量 :250+ 次提交,涵盖 12 个核心模块

一句话总结:这三个月,MaxKB4j 完成了从"能用"到"好用"的蜕变。


📌 项目简介

MaxKB4j(Max Knowledge Brain for Java)是一个基于 Java 21 + Spring Boot 3 + 虚拟线程 构建的企业级智能问答系统,融合了 RAG(检索增强生成)可视化 LLM 工作流引擎,开箱即用、模型中立、安全可靠。

适用于智能客服、企业内部知识库、数据分析、学术研究与教育等多种场景。


🔥 三月核心进展一览

1. ⚙️ 工作流引擎 --- 大规模重构,脱胎换骨

工作流模块是本季度投入最大的方向,经历了从底层架构到上层逻辑的全面重构:

  • 节点执行架构升级:重构节点处理器为抽象基类实现,统一参数解析方式,继承结构更清晰,扩展更容易
  • 异步执行与超时控制:应用节点和循环节点全面改为异步执行模式,新增节点执行超时控制机制,保障长时间任务的稳定性
  • 循环节点优化:重构循环节点处理器为同步执行模式,优化上下文传递机制,解决嵌套循环的数据流转问题
  • 异常处理统一化:建立统一异常处理机制,优化错误传播链路,工作流运行更健壮
  • 比较器接口标准化:统一比较器接口,为条件分支节点提供一致的判断能力
  • 运行时详情重构:重新设计运行时详情获取机制,调试与监控体验大幅提升
  • 知识库节点支持:新增知识库节点类型,可在工作流中直接操作知识库资源
  • 模板渲染增强:变量赋值节点支持模板渲染,修复模板变量传递问题
  • MCP 客户端执行器:工作流内原生支持 MCP 工具调用,打通 AI Agent 与外部工具的桥梁

💡 重构不是目的,稳定与可扩展才是。 这一轮重构让工作流引擎具备了支撑复杂企业级场景的能力。


2. ⏰ 触发器模块 --- 从零到一,全新上线

触发器是本季度全新开发的核心模块,让智能体和工具实现无人值守的自动化运行

  • 定时触发器:支持 Cron 表达式配置,定时自动执行智能体任务(如每日数据报告生成、定期数据同步)
  • Webhook 触发器:支持外部系统通过 HTTP 回调触发工作流,并内置 Token 鉴权机制保障安全
  • 事件触发器:支持基于事件的响应式触发,实时处理业务变更(如 CRM 新增线索自动分析)
  • 任务记录管理:完整的触发器执行记录查询、状态跟踪、分页查询功能
  • 智能体联动:触发器与智能体模块深度集成,支持按源类型和源 ID 精准触发

🚀 有了触发器,MaxKB4j 不再只是"被动应答"的问答系统,而是能主动感知、自动执行的 AI 自动化平台。


3. 📄 PDF 解析器 --- 深度增强,精准提取

PDF 解析模块经历了持续迭代,解析能力大幅跃升:

  • 图片提取:支持从 PDF 中提取图片并上传,解决 JPEG2000 格式兼容问题
  • 页面布局保持:解析时保留原始页面布局信息,还原度更高
  • 标题层级识别:智能识别标题层级结构,优化标题识别逻辑
  • Markdown 转换:支持将 PDF 内容转换为 Markdown 格式输出
  • 图片上传性能优化:优化解析器中图片上传的性能表现

4. 🔍 知识库 --- 搜索升级,管理增强

知识库模块在检索精度和管理便捷性上持续进化:

  • 图谱数据库迁移:图数据存储从原有方案迁移到 MongoDB,性能和灵活性显著提升
  • 知识库导入/导出:支持知识库的完整导入导出,方便跨环境迁移和备份
  • 段落关键词实体:新增段落关键词功能,提升检索精准度
  • 混合搜索优化:移除 RRF 融合算法并重构混合搜索实现,检索效果更优
  • 全文检索能力:基于 MongoDB 的全文检索支持
  • WEB 知识库去广告:爬取网页内容时自动去除广告,提升内容质量
  • 文档分割性能优化:优化文本分割服务性能,调整文件上传限制
  • 批量操作:支持批量删除知识库、批量删除智能体、批量删除工具

5. 🤖 模型管理 --- 更多模型,更强能力

模型层持续扩展,支持更多主流大模型:

  • DeepSeek 新模型支持:集成 DeepSeek 系列新模型
  • Qwen 模型重构:重构 Qwen 模型参数类和阿里云百炼模型提供商配置
  • MiniMax 模型支持:新增 MiniMax 模型接入
  • 统一思考功能:统一启用思考(Thinking)功能,支持推理型模型的深度思考能力
  • LangChain4j HTTP 客户端:集成 LangChain4j HTTP 客户端以支持 Spring RestClient,HTTP 通信更高效
  • 模型提供商重构:智谱 AI、阿里云百炼等多个提供商实现统一重构
  • 图像模型参数配置:新增图像模型的参数配置功能
  • 本地缓存优化:模型服务替换为本地缓存实现,减少不必要的远程调用

6. 💬 对话系统 --- 记忆、追踪、开放

对话模块在用户体验和开放能力上持续增强:

  • 长期记忆功能:实现应用长期记忆能力,优化异步处理和状态管理,让 AI 真正"记住"用户
  • 来源跟踪:聊天记录支持 IP 地址和来源追踪功能,便于运营分析
  • 分享链接:聊天记录支持分享功能,方便知识传播和协作
  • 推理内容返回:聊天流程支持返回 AI 推理过程内容,提升透明度
  • OpenAI 兼容 API:实现 OpenAI API 兼容接口,现有系统可无缝接入
  • 聊天开放接口:新增聊天开放接口控制器,方便第三方系统集成

7. 🛠 工具生态 --- MCP、Shell、Skills 全面扩展

工具模块是连接 AI 与外部世界的桥梁,本季度大幅扩展:

  • MCP 协议支持:完善 MCP 客户端工具,支持 SSE 类型的 MCP 传输协议,优化资源管理和健康检查
  • Shell 工具:新增 Shell 工具支持,AI 可执行命令行操作
  • Skills 技能工具:开发完整的技能工具功能,支持 Claude SKILLS 技能调用
  • HTTP 接口工具:支持 HTTP 接口工具调用功能
  • 工具初始化参数:工具支持初始化参数配置

8. 🎙️ 语音能力 --- ASR 语音识别上线

  • 百炼 ASR 模型:集成阿里云百炼 ASR 语音识别模型
  • 通义千问 ASR:新增通义千问 ASR 语音识别功能
  • TTS 参数重构:重构 TTS 参数模型,优化语音合成配置

9. 🔒 安全加固 --- Groovy 沙箱隔离

  • 运行时沙箱:为 Groovy 脚本执行器添加运行时沙箱隔离(groovy-sandbox),防止恶意代码执行
  • 安全漏洞修复:修复 Groovy 脚本执行安全漏洞,保障系统安全
  • 权限管理优化:优化用户角色权限处理逻辑

10. 🗄️ 数据库与基础设施

  • MySQL 支持:新增 MySQL 数据库支持,降低部署门槛
  • 数据库迁移:统一数据库表字段命名规范,更新迁移脚本
  • 多模块项目改造:完成 Maven 多模块项目结构改造,代码组织更清晰
  • EasyExcel 集成:集成 EasyExcel 功能,重构知识库导出
  • 多平台 OCR:添加多平台 OCR 依赖支持

📊 数据说话

维度 数据
总提交数 250+
涉及模块 12 个核心模块
新增功能(feat) 60+
重构优化(refactor) 120+
Bug 修复(fix) 40+
性能优化(perf) 模型服务、文档分割、缓存、资源映射等多处

🚀 快速体验

在线演示

Docker 一键部署

bash 复制代码
docker run --name maxkb4j -d --restart always -p 8080:8080 \
  -e SPRING_DATASOURCE_URL=jdbc:postgresql://localhost:5432/MaxKB4j \
  -e SPRING_DATASOURCE_USERNAME=postgres \
  -e SPRING_DATASOURCE_PASSWORD=123456 \
  registry.cn-hangzhou.aliyuncs.com/tarzanx/maxkb4j

Docker-Compose(推荐)

bash 复制代码
docker-compose up -d

🛠 技术栈

类别 技术
后端 Java 21, Spring Boot 3, Sa-Token
AI 框架 LangChain4j 1.x
向量数据库 PostgreSQL 15 + pgvector
全文检索 MongoDB 6.0+
缓存 Caffeine
前端 Vue 3
脚本沙箱 groovy-sandbox

💡 为什么选择 MaxKB4j?

  • Java 生态原生:基于 Java 21 + Spring Boot 3,Java 团队零学习成本
  • 高并发基因:虚拟线程 + 响应式编程,轻松应对数千级并发
  • 模型中立:支持 DeepSeek、Qwen、GPT、Claude、Gemini 等主流模型
  • 可视化工作流:低代码编排复杂 AI 流程,业务人员也能上手
  • 安全可控:Groovy 沙箱隔离 + 细粒度权限管理,企业级安全保障
  • 开箱即用:Docker 一键部署,5 分钟集成到现有系统

🤝 参与贡献

MaxKB4j 是一个开源项目(GPL v3),欢迎社区参与贡献!


MaxKB4j --- 轻松构建高性能且稳定的智能体工作流和 RAG 知识库解决方案 🧠

相关推荐
暴躁小师兄数据学院10 小时前
【AI大模型应用开发工程师特训笔记】第04讲(第五章):条件判断与流程控制
大数据·人工智能·python·学习
Java 码思客10 小时前
【Spring AI实战】第2章 大模型基础调用:同步/异步/流式输出
java·人工智能·spring·ai
北京软秦科技有限公司10 小时前
档案复核联动文档核验,IACheck AI报告审核让资料管理体系真正闭环
人工智能
战族狼魂10 小时前
Claude 大模型在真实业务场景中的落地应用指南
人工智能·chatgpt·大模型
学困昇10 小时前
Linux 信号机制详解:从 Ctrl+C 到 SIGCHLD,一文理解进程信号
linux·c语言·开发语言·人工智能·面试
我是一只码蚁10 小时前
记一次苍穹外卖项目 Maven 编译报错的排查与解决全过程
java·经验分享·笔记·后端·架构·maven
艾莉丝努力练剑10 小时前
【Linux:文件】库的制作与原理进阶
linux·运维·服务器·网络·数据库·c++·人工智能
圣殿骑士-Khtangc10 小时前
构建AI Agent系统的可观测性:从“盲目信任“到“可视化治理“
人工智能
一个处女座的程序猿O(∩_∩)O10 小时前
AI Agent 记忆系统架构设计:OpenClaw、Claude Code、Hermes Agent 深度对比
人工智能