MaxKB4j 近三月开发进展速览:从 RAG 引擎到全能 AI 工作流平台
时间跨度 :2026 年 3 月 --- 2026 年 5 月
提交数量 :250+ 次提交,涵盖 12 个核心模块
一句话总结:这三个月,MaxKB4j 完成了从"能用"到"好用"的蜕变。
📌 项目简介
MaxKB4j(Max Knowledge Brain for Java)是一个基于 Java 21 + Spring Boot 3 + 虚拟线程 构建的企业级智能问答系统,融合了 RAG(检索增强生成) 与 可视化 LLM 工作流引擎,开箱即用、模型中立、安全可靠。
适用于智能客服、企业内部知识库、数据分析、学术研究与教育等多种场景。
🔥 三月核心进展一览
1. ⚙️ 工作流引擎 --- 大规模重构,脱胎换骨
工作流模块是本季度投入最大的方向,经历了从底层架构到上层逻辑的全面重构:
- 节点执行架构升级:重构节点处理器为抽象基类实现,统一参数解析方式,继承结构更清晰,扩展更容易
- 异步执行与超时控制:应用节点和循环节点全面改为异步执行模式,新增节点执行超时控制机制,保障长时间任务的稳定性
- 循环节点优化:重构循环节点处理器为同步执行模式,优化上下文传递机制,解决嵌套循环的数据流转问题
- 异常处理统一化:建立统一异常处理机制,优化错误传播链路,工作流运行更健壮
- 比较器接口标准化:统一比较器接口,为条件分支节点提供一致的判断能力
- 运行时详情重构:重新设计运行时详情获取机制,调试与监控体验大幅提升
- 知识库节点支持:新增知识库节点类型,可在工作流中直接操作知识库资源
- 模板渲染增强:变量赋值节点支持模板渲染,修复模板变量传递问题
- MCP 客户端执行器:工作流内原生支持 MCP 工具调用,打通 AI Agent 与外部工具的桥梁
💡 重构不是目的,稳定与可扩展才是。 这一轮重构让工作流引擎具备了支撑复杂企业级场景的能力。
2. ⏰ 触发器模块 --- 从零到一,全新上线
触发器是本季度全新开发的核心模块,让智能体和工具实现无人值守的自动化运行:
- 定时触发器:支持 Cron 表达式配置,定时自动执行智能体任务(如每日数据报告生成、定期数据同步)
- Webhook 触发器:支持外部系统通过 HTTP 回调触发工作流,并内置 Token 鉴权机制保障安全
- 事件触发器:支持基于事件的响应式触发,实时处理业务变更(如 CRM 新增线索自动分析)
- 任务记录管理:完整的触发器执行记录查询、状态跟踪、分页查询功能
- 智能体联动:触发器与智能体模块深度集成,支持按源类型和源 ID 精准触发
🚀 有了触发器,MaxKB4j 不再只是"被动应答"的问答系统,而是能主动感知、自动执行的 AI 自动化平台。
3. 📄 PDF 解析器 --- 深度增强,精准提取
PDF 解析模块经历了持续迭代,解析能力大幅跃升:
- 图片提取:支持从 PDF 中提取图片并上传,解决 JPEG2000 格式兼容问题
- 页面布局保持:解析时保留原始页面布局信息,还原度更高
- 标题层级识别:智能识别标题层级结构,优化标题识别逻辑
- Markdown 转换:支持将 PDF 内容转换为 Markdown 格式输出
- 图片上传性能优化:优化解析器中图片上传的性能表现
4. 🔍 知识库 --- 搜索升级,管理增强
知识库模块在检索精度和管理便捷性上持续进化:
- 图谱数据库迁移:图数据存储从原有方案迁移到 MongoDB,性能和灵活性显著提升
- 知识库导入/导出:支持知识库的完整导入导出,方便跨环境迁移和备份
- 段落关键词实体:新增段落关键词功能,提升检索精准度
- 混合搜索优化:移除 RRF 融合算法并重构混合搜索实现,检索效果更优
- 全文检索能力:基于 MongoDB 的全文检索支持
- WEB 知识库去广告:爬取网页内容时自动去除广告,提升内容质量
- 文档分割性能优化:优化文本分割服务性能,调整文件上传限制
- 批量操作:支持批量删除知识库、批量删除智能体、批量删除工具
5. 🤖 模型管理 --- 更多模型,更强能力
模型层持续扩展,支持更多主流大模型:
- DeepSeek 新模型支持:集成 DeepSeek 系列新模型
- Qwen 模型重构:重构 Qwen 模型参数类和阿里云百炼模型提供商配置
- MiniMax 模型支持:新增 MiniMax 模型接入
- 统一思考功能:统一启用思考(Thinking)功能,支持推理型模型的深度思考能力
- LangChain4j HTTP 客户端:集成 LangChain4j HTTP 客户端以支持 Spring RestClient,HTTP 通信更高效
- 模型提供商重构:智谱 AI、阿里云百炼等多个提供商实现统一重构
- 图像模型参数配置:新增图像模型的参数配置功能
- 本地缓存优化:模型服务替换为本地缓存实现,减少不必要的远程调用
6. 💬 对话系统 --- 记忆、追踪、开放
对话模块在用户体验和开放能力上持续增强:
- 长期记忆功能:实现应用长期记忆能力,优化异步处理和状态管理,让 AI 真正"记住"用户
- 来源跟踪:聊天记录支持 IP 地址和来源追踪功能,便于运营分析
- 分享链接:聊天记录支持分享功能,方便知识传播和协作
- 推理内容返回:聊天流程支持返回 AI 推理过程内容,提升透明度
- OpenAI 兼容 API:实现 OpenAI API 兼容接口,现有系统可无缝接入
- 聊天开放接口:新增聊天开放接口控制器,方便第三方系统集成
7. 🛠 工具生态 --- MCP、Shell、Skills 全面扩展
工具模块是连接 AI 与外部世界的桥梁,本季度大幅扩展:
- MCP 协议支持:完善 MCP 客户端工具,支持 SSE 类型的 MCP 传输协议,优化资源管理和健康检查
- Shell 工具:新增 Shell 工具支持,AI 可执行命令行操作
- Skills 技能工具:开发完整的技能工具功能,支持 Claude SKILLS 技能调用
- HTTP 接口工具:支持 HTTP 接口工具调用功能
- 工具初始化参数:工具支持初始化参数配置
8. 🎙️ 语音能力 --- ASR 语音识别上线
- 百炼 ASR 模型:集成阿里云百炼 ASR 语音识别模型
- 通义千问 ASR:新增通义千问 ASR 语音识别功能
- TTS 参数重构:重构 TTS 参数模型,优化语音合成配置
9. 🔒 安全加固 --- Groovy 沙箱隔离
- 运行时沙箱:为 Groovy 脚本执行器添加运行时沙箱隔离(groovy-sandbox),防止恶意代码执行
- 安全漏洞修复:修复 Groovy 脚本执行安全漏洞,保障系统安全
- 权限管理优化:优化用户角色权限处理逻辑
10. 🗄️ 数据库与基础设施
- MySQL 支持:新增 MySQL 数据库支持,降低部署门槛
- 数据库迁移:统一数据库表字段命名规范,更新迁移脚本
- 多模块项目改造:完成 Maven 多模块项目结构改造,代码组织更清晰
- EasyExcel 集成:集成 EasyExcel 功能,重构知识库导出
- 多平台 OCR:添加多平台 OCR 依赖支持
📊 数据说话
| 维度 | 数据 |
|---|---|
| 总提交数 | 250+ 次 |
| 涉及模块 | 12 个核心模块 |
| 新增功能(feat) | 60+ 项 |
| 重构优化(refactor) | 120+ 项 |
| Bug 修复(fix) | 40+ 项 |
| 性能优化(perf) | 模型服务、文档分割、缓存、资源映射等多处 |
🚀 快速体验
在线演示
- 地址:http://43.143.235.194:8080/
- 账号:
demo/ 密码:demo@123456
Docker 一键部署
bash
docker run --name maxkb4j -d --restart always -p 8080:8080 \
-e SPRING_DATASOURCE_URL=jdbc:postgresql://localhost:5432/MaxKB4j \
-e SPRING_DATASOURCE_USERNAME=postgres \
-e SPRING_DATASOURCE_PASSWORD=123456 \
registry.cn-hangzhou.aliyuncs.com/tarzanx/maxkb4j
Docker-Compose(推荐)
bash
docker-compose up -d
🛠 技术栈
| 类别 | 技术 |
|---|---|
| 后端 | Java 21, Spring Boot 3, Sa-Token |
| AI 框架 | LangChain4j 1.x |
| 向量数据库 | PostgreSQL 15 + pgvector |
| 全文检索 | MongoDB 6.0+ |
| 缓存 | Caffeine |
| 前端 | Vue 3 |
| 脚本沙箱 | groovy-sandbox |
💡 为什么选择 MaxKB4j?
- Java 生态原生:基于 Java 21 + Spring Boot 3,Java 团队零学习成本
- 高并发基因:虚拟线程 + 响应式编程,轻松应对数千级并发
- 模型中立:支持 DeepSeek、Qwen、GPT、Claude、Gemini 等主流模型
- 可视化工作流:低代码编排复杂 AI 流程,业务人员也能上手
- 安全可控:Groovy 沙箱隔离 + 细粒度权限管理,企业级安全保障
- 开箱即用:Docker 一键部署,5 分钟集成到现有系统
🤝 参与贡献
MaxKB4j 是一个开源项目(GPL v3),欢迎社区参与贡献!
- 📋 Gitee:gitee.com/taisan/MaxK...
- 🐛 Issue 反馈:gitee.com/taisan/MaxK...
MaxKB4j --- 轻松构建高性能且稳定的智能体工作流和 RAG 知识库解决方案 🧠