意十足!京东JoyAgent智能体确实是产品级开源!

这几天被京东智能体JoyAgent开源的朋友圈消息刷屏了,"行业首个/100%开源/产品级/企业级智能体"这几个关键词吸引到了我,标题党且信一半,个中究竟还是要去社区看看,马上也想到了宇宙厂的coze,特意搜了下,果不其然,字节coze也宣布了开源,时间赶一起了,这是啥玩法,这哥俩也有默契么?

Anyway,大厂的同频工作和PR通常代表了行业在某个方向有较大程度的共识,值得花点时间研究下,本篇先重点看下京东JoyAgent的开源情况。

一、首先为什么开源?

个人认为这是大厂主动给中小团队透出的机会,就这个问题和京东字节的朋友都聊了下。

京东的商业模式决定了它的技术产品首先是为自营和生态业务服务的,核心在于为主营业务降本增效,如果内部验证有效就开源出来做大行业影响力,比如跨端前端开源框架Taro,做的很不错,git上有36K+星,外部核心贡献者还有腾讯、字节、阿里和小红书等国内其他大厂的前端团队,整体来说项目很纯粹,符合开源精神,一起做好产品利好你我他。

字节的商业模式则决定了它想做的一定是平台,扣子空间4月刚发布时即定位的智能体应用市场,要做大应用市场就要吸引大量开发者来构建应用生态,平台后续的转商模式一是基于数据和规则的制定来分发这些应用,二是基于内外部工具的开发和引入做工具收费和分成,此外说不定还有机会激活下公有云的销售,不过他们应该已经发现真正的严肃开发者很难放心把业务都架在他们那,闭源模式下价值很难做厚。

二、智能体创业机会

从创业者的角度来看,垂直智能体很可能就是中小公司和个人开发者中短期参与AI市场的最好机会,最主要的原因就是细分领域太多了,大厂未必看得上也未必干的好!也许GPT5这种超级大模型会将很多垂类能力打到70-80分的水平(持续关注),但它的资源也是有限的,肯定也不会有卷死所有垂类机会的想法,小团队和超级个体的生存空间就在这里,这点咱们的认知必须得清楚。

ok,言归正传,2025是Agent的元年,这一波进入市场正当其时,大厂开源是大好事,他们投入3个月够咱们折腾一年多,能直接拿来用有何不可,不过在此之前还是要先看看他们诚意如何。

三、开源到什么程度?

1、先确认否真开源,或者说开源到什么程度

开源项目选型最重要的就是三点,完整公开的代码+明确的开源协议+持续更新维护,这三点缺一不可!市场上"伪开源"项目很多,要么就开源下SDK要么就只开源个框架,需要大量的二次开发,要么就是一做部署就发现还是要钱(好好看协议),真的无语,这一点很重要,注意避雷。

2、JoyAgent的自我介绍

社区地址:github.com/jd-opensour...关于开源的文字介绍如下。

另外有点意思有点勇!项目组把主要友商直接拉出来对比了😂,仔细看了下,上墙的这几个主要Agent小编大都深入使用并尝试过部署,除了Coze这两天加开了FlowGram工作流以外,其他信息还大都符合事实。

3、产品完成度情况

社区文档里多次强调【端到端】,所谓端到端就是部署后即完整可用,前端、后端、框架、引擎和和核心子智能体都有。花了一个多小时完成了本地部署,完成度确实不错,部署完即可用!回头详细写下部署过程。如果大家暂无时间部署,项目组还提供了一个web体验版本可申请体验。

体验地址:joyagent-genie.jdcloud.com(用京东账号登录,输入邮箱申请即可)

主界面如下,标准的对话框界面,提供了网页、文档、PPT和表格4个输出模式(内置的子智能体)。

有点惊喜,小编之前多次尝试找开源的PPT智能体,全网翻了两遍,还别说,有些时候大家以为一定有的东西其实真没有,这次算是找到了,马上做了多次测试,效果基本满意,马上让团队同学申请二开共建(我们主要是内部使用暂未考虑商业场景,有感兴趣的朋友请联系我)。

四、产品性能与设计要点

影响智能体表现的重要因素包括模型能力、规划与执行机制、上下文、多智能体调度及工具链的集成能力等,综合性能表现为各环节准确率乘积,任何一个环节拉跨都会影响整体表现。

1、GAIA的得分情况(智能体技术风向标,可参考性高)

Test集效果 65.12%,第5!只落后Claude、Genini和GPT几个大佬的闭源产品,没得说确实优秀!

2、核心设计要点(小编已加入开发者交流群并与两位项目组核心开发者做了较深入的交流)。

(1)任务层架构设计:Multi-level and Multi-pattern Thinking

采用【计划-执行】的双层任务架构,在Work Level层,基于深度推理分析query识别核心需求,将复杂问题分解为独立可执行的子任务;在Task-level层,通过Reason Act 模式来操作Task,有序执行和完成任务目标。

架构层既要满足复杂推理的需求,也要避免因过度拆解产生的资源消耗陷阱,JoyAgent这种双层设计与行业顶流产品Gemini-CLI、Cusor的设计相似,可以认为是目前90分以上水准的做法。

(2)上下文记忆管理:Cross Task Workflow Memory

即跨任务的工作流记忆,这层应该是项目的核心创新,官方的PR也做了重点宣传,这里展开说下个人理解。JoyAgent采用了【文件系统+Memory】双重混合的上下文管理系统,设计思路是全局任务通过文件系统管理,支持跨任务共享,历史会话基于内存管理,做任务级的隔离。好处显而易见, 对于相似任务可快速复用分析框架,大幅降低资源消耗,对于关联任务可通过上下文注入,显著提升作业效率。

  • 哪些场景/工具会生成文件?

具备任务全局属性的结果,比调用工具生成、代码执行和任务最终报告的生成等。

tips:在工具层面,目前主要是 Filetool、CodeInterpreter、ReportTool、DeepResearch 这几个会保存文件,其他tool都只做内存管理。

  • 文件如何被存储?

实际文件内容存储于OSS,AgentContext只存储元数据(通过Sqlite实现)。

scss 复制代码
// CodeInterpreter工具产生文件
File file = File.builder()
    .fileName(fileInfo.getFileName())
    .ossUrl(fileInfo.getOssUrl())           // 实际文件存储在OSS
    .description(fileInfo.getFileName())
    .isInternalFile(false)
    .build();
agentContext.getProductFiles().add(file);   // 只存储文件引用元数据
  • 文件如何被引用?

上下文注入机制,即格式化后的文件信息注入Prompt,实现跨任务共享。

less 复制代码
// 将文件信息格式化后注入Prompt
String filesStr = FileUtil.formatFileInfo(context.getProductFiles(), true);
setSystemPrompt(getSystemPromptSnapshot().replace("{{files}}", filesStr));

// formatFileInfo生成的是文件列表描述,不是文件内容
"fileName:report.html fileDesc:数据分析报告 fileUrl:https://oss.xxx/report.html"

(3)工具的组合优化:Tool Evolution Via Atom Tools

项目组给出个工具升级为数字员工的定义,即可结合某一具体任务分析,为工具赋予一个专业化数字员工角色,从而让具体工具具备上下文感知和角色适应能力,实现逻辑如下,

  • 工具拆解。将已有工具功能(如Excel解析器、PPT生成器)拆解为可复用的原子操作单元(如文件读取、表格解析、图表渲染),拆解过程结合大模型理解工具语义,形成原子工具知识库。
  • 工具重组。当遇到任务(如"智能体市场分析报告")时,Agent分析所需能力触发重组并赋予专家角色,基于强化学习算法,将原子工具(数据抓取+可视化+文档生成)组合为新工具链并预验证有效性。
  • 反馈强化‌。新工具组合执行后基于实际效果数据继续优化原子工具的组合策略‌,成功验证的工具自动注册至共享库供后续其他同类任务调用,如此工具库将随使用不断完善,实现"自我进化"。

设计思路很新颖,具体成效与高并发DAG执行引擎能力密切相关。

scss 复制代码
// 高并发DAG执行引擎
public Map<String, String> executeTools(List<ToolCall> commands) {
    CountDownLatch taskCount = ThreadUtil.getCountDownLatch(commands.size());
    // 并发执行工具,提升效率
    for (ToolCall tooCall : commands) {
        ThreadUtil.execute(() -> {
            String toolResult = executeTool(tooCall);
            result.put(tooCall.getId(), toolResult);
        });
    }
}

(4)关于模型与搜索

  • 模型训练。基于deepseekv3、GPT4.1和京东自研大模型训练,混合架构明显,融合大小型模型的优势,实现复杂任务的高效推理与执行。‌
  • 深度搜索。支持4个引擎(bing/ina/sogou/serp)并发搜索,每个引擎支持5次并发查询并返回10个结果,基于内容质量动态决定是否需要更多搜索。

tips,模型与搜索是重要性能和成本项,需要在部署后结合实际业务场景重点做策略选择和训练优化,官方实践也只能作为参考。

五、关于开源协议

标准的Apache License 2.0‌开源协议,允许用户自由使用、修改和分发代码,包括商业用途。另外仔细看看了下贡献者协议,规范标准,过往东哥家的开源产品也都纯粹,没有黑历史,放心用吧。‌

总结下:JoyAgent开源确实有诚意,完成度高,性能在线,且可商用!希望项目能持续维护和升级(几天时间git上就有1500星了,项目组应该会有动力持续搞,内部至少是个绩效A级的项目),有需求的朋友们非常值得一试!

下一篇讲讲部署过程及一些二开的想法。

相关推荐
花椒技术11 小时前
从7S到4S,我们如何系统性降低直播播放延迟
性能优化·程序员
程序员cxuan15 小时前
vibe coding 凉了,wish coding 来了
人工智能·后端·程序员
JustTest20 小时前
Mac mini初始安装软件记录
程序员
SimonKing20 小时前
轻量级富文本编辑器Quill,保姆级教程,5分钟快速上手
java·后端·程序员
文心快码BaiduComate1 天前
Comate搭载Kimi K2.6,长程13h!
前端·后端·程序员
图图玩ai2 天前
SSH 命令管理工具怎么选?从命令收藏到批量执行一次讲清
linux·nginx·docker·ai·程序员·ssh·可视化·gmssh·批量命令执行
SamDeepThinking2 天前
程序员懂业务,到底要懂到什么程度
后端·程序员·团队管理
盖世英雄酱581362 天前
java技术博主停更3个月了???
程序员
DyLatte2 天前
我做了个AI项目后才发现:会做事的人,正在输给会讲故事的人
前端·后端·程序员
SimonKing2 天前
别让你的代码裸奔!Spring Boot混淆全攻略(附配置)
java·后端·程序员