京东前两天发布了一个开源的Agent产品-JoyAgent-JDGenie,在GAIA榜单上分数达到了75.15%,超越了众多开源的AI Agent项目。
该开源项目提供了一个在线体验的地址joyagent-genie.jdcloud.com/,我们第一时间进行了体...

整体页面简洁大方,智能体提供了网页模式,文档模式,PPT模式和表格模式,同时支持深度研究。考虑到市面上基本没有PPT模式的产品,我们以PPT模式,来一步一步拆解JDGenie。
PPT模式我们让Agent输出一份中国潮玩市场的分析报告,大概5分钟后,成功生成。PPT是黑色风格,中间有丰富的图表,包括柱状图,饼状图,整体效果不错。


让我们来深入分析具体的过程。从智能体的思考过程来看,智能体首先做了一个任务计划:
然后"市场洞察专员"智能体搜索了几十多篇网页,收集中国潮玩市场的市场规模、主要品牌、消费者行为等数据。
然后,"数据分析师"智能体基于刚才收集到的信息,形成条理清晰的结构化分析内容,并保存为一个Markdown文件,这个生成Markdown的过程是通过Python代码实现的。
最后,报告撰写专家智能体将Markdown文件,生成整理为PPT文件。在Genie的体系中,上述的各种智能体,统一称之为"数字员工"。
完整的体验完这个生成过程,我们再来看JoyAgent-JDGenie的核心特点,就能更加深入理解了。
第一,端到端完整的多智能体产品,开箱即用,支持二次开发。
第二,支持多种智能体设计模式和多智能体上下文管理,支持高并发DAG执行引擎,极致的执行效率
第三,支持子智能体和工具,包括:子Agent和工具可插拔(预制多种子智能体和工具),支持多种文件交付样式:html、ppt、markdown,支持plan和工具调用 RL优化迭代,支持全链路流式输出。
下图给出主要的创新点:
1、多阶段思考:支持多层级的规划和思考。
2、多智能体:多种智能体设计模式,例如市场调研专员,数据分析师,报告撰写专家。
3、跨任务级别的相似任务memory
4、工具:这里是指基于已有工具迭代产生新工具,而不是从0-1直接生成新工具(减少错误工具的生成),以及基于已有工具隐性拆解为原子工具,并基于原子工具结合大模型自动组合成新工具(不需要花费人力预先定义和拆解原子工具)。
同时,我们发现JoyAgent-JDGenie代码中,已经集成了MCP的能力,可以在配置文件中配置MCP Server,就能自动调用MCP的能力。
