DB-GPT 0.7.5 版本更新:基于 Falcon 评测集的Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

V0.7.5 版本主要新增、增强了以下核心特性

🍀基于 Falcon 评测集的 Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

🍀优化 Falcon 评测集的加载和支持动态多环境的问题集

🍀 新增 Neo4j 图数据库支持

🍀 支持Elasticsearch的全文检索

🍀新增 指标检索Agent 波动分析Agent增强数据分析能力

🍀新增 WebSerachAgent处理联网搜索场景

✨新特性

1.基于 Falcon 评测集的Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

a.支持 端到端评测LLM在Falcon评测集基准

b.支持评测自定义Agent在Falcon评测集准确率、可执行率

详细的使用文档见:

2.优化 Falcon 评测集的加载和支持动态多环境的问题集

  • Falcon评测集加载优化为运行时动态加载,且从Falcon仓库动态拉取最新问题集
  • 拆分为DEV/TEST多环境问题集,按需评测

3.新增 Neo4j 图数据库支持

扩展Neo4j 数据库,进一步提升 RAG在复杂知识关系处理上的能力

4.支持Elasticsearch的全文检索

在ES支持向量检索的基础上,新增全文检索能力,提升RAG的检索召回能力

5.DB-GPT新增 指标检索Agent**、** 波动分析Agent**、** WebSearchAgent****等Agent

🐞 Bug 修复

  • 修复benchmark结果对比中布尔值和空值结果比较问题 (#2967)
  • 修复Graph知识图谱文档加载错误问题 (#2966)
  • 修复知识图谱的参数丢失问题 (#2926)
  • 修复通过环境变量配置数据源时的错误 (#2924)
  • 修复Milvus向量数据库在工作流中使用错误 (#2933)
  • 解决 AWEL 工作流多窗口问题和应用信息丢失 (#2944)

🛠️其他

  • 更新文档中的一些书写错误 (#2964)
  • 调整benchmark问题集文件 (#2940)

✨官方文档地址

英文:

http://docs.dbgpt.site/docs/overview

中文:

https://www.yuque.com/eosphoros/dbgpt-docs/bex30nsv60ru0fmx

✨致谢

🎉新贡献者

V0.7.5 版本新增 5 位 新的贡献者:

  • @Hikomorebi
  • @ZhikunZheng
  • @lusains
  • @zhangyj21-lh
  • @ymx10086

🔥🔥感谢所有贡献者使这次发布成为可能!

@Aries-ckt , @Hikomorebi , @ZhikunZheng , @chenliang15405 , @dusx1981 , @huhao0926 , @liuhill , @lusains , @yaoyifan-yyf , @ymx10086 , @zhangyj21-lh and alan.cl

✨附录

相关推荐
冬奇Lab3 小时前
Workflow 系列(01):基础理论——三种执行模型与 Anthropic 5 种模式
人工智能·agent·工作流引擎
冬奇Lab3 小时前
每日一个开源项目(第143篇):page-agent - 纯 JS 的网页 GUI Agent,无需截图、无需插件、无需后端
前端·人工智能·agent
To_OC4 小时前
LC 994 腐烂的橘子:人人都说是 BFS 入门题,我却写了三遍才过
javascript·算法·leetcode
程序员cxuan5 小时前
虽迟但到!GPT-5.6 终于来了!
人工智能·后端·程序员
ZhengEnCi7 小时前
Q03-UI设计进阶技巧-让界面更高级的7个核心原则
人工智能
IT_陈寒7 小时前
React的这个渲染问题连官方文档都没说清楚
前端·人工智能·后端
金銀銅鐵8 小时前
[Python] 扩展欧几里得算法
python·数学·算法
不加辣椒8 小时前
第12章 工具调用与 Agent 提示工程
人工智能
用户1693176172668 小时前
前端给AI消息做日期分组与时间线
人工智能
i晟9 小时前
Claude Code Harness 深度拆解:从你敲回车到模型回复,中间发生了什么
人工智能