DB-GPT 0.7.5 版本更新:基于 Falcon 评测集的Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

V0.7.5 版本主要新增、增强了以下核心特性

🍀基于 Falcon 评测集的 Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

🍀优化 Falcon 评测集的加载和支持动态多环境的问题集

🍀 新增 Neo4j 图数据库支持

🍀 支持Elasticsearch的全文检索

🍀新增 指标检索Agent 波动分析Agent增强数据分析能力

🍀新增 WebSerachAgent处理联网搜索场景

✨新特性

1.基于 Falcon 评测集的Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

a.支持 端到端评测LLM在Falcon评测集基准

b.支持评测自定义Agent在Falcon评测集准确率、可执行率

详细的使用文档见:

2.优化 Falcon 评测集的加载和支持动态多环境的问题集

  • Falcon评测集加载优化为运行时动态加载,且从Falcon仓库动态拉取最新问题集
  • 拆分为DEV/TEST多环境问题集,按需评测

3.新增 Neo4j 图数据库支持

扩展Neo4j 数据库,进一步提升 RAG在复杂知识关系处理上的能力

4.支持Elasticsearch的全文检索

在ES支持向量检索的基础上,新增全文检索能力,提升RAG的检索召回能力

5.DB-GPT新增 指标检索Agent**、** 波动分析Agent**、** WebSearchAgent****等Agent

🐞 Bug 修复

  • 修复benchmark结果对比中布尔值和空值结果比较问题 (#2967)
  • 修复Graph知识图谱文档加载错误问题 (#2966)
  • 修复知识图谱的参数丢失问题 (#2926)
  • 修复通过环境变量配置数据源时的错误 (#2924)
  • 修复Milvus向量数据库在工作流中使用错误 (#2933)
  • 解决 AWEL 工作流多窗口问题和应用信息丢失 (#2944)

🛠️其他

  • 更新文档中的一些书写错误 (#2964)
  • 调整benchmark问题集文件 (#2940)

✨官方文档地址

英文:

http://docs.dbgpt.site/docs/overview

中文:

https://www.yuque.com/eosphoros/dbgpt-docs/bex30nsv60ru0fmx

✨致谢

🎉新贡献者

V0.7.5 版本新增 5 位 新的贡献者:

  • @Hikomorebi
  • @ZhikunZheng
  • @lusains
  • @zhangyj21-lh
  • @ymx10086

🔥🔥感谢所有贡献者使这次发布成为可能!

@Aries-ckt , @Hikomorebi , @ZhikunZheng , @chenliang15405 , @dusx1981 , @huhao0926 , @liuhill , @lusains , @yaoyifan-yyf , @ymx10086 , @zhangyj21-lh and alan.cl

✨附录

相关推荐
2601_957787584 小时前
星链引擎矩阵系统:内容资产全生命周期管理与智能标签体系技术实践
大数据·人工智能·矩阵·内容资产管理
测试员周周4 小时前
【Appium 系列】第09节-数据驱动测试 — YAML 数据 + parametrize
服务器·数据库·人工智能·python·测试工具·语言模型·appium
周公4 小时前
记一次在双 RTX 3090 工作站上部署 vLLM 与 Qwen3.6-35B-AWQ 的实战记录
python·ai·llama·vllm·ollama
Csvn4 小时前
AI 模型调优与性能优化
人工智能
AI棒棒牛4 小时前
YOLO26最新创新改进:引入 CVPR2026 FAAFusion,普通目标检测获得方向鲁棒性,创新性强!
人工智能·目标检测·计算机视觉·rt-detr·yolo26
lpfasd1234 小时前
Trae Solo 与 Qoder Quest
ide·人工智能·cli
Kingairy4 小时前
ai生成测试用例(Skill/Harness Engineering)
人工智能·测试用例
无忧智库4 小时前
大型集团用户画像系统化标准化数字化用户主数据管理项目规划方案(159页PPT)
大数据·人工智能
头帕王子4 小时前
工业视觉检测入门工具清单2026版
人工智能·数码相机·视觉检测
AI技术控4 小时前
Prompt Engineering 在企业大模型应用中的实践:从提示词模板到可控输出
人工智能·python·深度学习·语言模型·自然语言处理·prompt