DB-GPT 0.7.5 版本更新:基于 Falcon 评测集的Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

V0.7.5 版本主要新增、增强了以下核心特性

🍀基于 Falcon 评测集的 Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

🍀优化 Falcon 评测集的加载和支持动态多环境的问题集

🍀 新增 Neo4j 图数据库支持

🍀 支持Elasticsearch的全文检索

🍀新增 指标检索Agent 波动分析Agent增强数据分析能力

🍀新增 WebSerachAgent处理联网搜索场景

✨新特性

1.基于 Falcon 评测集的Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

a.支持 端到端评测LLM在Falcon评测集基准

b.支持评测自定义Agent在Falcon评测集准确率、可执行率

详细的使用文档见:

2.优化 Falcon 评测集的加载和支持动态多环境的问题集

  • Falcon评测集加载优化为运行时动态加载,且从Falcon仓库动态拉取最新问题集
  • 拆分为DEV/TEST多环境问题集,按需评测

3.新增 Neo4j 图数据库支持

扩展Neo4j 数据库,进一步提升 RAG在复杂知识关系处理上的能力

4.支持Elasticsearch的全文检索

在ES支持向量检索的基础上,新增全文检索能力,提升RAG的检索召回能力

5.DB-GPT新增 指标检索Agent**、** 波动分析Agent**、** WebSearchAgent****等Agent

🐞 Bug 修复

  • 修复benchmark结果对比中布尔值和空值结果比较问题 (#2967)
  • 修复Graph知识图谱文档加载错误问题 (#2966)
  • 修复知识图谱的参数丢失问题 (#2926)
  • 修复通过环境变量配置数据源时的错误 (#2924)
  • 修复Milvus向量数据库在工作流中使用错误 (#2933)
  • 解决 AWEL 工作流多窗口问题和应用信息丢失 (#2944)

🛠️其他

  • 更新文档中的一些书写错误 (#2964)
  • 调整benchmark问题集文件 (#2940)

✨官方文档地址

英文:

http://docs.dbgpt.site/docs/overview

中文:

https://www.yuque.com/eosphoros/dbgpt-docs/bex30nsv60ru0fmx

✨致谢

🎉新贡献者

V0.7.5 版本新增 5 位 新的贡献者:

  • @Hikomorebi
  • @ZhikunZheng
  • @lusains
  • @zhangyj21-lh
  • @ymx10086

🔥🔥感谢所有贡献者使这次发布成为可能!

@Aries-ckt , @Hikomorebi , @ZhikunZheng , @chenliang15405 , @dusx1981 , @huhao0926 , @liuhill , @lusains , @yaoyifan-yyf , @ymx10086 , @zhangyj21-lh and alan.cl

✨附录

相关推荐
小兵张健2 小时前
35岁程序员的春天来了
人工智能
大怪v3 小时前
AI抢饭?前端佬:我要验牌!
前端·人工智能·程序员
冬奇Lab3 小时前
OpenClaw 深度解析(六):节点、Canvas 与子 Agent
人工智能·开源
测试蔡坨坨3 小时前
OpenClaw 快速上手教程:用手机远程指挥电脑,打造你的 24 小时 AI 管家!
ai
刀法如飞4 小时前
AI提示词框架深度对比分析
人工智能·ai编程
归去_来兮4 小时前
拉格朗日插值算法原理及简单示例
算法·数据分析·拉格朗日插值
方方不听话5 小时前
🦞 重磅!腾讯 QQ 官方接入 OpenClaw“小龙虾”:一键创建机器人,1分钟极速部署!
ai·openclaw·小龙虾
IT_陈寒6 小时前
Python开发者必知的5大性能陷阱:90%的人都踩过的坑!
前端·人工智能·后端
1G6 小时前
openclaw控制浏览器/自动化的playwright MCP + Mcporter方案实现
人工智能
踩着两条虫6 小时前
VTJ.PRO 双向代码转换原理揭秘
前端·vue.js·人工智能