DB-GPT 0.7.5 版本更新:基于 Falcon 评测集的Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

V0.7.5 版本主要新增、增强了以下核心特性

🍀基于 Falcon 评测集的 Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

🍀优化 Falcon 评测集的加载和支持动态多环境的问题集

🍀 新增 Neo4j 图数据库支持

🍀 支持Elasticsearch的全文检索

🍀新增 指标检索Agent 波动分析Agent增强数据分析能力

🍀新增 WebSerachAgent处理联网搜索场景

✨新特性

1.基于 Falcon 评测集的Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

a.支持 端到端评测LLM在Falcon评测集基准

b.支持评测自定义Agent在Falcon评测集准确率、可执行率

详细的使用文档见:

2.优化 Falcon 评测集的加载和支持动态多环境的问题集

  • Falcon评测集加载优化为运行时动态加载,且从Falcon仓库动态拉取最新问题集
  • 拆分为DEV/TEST多环境问题集,按需评测

3.新增 Neo4j 图数据库支持

扩展Neo4j 数据库,进一步提升 RAG在复杂知识关系处理上的能力

4.支持Elasticsearch的全文检索

在ES支持向量检索的基础上,新增全文检索能力,提升RAG的检索召回能力

5.DB-GPT新增 指标检索Agent**、** 波动分析Agent**、** WebSearchAgent****等Agent

🐞 Bug 修复

  • 修复benchmark结果对比中布尔值和空值结果比较问题 (#2967)
  • 修复Graph知识图谱文档加载错误问题 (#2966)
  • 修复知识图谱的参数丢失问题 (#2926)
  • 修复通过环境变量配置数据源时的错误 (#2924)
  • 修复Milvus向量数据库在工作流中使用错误 (#2933)
  • 解决 AWEL 工作流多窗口问题和应用信息丢失 (#2944)

🛠️其他

  • 更新文档中的一些书写错误 (#2964)
  • 调整benchmark问题集文件 (#2940)

✨官方文档地址

英文:

http://docs.dbgpt.site/docs/overview

中文:

https://www.yuque.com/eosphoros/dbgpt-docs/bex30nsv60ru0fmx

✨致谢

🎉新贡献者

V0.7.5 版本新增 5 位 新的贡献者:

  • @Hikomorebi
  • @ZhikunZheng
  • @lusains
  • @zhangyj21-lh
  • @ymx10086

🔥🔥感谢所有贡献者使这次发布成为可能!

@Aries-ckt , @Hikomorebi , @ZhikunZheng , @chenliang15405 , @dusx1981 , @huhao0926 , @liuhill , @lusains , @yaoyifan-yyf , @ymx10086 , @zhangyj21-lh and alan.cl

✨附录

相关推荐
疯狂成瘾者16 分钟前
上传到 GitHub 的步骤总结
大数据·elasticsearch·github
A尘埃16 分钟前
神经网络的激活函数+损失函数
人工智能·深度学习·神经网络·激活函数
没有不重的名么33 分钟前
Pytorch深度学习快速入门教程
人工智能·pytorch·深度学习
有为少年44 分钟前
告别“唯语料论”:用合成抽象数据为大模型开智
人工智能·深度学习·神经网络·算法·机器学习·大模型·预训练
AI医影跨模态组学1 小时前
J Transl Med(IF=7.5)苏州大学附属第一医院秦颂兵教授等团队:基于机器学习影像组学的食管鳞癌预后评估列线图
人工智能·深度学习·机器学习·ct·医学·医学影像
比昨天多敲两行1 小时前
C++ 二叉搜索树
开发语言·c++·算法
Season4501 小时前
C++11之正则表达式使用指南--[正则表达式介绍]|[regex的常用函数等介绍]
c++·算法·正则表达式
面汤放盐1 小时前
AI Agent 是什么,如何理解它,未来挑战和思考
人工智能
Tisfy1 小时前
LeetCode 2839.判断通过操作能否让字符串相等 I:if-else(两两判断)
算法·leetcode·字符串·题解
问好眼1 小时前
《算法竞赛进阶指南》0x04 二分-1.最佳牛围栏
数据结构·c++·算法·二分·信息学奥赛