DB-GPT:LLM应用的集大成者

整体架构

架构解读

可以看到,DB-GPT把架构抽象为7层,自下而上分别为:

运行环境:支持本地/云端&单机/分布式等部署方式。顺便一提,RAY是蚂蚁深度参与的一个开源项目,所以对RAY功能的支持应该非常完善。

训练层:由子项目DB-GPT-Hub提供。以LLM为基,包含多种数据集和微调方法的微调框架。

协议层:AWEL(智能体编排语言),专为大模型应用开发设计的智能体工作流表达语言。

模块层:SMMF(多模型管理)、RAG(检索增强生成)、Agent(智能体)。

服务层:包含LLM、API、RAG在内的多个服务部署。

应用层:数据库对话、商业数据分析、知识库对话、表格对话等。

可视化层:输出样式,包含图表、工作流、文本的格式化输出等。

功能特性

一、以RAG为核心的知识库问答

支持多文件格式、支持向量检索和稀疏检索,对海量结构化,非结构化数据做统一向量存储与检索。

二、以Chatdata为核心的数据问答

支持自然语言与Excel、数据库、数仓等多种数据源交互,分析报告,生成可视化图表。

三、统一的多模型管理服务

包括开源、API代理等几十种国内外大语言模型。

四、自动化微调框架

围绕大语言模型、Text2SQL数据集、LoRA/QLoRA/Pturning等微调方法构建的自动化微调轻量框架, 让TextSQL微调像流水线一样方便。

五、多智能体与插件

支持自定义插件执行任务,工作流自编排,原生支持Auto-GPT插件模型。

隐私安全

通过私有化大模型、代理脱敏等多种技术保障数据的隐私安全。

写在后面

万物皆可RAG

不管是知识库问答、表格问答还是数据库对话,都可以把所有数据丢进去当成知识库,以此增强模型的能力。因此,RAG的一些技巧,比如混合检索和召回重排也就可以推广到其他应用上去了。

万物皆可Agent

可以说现有的大模型应用已经离不开Agent,Agent包含的几大核心模块基本已经固定下来,剩下的工作就是如何简化Agent的工作流、自定义工作流编排、Agent执行过程可控 等,如本项目中提到的AWEL和langchain-ai的LangGraph项目。

相关推荐
不羁。。4 小时前
【撸靶笔记】第七关:GET - Dump into outfile - String
数据库·笔记·oracle
yangchanghua1115 小时前
pgsql 如何查询今天范围内的数据(当天0点0分0秒 - 当天23点59分59秒....)
数据库·pgsql
larance5 小时前
SQLAlchemy 的异步操作来批量保存对象列表
数据库·python
python_chai5 小时前
从数据汇总到高级分析,SQL 查询进阶实战(下篇)—— 分组、子查询与窗口函数全攻略
数据库·sql·mysql
在努力的前端小白6 小时前
Spring Boot 敏感词过滤组件实现:基于DFA算法的高效敏感词检测与替换
java·数据库·spring boot·文本处理·敏感词过滤·dfa算法·组件开发
未来之窗软件服务6 小时前
自建知识库,向量数据库 (九)之 量化前奏分词服务——仙盟创梦IDE
数据库·仙盟创梦ide·东方仙盟·自建ai·ai分词
冒泡的肥皂9 小时前
MVCC初学demo(一
数据库·后端·mysql
.Shu.10 小时前
Redis Reactor 模型详解【基本架构、事件循环机制、结合源码详细追踪读写请求从客户端连接到命令执行的完整流程】
数据库·redis·架构
薛晓刚13 小时前
当MySQL的int不够用了
数据库
SelectDB技术团队13 小时前
Apache Doris 在菜鸟的大规模湖仓业务场景落地实践
数据库·数据仓库·数据分析·apache doris·菜鸟技术