在MaxKB中实现准确的Chat TO SQL(BI)

主要面向考试成绩管理系统(目前支持旭日图、仪表盘柱状图、桑基图、漏斗图、河流图、数据聚合图、散点图、南丁格尔玫瑰图、饼状图、环形图、堆叠柱状图、堆叠折线图、堆叠面积图、面积图、折线图)

主要思路:

第一步实现chat to sql,利用用户问题,生成准确的sql

第二步利用第一步sql查询到的数据,配合MaxKB内置的 <echarts_rander></echarts_rander> 标签实现图表的生成

第一部分:Chat To SQL

方案一:适合表不多的情况,比如5张表左右的级联查询

此方案的重点就是在提示词中加入DSL和DML的描述,如下:

此方案缺点也很明显:适合数据表量小的情况,还有利用大模型只生成了一次SQL,准确率不会太高。

方案二:适合多表的情况,将DSL和DML采用知识库进行存储

为了满足大量表的查询,提前准备DSL和DML的描述,并按照合理分段存入知识库中:

同时,提前准备100个(具体可按照项目实际情况准备个数)用户经常使用的准确SQL,采用QA对方式存入知识库中:

在编排中,先利用问题相似度检索用户问题涉及到的表DSL和DML,并作为提示词给大模型

方案三:最终方案,在前两个方案的基础上,引入SQL专家裁判机制,提高SQL准确率

方案3.1 SQL裁判方案

方案3.1主要先利用三个大模型生成三个SQL,然后在让第四个大模型充当裁判,选出最准确的SQL进行查询

查询效果:

方案3.2 MCP SQL 方案

MCP SQL方案相对要简单些,主要在AI会话节点接入DB MCP,然后利用提示词控制模型进行多次查询校验。

查询效果:

第二部分:SQL TO BI

第二部分的图表展示,主要利用第一步已经生成的SQL查询到数据,采用图表进行展示。核心的思路为:

1.创建图表库,包含常用的echart图表,图表内容为echart官方网站的option,并创建问题关联:

2.在编排中,基于用户的问题判断是否有图表支持,并输出图表名称

3.通过大模型输出的图表名称去知识库查询图表的option,并作为提示词给大模型

整体编排如下:

查询效果:

相关推荐
deephub1 天前
REFRAG技术详解:如何通过压缩让RAG处理速度提升30倍
人工智能·python·大语言模型·rag
编程小白_正在努力中2 天前
大语言模型后训练:解锁潜能的关键路径
人工智能·大语言模型
MJJ_4 天前
Deep Dive into LLMs like ChatGPT 学习笔记
大语言模型
许泽宇的技术分享4 天前
百刀打造ChatGPT:nanochat极简LLM全栈实现深度解析
chatgpt·transformer·大语言模型·nanochat
丁学文武4 天前
大语言模型(LLM)是“预制菜”? 从应用到底层原理,在到中央厨房的深度解析
人工智能·语言模型·自然语言处理·大语言模型·大模型应用·预制菜
2401_841495648 天前
预训练基础模型简介
gpt·语言模型·自然语言处理·bert·transformer·大语言模型·预训练
神奇的代码在哪里11 天前
基于【讯飞星火 Spark Lite】轻量级大语言模型的【PySide6应用】开发与实践
人工智能·大语言模型·pyside6·讯飞星火spark·spark lite
镰刀韭菜14 天前
【AI4S】3DSMILES-GPT:基于词元化语言模型的3D分子生成
大语言模型·sas·3dsmiles-gpt·分子设计·基于序列的分子生成·基于骨架的分子生成·vina
deephub14 天前
Google开源Tunix:JAX生态的LLM微调方案来了
人工智能·深度学习·google·微调·大语言模型·jax
镰刀韭菜16 天前
【AI4S】大语言模型与化学的未来,以及整合外部工具和聊天机器人的潜力
llm·transformer·大语言模型·药物设计·分子发现·chemchat·smiles