在MaxKB中实现准确的Chat TO SQL(BI)

主要面向考试成绩管理系统(目前支持旭日图、仪表盘柱状图、桑基图、漏斗图、河流图、数据聚合图、散点图、南丁格尔玫瑰图、饼状图、环形图、堆叠柱状图、堆叠折线图、堆叠面积图、面积图、折线图)

主要思路:

第一步实现chat to sql,利用用户问题,生成准确的sql

第二步利用第一步sql查询到的数据,配合MaxKB内置的 <echarts_rander></echarts_rander> 标签实现图表的生成

第一部分:Chat To SQL

方案一:适合表不多的情况,比如5张表左右的级联查询

此方案的重点就是在提示词中加入DSL和DML的描述,如下:

此方案缺点也很明显:适合数据表量小的情况,还有利用大模型只生成了一次SQL,准确率不会太高。

方案二:适合多表的情况,将DSL和DML采用知识库进行存储

为了满足大量表的查询,提前准备DSL和DML的描述,并按照合理分段存入知识库中:

同时,提前准备100个(具体可按照项目实际情况准备个数)用户经常使用的准确SQL,采用QA对方式存入知识库中:

在编排中,先利用问题相似度检索用户问题涉及到的表DSL和DML,并作为提示词给大模型

方案三:最终方案,在前两个方案的基础上,引入SQL专家裁判机制,提高SQL准确率

方案3.1 SQL裁判方案

方案3.1主要先利用三个大模型生成三个SQL,然后在让第四个大模型充当裁判,选出最准确的SQL进行查询

查询效果:

方案3.2 MCP SQL 方案

MCP SQL方案相对要简单些,主要在AI会话节点接入DB MCP,然后利用提示词控制模型进行多次查询校验。

查询效果:

第二部分:SQL TO BI

第二部分的图表展示,主要利用第一步已经生成的SQL查询到数据,采用图表进行展示。核心的思路为:

1.创建图表库,包含常用的echart图表,图表内容为echart官方网站的option,并创建问题关联:

2.在编排中,基于用户的问题判断是否有图表支持,并输出图表名称

3.通过大模型输出的图表名称去知识库查询图表的option,并作为提示词给大模型

整体编排如下:

查询效果:

相关推荐
北京地铁1号线3 天前
4.2 幻觉抑制策略
大数据·人工智能·深度学习·大语言模型
中杯可乐多加冰4 天前
RAG 深度实践系列(七):从“能用”到“好用”——RAG 系统优化与效果评估
人工智能·大模型·llm·大语言模型·rag·检索增强生成
小艳加油4 天前
AI革新水文水资源:从时间序列分析、空间数据处理到水文模型优化、科学写作、优化算法与RAG微调,一站式掌握大语言模型在水文领域的深度应用
大语言模型·水文水资源·水文模型
deephub5 天前
让 AI 智能体学会自我进化:Agent Lightning 实战入门
人工智能·深度学习·大语言模型·agent
Jackson@ML5 天前
Kimi K2.5横空出世!K2.5模型功能详解
python·大语言模型·kimi
五点钟科技6 天前
Deepseek-OCR:《DeepSeek-OCR: Contexts Optical Compression》 论文要点解读
人工智能·llm·ocr·论文·大语言模型·deepseek·deepseek-ocr
deephub6 天前
用 PyTorch 实现 LLM-JEPA:不预测 token,预测嵌入
人工智能·pytorch·python·深度学习·大语言模型
yuanlulu6 天前
Agent_Skills_完全教程「AI生成」
人工智能·大语言模型·agent·智能体·skill·claude code·opencode
大熊猫侯佩8 天前
赛博深渊(上):用 Apple Foundation Models 提炼“禁忌知识”的求生指南
llm·swiftui·大语言模型·foundationmodel·apple ai·apple 人工智能·summarize
小爷毛毛(卓寿杰)8 天前
SlideFlow: AI 驱动的 PPT 自动化生成引擎
人工智能·自动化·powerpoint·大语言模型