Text2sql的一些技巧

最近看到了一篇关于text2sql的文章,以及一些论文。对使用模型做text2sql给了一些不错的建议。

参考文章:24年大模型潜力方向:大浪淘沙后的Text-to-SQL和Agent - 知乎

论文:https://arxiv.org/pdf/2403.09732.pdf

关于模型的建议

模型的温度为0,减少text2sql的幻觉问题。

多个模型一起使用,使用交叉一致性,不要过于依赖一个模型。

构建prompt的建议

表中字段取值问题,例如性别这个字段,有的表可能存"男"和"女",有的表可能存 "M"和"F",甚至有的表会存"0"和"1"。所以对于有枚举值的字段来说,最好能够列出来示例字段。数据表和样例数据(随机取三行数据)

text2sql中,few-shot非常有用。应该生成一些常见的sql示例。这些案例在prompt中应该是动态选择的(针对不同的表)。关于生成常见的sql,可以考虑使用模型,来生成一些sql示例。

few-shot 示例

告诉模型,我们的表字段,并给出了一些示例数据以及表的外键

给模型的few-shot 对生成正确的sql的影响非常大。论文中提到的是动态的选择样例,

根据问题相似相匹配,用问题,召回几个相似的文本(这里需要提前根据表生成一些案例)。

相关推荐
算法打盹中15 天前
基于大型语言模型的自然语言到 SQL 转换研究综述:我们身处何处,又将前往何方?
人工智能·sql·语言模型·text2sql·nl2sql
许泽宇的技术分享19 天前
当自然语言遇上数据库:Text2Sql.Net的MCP革命如何重新定义开发者与数据的交互方式
数据库·.net·text2sql·mcp
AwhiteV25 天前
利用图数据库高效解决 Text2sql 任务中表结构复杂时占用过多大模型上下文的问题
数据库·人工智能·自然语言处理·oracle·大模型·text2sql
柠石榴3 个月前
【论文阅读笔记】Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation
论文阅读·提示工程·text2sql·llms·dail-sql
dudly4 个月前
Text-to-SQL评估体系:从Spider 1.0数据集到2.0框架的跨越与革新
人工智能·sql·nlp·text2sql
小胡说人工智能4 个月前
深度剖析:Dify+Sanic+Vue+ECharts 搭建 Text2SQL 项目 sanic-web 的 Debug 实战
人工智能·python·llm·text2sql·dify·vllm·ollama
OceanBase数据库官方博客6 个月前
自然语言秒转SQL—— 免费体验 OB Cloud Text2SQL 数据查询
数据库·sql·ai·oceanbase·分布式数据库·向量·text2sql
正在走向自律8 个月前
Text2Sql:开启自然语言与数据库交互新时代(30/30)
数据库·人工智能·oracle·text2sql·ai智能体
大模型之路8 个月前
Table-Augmented Generation(TAG):Text2SQL与RAG的升级与超越
llm·tag·text2sql·rag·检索增强生成
Hello_WOAIAI9 个月前
大模型时代的NL2SQL初探
自然语言处理·text2sql·nl2sql