Text2sql的一些技巧

最近看到了一篇关于text2sql的文章,以及一些论文。对使用模型做text2sql给了一些不错的建议。

参考文章:24年大模型潜力方向:大浪淘沙后的Text-to-SQL和Agent - 知乎

论文:https://arxiv.org/pdf/2403.09732.pdf

关于模型的建议

模型的温度为0,减少text2sql的幻觉问题。

多个模型一起使用,使用交叉一致性,不要过于依赖一个模型。

构建prompt的建议

表中字段取值问题,例如性别这个字段,有的表可能存"男"和"女",有的表可能存 "M"和"F",甚至有的表会存"0"和"1"。所以对于有枚举值的字段来说,最好能够列出来示例字段。数据表和样例数据(随机取三行数据)

text2sql中,few-shot非常有用。应该生成一些常见的sql示例。这些案例在prompt中应该是动态选择的(针对不同的表)。关于生成常见的sql,可以考虑使用模型,来生成一些sql示例。

few-shot 示例

告诉模型,我们的表字段,并给出了一些示例数据以及表的外键

给模型的few-shot 对生成正确的sql的影响非常大。论文中提到的是动态的选择样例,

根据问题相似相匹配,用问题,召回几个相似的文本(这里需要提前根据表生成一些案例)。

相关推荐
engchina4 天前
自然语言转 SQL 并不是“魔法”
数据库·人工智能·sql·text2sql·nl2sql·自然语言转sql
韦东东16 天前
Text2SQL案例演示:信贷风控策略场景(Coze工作流版)
大数据·人工智能·大模型·text2sql·coze·信贷策略
smilejingwei2 个月前
Text2SQL 破局技术解析之三:NLQ 词典与准确性
人工智能·text2sql·bi·spl
smilejingwei2 个月前
Text2SQL 破局技术解析之二:MQL 实现与复杂性
ai·text2sql·spl·chatbi
core5122 个月前
不借助框架实现Text2SQL
sql·mysql·ai·大模型·qwen·text2sql
沛沛老爹2 个月前
基于LangChain SQL Agent与自研LLM+Prompt方案的技术原理、实现路径与落地实践
sql·ai·langchain·prompt·agent·text2sql
沛沛老爹2 个月前
Text2SQL:让自助式数据报表开发从“技术门槛”走向“人人可用”
人工智能·text2sql·rag +·ai入门知识
core5122 个月前
LangChain实现Text2SQL
langchain·大模型·qwen·text2sql
TGITCIC3 个月前
第1课-通过DIFY实现一个完整的Text2Sql来讲AI原生及Agentic RAG长什么样
text2sql·dify·ai-native·chatbi·rag增强检索·agentic rag
chenchihwen3 个月前
AI代码开发宝库系列:Text2SQL深度解析基于LangChain构建
人工智能·python·langchain·text2sql·rag