论文笔记:SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data

导语

本文提出了SQLPrompt,通过创新的Prompt设计、基于执行一致性的解码策略,以及混合不同格式的Prompt和不同LLMs输出的方式,提高了LLM在Few-shot In-context Learning下的能力。

1 简介

这项研究介绍了"SQLPrompt",一种针对大型语言模型(LLMs)中的Text-to-SQL任务进行少标签数据下的上下文提示的方法。SQLPrompt通过创新的提示设计、基于执行一致性的解码策略(选择最一致的执行结果SQL),以及"MixPrompt"和"MixLLMs"方法(增加不同提示设计和基础模型中SQL提议的多样性)来提高少示例提示的能力。结果表明,SQLPrompt在少标签数据的上下文学习中表现优异,与使用数千标签数据进行微调的最新技术相比,缩小了差距。

2 方法

作者实际上提出了4个小的模块,构成了SQLPrompt,分别为:

  • Prompt设计:Prompt中包括数据库schema、主/外键和数据库内容。本文给出了两种不同的Prompt格式,分别为
    • Concise promptsTable1 name: column name 1, column name 2 (relevant database content) | Table2 name: column1 ...
    • Verbose promptsTable "CarNames" contains three columns. The column names and their types are : MakeID (number), Model (string) ..."; "Foreign keys are ... Use foreign keys to join Tables
  • Execution-based consistency decoding:基于执行一致性的解码策略实际上就是对LLM进行多次采样生成,然后对生成的SQL语句进行执行,选择执行结果最一致的那个SQL;
  • MixPrompt:将不同的Prompt格式进行混合作为Few-shot的示例;
  • MixLLMs:将输入分别输入给不同的LLM进行生成采样;

从作者给出的这个流程图中可以很清楚的看到这4个模块。

3 实验

  • 任务和数据集:考虑Spider跨领域大规模Text-to-SQL基准测试。
  • 模型:包括不同版本的PaLM和FLAN模型。
  • 微调模型:包括PICARD、RASAT和RESDSQL等。
  • 上下文学习模型:包括对CodeX、GPT-3和ChatGPT的评估。

4 结果

  • 性能比较:SQLPrompt在上下文学习和微调方法中表现优异,特别是在执行准确度(EX)和测试准确度(TS)方面。
  • 消融研究 :研究了SQLPrompt的多个组件各自对于最终结果的影响,包括
    • 提示设计、
    • 基于执行的一致性解码、
    • MixPrompt和
    • MixLLMs。

从表格2-5可以看到,作者提出的这四个模块都对最终的SQLPrompt方法有提升。

5 结论

SQLPrompt通过创新的提示设计和一致性解码策略,显著提高了Text-to-SQL任务的性能。其在处理少量标签数据时的能力尤其突出,为Text-to-SQL领域提供了一个有力的新工具。

相关推荐
2501_944934731 小时前
大专大数据管理与应用专业,怎么自学数据治理相关知识?
人工智能
芷栀夏1 小时前
CANN ops-math:从矩阵运算到数值计算的全维度硬件适配与效率提升实践
人工智能·神经网络·线性代数·矩阵·cann
肾透侧视攻城狮1 小时前
《Transformer模型PyTorch实现全攻略:架构拆解、代码示例与优化技巧》
深度学习·transformer·构建transformer模型·定义多头注意力模块·定义位置前馈网络·构建解/编码器模块·训练transformer模型
Yuer20251 小时前
为什么说在真正的合规体系里,“智能”是最不重要的指标之一。
人工智能·edca os·可控ai
一切尽在,你来1 小时前
1.4 LangChain 1.2.7 核心架构概览
人工智能·langchain·ai编程
爱吃大芒果2 小时前
CANN ops-nn 算子开发指南:NPU 端神经网络计算加速实战
人工智能·深度学习·神经网络
聆风吟º2 小时前
CANN ops-nn 实战指南:异构计算场景中神经网络算子的调用、调优与扩展技巧
人工智能·深度学习·神经网络·cann
2601_949593652 小时前
CANN加速人脸检测推理:多尺度特征金字塔与锚框优化
人工智能
小刘的大模型笔记2 小时前
大模型LoRA微调全实战:普通电脑落地,附避坑手册
人工智能·电脑
乾元2 小时前
身份与访问:行为生物识别(按键习惯、移动轨迹)的 AI 建模
运维·网络·人工智能·深度学习·安全·自动化·安全架构