【Text2SQL】当前在BIRD基准测试集上取得SOTA的论文

论文《The Death of Schema Linking? Text-to-SQL in the Age of Well-Reasoned Language Models》探讨了在大型语言模型(LLMs)时代,文本到SQL(Text-to-SQL)转换中模式链接(Schema Linking)的作用和重要性。论文没有提出其他新的方法,而是提出了一个观点,即随着语言模型的发展,模式链接在文本到SQL任务中的重要性可能会降低,尤其是在模型的上下文窗口足够大以容纳整个模式时。作者通过3个实验验证了这一观点,并提出了一种不依赖模式链接的文本到SQL管道,该管道在准确性上取得了优异的成绩,在BIRD基准测试中排名第一,准确率达到71.83%。

摘要

目的 :模式链接是文本到SQL流程中的关键步骤,目的是检索目标数据库的表格和列,同时忽略不相关的部分。
问题 :不完美的模式链接可能会排除生成准确查询所需的列。
研究发现 :使用最新的大型语言模型时,即使存在大量不相关的模式元素,新模型也能在生成过程中利用相关的模式元素。
方法 :作者提出了一种完全省去模式链接的文本到SQL管道,以最小化过滤所需模式元素的问题。
结果:该方法在BIRD基准测试中排名第一,准确率达到71.83%。

实验

实验设计

实验1 :评估了不相关模式元素的包含对SQL生成的影响。作者创建了一个完美模式链接召回的场景,以确保SQL生成问题不是由于缺少所需列造成的。
实验2 :评估了实际模式链接技术对所需列的召回率的影响,以及召回率不完美对生成的下游影响。
实验3 :评估了在简化管道中加入增强、选择和校正技术对SQL生成准确性的影响。
实验3的方法:

1.增强(Augmentation):通过扩展列描述、添加查询提示和使用链式思考(Chain-of-Thought, CoT)规划来增加上下文信息。

2.校正(Correction):生成候选SQL查询后,基于数据库执行错误、数据库管理员指令和模型反馈进行迭代更正。

3.选择(Selection):使用自洽性(self-consistency)生成多个响应,并选择最一致的结果。

实验细节

实验设置 :所有实验中的温度都设置为零,并且尽可能使用结构化输出。
微调GPT-4o :迭代进行微调。在每次迭代中,首先在N个三元组样本上进行微调:自然语言查询、SQL查询和模式元素。然后,在BIRD的开发集上进行评估。
生成提示 :图2显示了用于SQL生成的提示结构以及示例模式、输入查询和查询提示。

实验结果

实验1 :发现随着假阳性率的降低,理想化执行准确性(IEX)提高,即包含不相关信息的列越少,SQL生成的准确性越高。
实验2 :发现随着模型的SQL生成能力提高,模式链接的好处减少。在某些情况下,由于缺少生成所需的列,模式链接甚至可能导致准确性的净降低。
实验3:发现增强、选择和校正技术对生成准确性有显著的正面影响,而模式链接则没有。

相关推荐
ibrahim2 小时前
Llama 3.2 900亿参数视觉多模态大模型本地部署及案例展示
ai·大模型·llama·提示词
AIGCmagic社区4 小时前
AI多模态技术介绍:理解多模态大语言模型的原理
人工智能·语言模型·自然语言处理
吕小明么4 小时前
OpenAI o3 “震撼” 发布后回归技术本身的审视与进一步思考
人工智能·深度学习·算法·aigc·agi
算力魔方AIPC5 小时前
Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑
人工智能·llama
开放知识图谱7 小时前
论文浅尝 | HippoRAG:神经生物学启发的大语言模型的长期记忆(Neurips2024)
人工智能·语言模型·自然语言处理
聆思科技AI芯片12 小时前
实操给桌面机器人加上超拟人音色
人工智能·机器人·大模型·aigc·多模态·智能音箱·语音交互
minos.cpp13 小时前
Mac上Stable Diffusion的环境搭建(还算比较简单)
macos·ai作画·stable diffusion·aigc
i查拉图斯特拉如是13 小时前
基于MindSpore NLP的PEFT微调
人工智能·自然语言处理
AI小欧同学20 小时前
【AIGC-ChatGPT进阶副业提示词】育儿锦囊:化解日常育儿难题的实用指南
chatgpt·aigc
剑盾云安全专家1 天前
AI加持,如何让PPT像开挂一键生成?
人工智能·aigc·powerpoint·软件