如何利用约束提示优化LLM在问题转sql的一致性

LLM将用户问题转化为sql时,会面临多次运行生成sql不一致的问题。

LLM将问题转化为sql需要在精确性和有效性间做权衡,LLM每次运行都有可能做出不同的选择。

这里借鉴one-shot learning思路,采用约束提示的方式,尝试解决sql生成不一致的问题。

1 转化问题示例

1.1 应用场景

这里选择chinook数据集。chinook-database是一种应用于教学目的的关系型数据集,包含了音乐、艺术家、专辑等信息。chinook适用于sqlite3、mysql、oracle,可通过运行一个完整的sql脚本建立数据库。

1.2 转化模版

将问题转化为sql的prompt模版如下所示。

你是一位项目信息管理员,请将以下用户问题转化为sql查询。

要求:

1 如果涉及到文本匹配,采用模糊查找的方式

2 数据库表的相关信息来show create table table_name。

3 如果一条sql不能回答问题,可以采用多条sql实现

4 请用一条sql实现。

输出示例如下

```sql

SELECT COUNT(*) AS TotalArtists FROM Artist;

```

以下是用户问题:

{question}

以下是数据库项目相关表的信息:

{table_infos}

"""

1.3 问题展示

档查询问题是"公司总经理和董事"时,多次运行可能会生成如下结果。

对于这三个case,LLM均抓主要查询要点,差异主要体现在select目标、查询条件。

case1:

sql: SELECT EmployeeId, FirstName, LastName, Title

FROM Employee

WHERE Title LIKE '%Manager%' OR Title LIKE '%Director%';

'EmployeeId', 'FirstName', 'LastName', 'Title'

(1, 'Andrew', 'Adams', 'General Manager')

(2, 'Nancy', 'Edwards', 'Sales Manager')

(6, 'Michael', 'Mitchell', 'IT Manager')

case2:

SELECT * FROM Employee

WHERE Title LIKE '%General Manager%' OR Title LIKE '%Director%';

'EmployeeId', 'LastName', 'FirstName', 'Title', 'ReportsTo', 'BirthDate', 'HireDate', 'Address', 'City', 'State', 'Country', 'PostalCode', 'Phone', 'Fax', 'Email'

(1, 'Adams', 'Andrew', 'General Manager', None, datetime.datetime(1962, 2, 18, 0, 0), datetime.datetime(2002, 8, 14, 0, 0), '11120 Jasper Ave NW', 'Edmonton', 'AB', 'Canada', 'T5K 2N1', '+1 (780) 428-9482', '+1 (780) 428-3457', 'andrew@chinookcorp.com')

case3:

sql: SELECT EmployeeId, FirstName, LastName, Title

FROM Employee

WHERE Title LIKE '%General Manager%' OR Title LIKE '%Director%';

'EmployeeId', 'FirstName', 'LastName', 'Title'

(1, 'Andrew', 'Adams', 'General Manager')

2 转化约束示例

2.1 约束模版

在以上prompt模版的基础上,增加sql生成约束,示例如下所示。

你是一位项目信息管理员,请将以下用户问题转化为sql查询。

要求:

1 如果涉及到文本匹配,采用模糊查找的方式

2 数据库表的相关信息来show create table table_name。

3 如果一条sql不能回答问题,可以采用多条sql实现

4 请用一条sql实现。

sql生成注意事项:
1 针对人物搜索类,输出id、名字、职位title即可
2 总经理title对应General Manager

输出示例如下

```sql

SELECT COUNT(*) AS TotalArtists FROM Artist;

```

以下是用户问题:

{question}

以下是数据库项目相关表的信息:

{table_infos}

2.2 约束示例

然后重新运行多次sql生成,示例如下所示。

可以看出,除字段拼接有些差异外,sql输出基本上就很稳定了。

case1:

sql: SELECT

EmployeeId AS id,

CONCAT(FirstName, ' ', LastName) AS name,

Title AS title

FROM Employee

WHERE

Title = 'General Manager'

OR Title LIKE '%Director%';

'id', 'name', 'title'

(1, 'Andrew Adams', 'General Manager')

case2:

sql: SELECT

EmployeeId AS id,

CONCAT(FirstName, ' ', LastName) AS name,

Title AS title

FROM Employee

WHERE

Title LIKE '%General Manager%'

OR Title LIKE '%Director%';

'id', 'name', 'title'

(1, 'Andrew Adams', 'General Manager')

case3:

sql: SELECT EmployeeId AS id, FirstName, LastName, Title

FROM Employee

WHERE Title LIKE '%General Manager%' OR Title LIKE '%Director%';

'id', 'FirstName', 'LastName', 'Title'

(1, 'Andrew', 'Adams', 'General Manager')

reference


关系型数据库数据集 - northwind & chinook

https://blog.csdn.net/liliang199/article/details/153821509

langchain agent将用户问题转sql并运行sql查询

https://blog.csdn.net/liliang199/article/details/154007162

langchain将用户问题转sql查询探索

https://blog.csdn.net/liliang199/article/details/153839198

相关推荐
清水白石00826 分钟前
解构异步编程的两种哲学:从 asyncio 到 Trio,理解 Nursery 的魔力
运维·服务器·数据库·python
资生算法程序员_畅想家_剑魔28 分钟前
Mysql常见报错解决分享-01-Invalid escape character in string.
数据库·mysql
PyHaVolask1 小时前
SQL注入漏洞原理
数据库·sql
ptc学习者1 小时前
黑格尔时代后崩解的辩证法
数据库
代码游侠1 小时前
应用——智能配电箱监控系统
linux·服务器·数据库·笔记·算法·sqlite
!chen1 小时前
EF Core自定义映射PostgreSQL原生函数
数据库·postgresql
霖霖总总2 小时前
[小技巧14]MySQL 8.0 系统变量设置全解析:SET GLOBAL、SET PERSIST 与 SET PERSIST_ONLY 的区别与应用
数据库·mysql
马克学长2 小时前
SSM校园食堂订餐系统531p9(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·ssm 框架·ssm 校园食堂订餐系统
alonewolf_992 小时前
深入剖析MySQL索引底层:B+树、联合索引与跳跃扫描原理全解
数据库·b树·mysql
oMcLin2 小时前
如何在 AlmaLinux 9 上配置并优化 Redis 集群,支持高并发的实时数据缓存与快速查询?
数据库·redis·缓存