NL2Sql

关键前提:

1、如何理解表和字段;

2、如何把自然语言转化为正确的sql:含正确的表、where条件、结果字段等。

3、复杂sql的处理:可使用预定义的提示词+sql模板。

4、支持自定义注释。

效果的影响因素:

  1. 表和列注释的丰富程度:每张表及表中的列都添加注释,会提高查询的准确率。
  2. 用户问题与表中列注释的匹配程度:用户问题中的关键词和列注释保 持一致,语义上越接近,查询效果越好。
  3. 生成的SQL语句长度:SQL语句中涉及的列越少、条件越简单,查询 会越准确。
  4. SQL语句中的逻辑复杂程度:SQL语句中涉及的高级语法越少,查询越准确。

参考

https://help.aliyun.com/zh/polardb/polardb-for-mysql/user-guide/llm-based-nl2sql 自然语言到SQL语言转义(基于大语言模型的NL2SQL)

https://www.cnblogs.com/ting1/p/18145360

https://github.com/eosphoros-ai/DB-GPT

相关推荐
GocNeverGiveUp7 分钟前
机器学习2-NumPy
人工智能·机器学习·numpy
B站计算机毕业设计超人1 小时前
计算机毕业设计PySpark+Hadoop中国城市交通分析与预测 Python交通预测 Python交通可视化 客流量预测 交通大数据 机器学习 深度学习
大数据·人工智能·爬虫·python·机器学习·课程设计·数据可视化
学术头条1 小时前
清华、智谱团队:探索 RLHF 的 scaling laws
人工智能·深度学习·算法·机器学习·语言模型·计算语言学
18号房客1 小时前
一个简单的机器学习实战例程,使用Scikit-Learn库来完成一个常见的分类任务——**鸢尾花数据集(Iris Dataset)**的分类
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·sklearn
feifeikon1 小时前
机器学习DAY3 : 线性回归与最小二乘法与sklearn实现 (线性回归完)
人工智能·机器学习·线性回归
游客5201 小时前
opencv中的常用的100个API
图像处理·人工智能·python·opencv·计算机视觉
古希腊掌管学习的神1 小时前
[机器学习]sklearn入门指南(2)
人工智能·机器学习·sklearn
凡人的AI工具箱2 小时前
每天40分玩转Django:Django国际化
数据库·人工智能·后端·python·django·sqlite
咸鱼桨2 小时前
《庐山派从入门到...》PWM板载蜂鸣器
人工智能·windows·python·k230·庐山派
强哥之神2 小时前
Nexa AI发布OmniAudio-2.6B:一款快速的音频语言模型,专为边缘部署设计
人工智能·深度学习·机器学习·语言模型·自然语言处理·音视频·openai