MAC-SQL 算法一

算法1是MAC-SQL框架的核心执行流程,核心逻辑是"按需简化数据库→拆解问题生成SQL→执行验证并修正错误",全程通过三个智能体协作完成,步骤清晰易懂:

一、算法核心目标

输入自然语言问题、数据库和相关知识,输出能正确执行的SQL查询,解决大数据库和复杂问题下的Text-to-SQL生成难题。

二、算法详细步骤(对应原文步骤1-16)

  1. 判断是否需要简化数据库:先检查数据库规模(比如 schema token 数是否超阈值),如果需要,调用 Selector 智能体。
  2. 数据库简化(Selector 工作):Selector 筛选出与问题相关的最小子数据库(核心表和列),去掉无关信息,避免干扰和上下文超限。
  3. 生成数据库描述:将简化后的子数据库转化为模型能理解的描述格式(包含表、列、关联关系等)。
  4. 拆解问题+生成SQL(Decomposer 工作):Decomposer 把复杂问题拆成多个简单子问题,按思维链推理生成每个子问题的 SQL,最终汇总得到初步的目标 SQL(取最后一个子 SQL 作为初始结果)。
  5. 初始化重试计数器:设置最大重试次数(避免无限循环),计数器初始为 0。
  6. 循环验证与修正(Refiner 工作) :只要计数器没到最大次数,就重复以下操作:
    • 执行初步 SQL 并分析结果:调用外部工具执行 SQL,判断是否执行成功(无语法错误、结果有效)。
    • 执行成功直接返回:如果 SQL 能正确执行且结果符合预期,直接输出该 SQL 作为最终结果。
    • 执行失败则修正:如果有错误(比如语法错、表列不存在),调用 Refiner 智能体,根据错误信息和问题、数据库描述,修正 SQL 得到新版本。
    • 计数器加 1:每次修正后计数器加 1,直到达到最大重试次数。
  7. 返回最终 SQL:无论是否成功修正,达到最大重试次数后,输出当前修正后的 SQL。

三、关键说明(帮你理解核心逻辑)

  • 三个智能体按需协作:Selector 只在数据库过大时激活,Refiner 只在 SQL 执行出错时激活,不做无用功。
  • 核心优势:通过"简化数据库→拆解问题→修正错误"三步,分别解决"大数据库干扰""复杂问题不会推理""SQL 生成有错误"三个核心痛点。
  • 流程闭环:从生成 SQL 到验证、修正,形成闭环,大幅提升 SQL 执行准确率。

结尾交付物提议

要不要我帮你整理一份算法1的可视化流程图+步骤对应智能体作用对照表,更直观地呈现每个环节的逻辑和分工?

相关推荐
woxihuan1234561 分钟前
CSS移动端实现响应式导航菜单_利用媒体查询切换显示隐藏状态
jvm·数据库·python
CCPC不拿奖不改名2 分钟前
PostgreSQL数据库部署linux服务器流程
linux·服务器·数据库·windows·python·docker·postgresql
彳亍1015 分钟前
mysql如何通过mysqldump备份视图与触发器_使用相关参数
jvm·数据库·python
重生之小比特6 分钟前
【MySQL 数据库】用户管理与权限控制
android·数据库·mysql
ZC跨境爬虫7 分钟前
跟着 MDN 学 HTML day_60:(表单与按钮技能测试实战)
服务器·前端·javascript·数据库·ui·html
秦歌66616 分钟前
Agent Skills详解
服务器·前端·数据库
Mahir0820 分钟前
Redis 分布式锁与 Redisson 深度解析:从原生实现到工业级解决方案
数据库·redis·分布式·缓存·面试
杨云龙UP20 分钟前
MySQL主库高峰期备份引发504故障:从库手动切换接管 + 主从恢复同步 + Docker版DB2重启实战_2026-05-17
linux·运维·数据库·mysql·docker·容器·centos
倔强的石头_24 分钟前
彻底告别Row-By-Row:标量子查询外连接改写与向量化引擎深潜
数据库
2301_8092445324 分钟前
如何解决宝塔面板磁盘空间占满问题_使用磁盘清理工具清理
jvm·数据库·python