自然语言转 SQL 并不是“魔法”

------为什么要满足业务需求，必须进行定制化开发

随着生成式 AI 的快速发展，"自然语言直接生成 SQL"正在成为一个被频繁提及的话题。

看起来，只要把数据库表结构交给 AI，就能让业务人员用一句话查数据，似乎一切都会变得很简单。

但在真实的业务系统中，这种想法几乎一定会失败。

本文将结合传统业务系统的开发流程，说明一个核心结论：

自然语言 → SQL 并不是一个"即插即用"的 AI 能力，而是一项必须结合业务进行定制化开发的系统工程。

一个常见误解：有表结构，就能生成 SQL？

很多人对 Text-to-SQL 的第一反应是：

数据库表已经设计好了
表名、字段名都清楚
那自然语言生成 SQL 不就是把字段拼起来吗？

这个认知，其实和下面的想法非常类似：

"既然有了表结构，程序员应该就能直接写完业务功能吧？"

而现实中的系统开发，从来不是这样。

回顾一次正常的业务系统开发流程

假设你要让程序员实现一个业务功能，你会只给他表定义文档吗？

几乎不会。

一个正常的业务系统开发，通常至少需要：

需求说明 / 业务说明
功能列表 & 功能概要
功能详细设计说明书
画面流程图 / 画面迁移图
画面项定义书
代码定义书 / 业务规则说明
表定义书
异常场景与边界条件说明

原因很简单：

业务逻辑从来不写在表定义里。

表定义描述的是"数据结构"，不是"业务含义"

表定义只能说明：

有哪些表
有哪些字段
字段类型是什么

但程序员真正需要实现的是：

这个功能用哪张表
什么情况下取哪条数据
数据是否需要过滤、汇总、分组
某些状态是否要排除
不同场景下规则是否不同

这些内容，只存在于业务设计文档中。

自然语言 → SQL，本质上是同一件事

现在把视角切回自然语言转 SQL。

用户的一句话需求

"我想看看本月各部门的在职人数"

这句话并不能直接生成 SQL。

因为这里至少存在这些问题：

"在职"如何定义？
使用哪一张部门表？
是否包含即将离职人员？
统计口径是月初还是月末？
是人事模块的数据，还是组织模块的数据？

如果这些规则没有被提前定义，那么：

AI 每次生成的 SQL 可能都不一样
看似"正确"的 SQL，业务上却是错的

Text-to-SQL = 业务模型的实现

因此，自然语言转 SQL 并不是一个"语法问题"，而是：

把自然语言映射到业务功能、业务规则和数据模型上的过程

本质上等同于：

先定义业务模型
再把这个模型"翻译"为 SQL

这和让程序员写业务代码，并没有本质区别。

为什么一定需要定制化开发？

通用 AI 可以做到的事情是：

理解 SQL 语法
理解表和字段之间的结构关系

但它无法凭空知道：

你们公司里"在职"的准确定义
某个功能必须使用哪几张表
哪些查询是允许的，哪些是不允许的
不同业务模块的查询边界在哪里

因此，要想真正"可用"，必须额外提供：

业务术语与字段的映射关系
功能级别的查询规则
业务口径的统一定义
查询模板或约束规则

这些全部都属于 定制化设计与开发工作。

这不是替代开发，而是换一种形式的开发

生成式 AI 并没有让设计消失，而是让设计：

从"代码里"
转移到了"规则、约束和上下文"中

就像：

你不会只给程序员一份表定义，就要求他实现完整业务系统

同样地：

你也不能只给 AI 一份表结构，就要求它正确理解所有业务查询

总结

自然语言转 SQL 是一项非常有潜力的技术，但它：

不是万能功能
不是零成本接入
更不是"跳过设计"的捷径

它的成功，高度依赖于业务理解、系统设计和定制化开发能力。

在这一点上，AI 并没有改变软件工程的本质，

反而让"业务建模"和"设计质量"变得更加重要。