在传统软件开发中,数据库查询通常依赖 SQL------一门专业且严谨的查询语言。但在 AIGC(AI Generated Content)时代,我们终于可以用"自然语言"来操控数据,而不是死磕 SQL 语法。
尤其是在前后端快速迭代的今天,通过 LLM(大语言模型)生成 SQL,不但可以减少大量重复性工作,还能帮助初学者和非技术人员也能轻松操作数据库。
本文将以 SQLite + Python + DeepSeek Reasoner 为例,从以下几个角度展开:
- 为什么 SQLite 是本地项目的绝佳数据库选择
- 如何用 Python 创建与操作 SQLite
- 如何让大模型自动生成 SQL 查询
- 什么是 SQL Prompt Engineering(提示词工程)
1. SQLite:轻巧但强大的关系型数据库
SQLite 是一个嵌入式关系数据库,尤其适用于:
- 本地存储(如桌面应用、小游戏、工具类软件)
- 移动端(微信小程序和 APP 都大量使用 SQLite)
- 无需部署数据库服务的场景
- 轻量级原型项目
相比 MySQL 或 PostgreSQL,它没有独立进程,不需要服务启动,直接读写一个 .db 文件。
一句话总结:
SQLite 是"使用成本几乎为零"的本地关系数据库,非常适合 AIGC + 本地工具的组合。
2. Python 操作 SQLite:简单到极致
先创建一个 test2.db 数据库,并插入一些员工信息:
python
import sqlite3
conn = sqlite3.connect("test2.db"
cursor = conn.cursor()
cursor.execute("""
CREATE TABLE IF NOT EXISTS employees(
id INTEGER PRIMARY KEY,
name TEXT,
department TEXT,
salary INTEGER
)
""")
sample_data = [
(6, "张三", "开发部", 32000),
(7, "李四", "销售部", 20000),
(8, "王五", "开发部", 33000),
(9, "钱六", "销售部", 15000)
]
cursor.executemany('INSERT INTO employees VALUES(?, ?, ?, ?)', sample_data)
conn.commit()
这里用到的两个核心对象:
conn 数据库连接
负责和数据库建立连接,所有操作都必须依赖它。
cursor 游标
负责执行 SQL,如:
python
cursor.execute("SELECT * FROM employees")
3. 自动生成 SQL:让 AI 来写查询语句
AIGC 的能力开始发挥作用。
在实际开发中,SQL 语句常常又长又复杂。现在我们可以让大语言模型自动生成 SQL,只需要自然语言描述即可:
例如:
"开发部员工的姓名和工资是多少?"
我们需要给模型上下文,也就是数据库结构(schema)。
下面的代码用 PRAGMA 获取 SQLite 表结构:
python
schema = cursor.execute("PRAGMA table_info(employees)").fetchall()
schema_str = "CREATE TABLE EMPLOYEES (\n" + "\n".join(
[f"{col[1]} {col[2]}" for col in schema]
) + "\n)"
print(schema_str)
生成类似结构:
text
CREATE TABLE EMPLOYEES (
id INTEGER
name TEXT
department TEXT
salary INTEGER
)
4. SQL Prompt Engineering:最关键的一环
要让 AI 写出正确 SQL,最重要的不是模型,而是 Prompt(提示词)
一个好的 SQL Prompt 必须包含三要素:
1)数据库结构(schema)
告诉模型有哪些字段、类型是什么。
2)用户请求(自然语言查询)
如 "开发部员工姓名和工资是多少?"
3)严格的输出要求
避免出现解释、格式、注释等内容。
例如:
python
from openai import OpenAI
client = OpenAI(
api_key='YOU_API_KEY',
base_url='https://api.deepseek.com/v1'
)
def ask_deepseek(query, schema):
prompt = f"""
这是一个数据库的Schema:
{schema}
根据这个Schema,你能输出一个SQL查询来回答以下问题吗?
只输出SQL查询,不要输出任何其他内容,也不要带任何格式。
问题:{query}
"""
response = client.chat.completions.create(
model="deepseek-reasoner",
max_tokens=2048,
messages=[
{
"role":"user",
"content":prompt
}
]
)
return response.choices[0].message.content
最终调用:
python
question = "开发部部门员工的姓名和工资是多少?"
sql = ask_deepseek(question, schema_str)
print(sql)
模型可能返回:
js
SELECT name, salary FROM employees WHERE department='开发部';
5. 为什么 AIGC + SQL 是未来趋势?
传统 SQL 开发存在几个痛点:
- 字段名复杂易记错
- JOIN / GROUP / HAVING 很难写正确
- 初学者门槛高
- SQL 结构依赖经验
而 LLM 的出现解决了这些难题:
AI 理解自然语言
"查一下开发部工资最高的人"
AI 自动生成标准 SQL
js
SELECT name FROM employees WHERE department = '开发部' ORDER BY salary DESC LIMIT 1;
大幅提高开发效率
前端、运营、产品都能通过自然语言获取数据。
未来数据库操作的方式也许是这样的:
用户:查一下最近三个月销售部员工的平均薪资
AI:SQL 已生成,请确认是否执行?
6. 总结:这就是 AIGC + 数据库的新时代
本文完整展示了一套 AIGC 时代的数据操作流程:
- SQLite:零配置轻量数据库
- Python:快速编写数据脚本
- PRAGMA:结构 introspection
- DeepSeek:自然语言生成 SQL
- SQL Prompt Engineering:让生成更稳定
未来的数据库世界不会仅依赖 SQL 专家,更像是:
让 AI 当你的数据库助手,而你只需要告诉它需求。