AIGC 时代，用自然语言操作 SQLite3 数据库

在人工智能生成内容（AIGC）迅猛发展的今天，我们与数据的交互方式正经历一场静默而深刻的变革。曾经必须依赖 SQL 语句才能查询的数据，如今只需一句自然语言，大模型便能自动生成对应的数据库指令。而在这场变革中，SQLite3 凭借其轻量、嵌入式、零配置等特性，成为本地开发与智能应用的理想搭档。

本文将通过一个完整的 Python 示例，带你体验如何结合 SQLite3 与 大语言模型（如 DeepSeek），实现"说中文，查数据"的智能数据库操作流程。全文围绕代码展开，重点突出关键环节，其余部分则自然融入上下文，力求简洁清晰、结构美观。

1. 为什么选择 SQLite3？

在众多数据库系统中，SQLite3 独树一帜：它不是运行在独立服务器上的服务型数据库（如 MySQL 或 PostgreSQL），而是一个完全嵌入到应用程序中的文件型数据库。

它不需要安装、启动或配置；
整个数据库就是一个 .db 文件，便于携带和备份；
支持标准 SQL 语法，兼容性极佳；
广泛用于移动端（如微信）、桌面软件和小型 Web 应用。

相比之下，MySQL 虽然功能强大，但需要部署服务、管理用户权限、配置网络连接------这些在本地实验或轻量级场景中显得过于笨重。而 SQLite3 正好填补了这一空白：简单、可靠、即开即用。

SQL 作为操作关系型数据库的语言，在 SQLite3 中同样适用。但如今，我们不再需要手动编写它------AI 可以代劳。

2. 初始化数据库：建表与插入数据

一切从一行代码开始：

python 复制代码

import sqlite3

conn = sqlite3.connect("test.db")
cursor = conn.cursor()

sqlite3.connect() 会打开（或创建）一个名为 test.db 的数据库文件，cursor 则是执行 SQL 命令的"句柄"。

接着，我们创建一张员工表并插入测试数据：

python 复制代码

cursor.execute("""
CREATE TABLE IF NOT EXISTS employees (
    id INTEGER PRIMARY KEY,
    name TEXT,
    department TEXT,
    salary INTEGER
)
""")

sample_data = [
    (6, "wyc", "开发部", 32000),
    (7, "wp", "销售部", 20000),
    (8, "lh", "开发部", 33000),
    (9, "jw", "销售部", 15000)
]
cursor.executemany('INSERT INTO employees VALUES (?, ?, ?, ?)', sample_data)
conn.commit()

这里使用了 executemany 批量插入，效率更高。commit() 确保数据真正写入磁盘。

这一步是一次性设置，后续所有查询都将基于这张表进行，而无需再碰 SQL。

3. 获取表结构：为 AI 提供上下文

为了让大模型知道"数据库里有什么"，我们需要提取表的结构（Schema）：

python 复制代码

schema = cursor.execute("PRAGMA table_info(employees)").fetchall()
schema_str = "CREATE TABLE EMPLOYEES (\n" + "\n".join([f"{col[1]} {col[2]}" for col in schema]) + "\n)"

PRAGMA table_info 是 SQLite3 特有的元命令，返回每列的名称与类型。我们将结果格式化为类 CREATE TABLE 的字符串，这样大模型能更直观地理解字段含义。

这个 schema_str 将作为 Prompt 的一部分，告诉 AI："你可以查询 name、department、salary 这些字段"。

4. 自然语言 → SQL：让 AI 代写查询

自然语言去操作数据库，生成sql 语句，不再需要编写复杂的 sql 语句，只需要用自然语言描述数据库操作即可。接下来，我们调用大模型 API（以 DeepSeek 为例）：

python 复制代码

from openai import OpenAI

client = OpenAI(
    api_key='sk-xxxx',
    base_url='https://api.deepseek.com/v1'
)

def ask_deepseek(query, schema):
    prompt = f"""
这是一个数据库的Schema:
{schema}

根据这个Schema，你能输出一个SQL查询来回答以下问题吗？
只输出SQL查询，不要输出任何内容，也不要带任何格式。
问题：{query}
"""
    response = client.chat.completions.create(
        model="deepseek-reasoner",
        messages=[{"role": "user", "content": prompt}]
    )
    return response.choices[0].message.content.strip()

关键在于 Prompt 的设计：

明确提供 Schema 上下文；
指定输出格式（仅 SQL，无解释）；
避免模型自由发挥导致语法错误。

例如，当输入问题：

"开发部员工的姓名和工资是多少？"

模型会精准返回：

sql 复制代码

SELECT name, salary FROM employees WHERE department = '开发部';

5. 执行查询并展示结果

最后一步，将 AI 生成的 SQL 交给 SQLite3 执行：

python 复制代码

question = "开发部员工的姓名和工资是多少？"
sql = ask_deepseek(question, schema_str)

cursor.execute(sql)
results = cursor.fetchall()
for row in results:
    print(row)

输出：

arduino 复制代码

('wyc', 32000)
('lh', 33000)

整个过程无需人工干预 SQL 编写，真正实现了 自然语言驱动的数据查询。

结语：让数据库"听懂人话"

这个小小的示例，折射出 AIGC 时代数据库交互的新范式：
技术门槛正在消失，人机协作愈发自然。

SQLite3 提供了轻量可靠的本地存储基础，而大模型则充当了"智能翻译官"，将人类语言转化为机器可执行的指令。两者结合，不仅提升了开发效率，更让非技术人员也能轻松驾驭数据。

未来，无论是个人知识库、本地笔记系统，还是企业内部的小型数据分析工具，都可以基于这种模式快速构建。你不需要记住 SELECT、WHERE、JOIN，只需要清晰地表达你的需求------剩下的，交给 AI 和 SQLite3。

一句话总结 ：

在 AIGC 时代，数据库不再是冷冰冰的表格，而是能"听懂你说话"的智能伙伴。而 SQLite3，正是通往这一未来的最轻盈入口。