SQLAlchemy 的异步操作来批量保存对象列表

复制代码
async def create_category(db: Session, task_id, category_list, create_time):
    db_categorys = [models.TaskDataSetCategory(
        task_id=task_id,
        category_id=index + 1,
        name=tag,
        supercategory='',
        create_time=create_time,
        update_time=create_time
    ) for index, tag in enumerate(category_list)]
    await db.run_sync(lambda session: session.bulk_save_objects(db_categorys))

最后一句

核心机制解析

  1. db.run_sync() 方法

    • 这是 SQLAlchemy 异步 API(AsyncSession)的关键桥接方法

    • 作用:在异步环境中执行同步风格的 SQLAlchemy 操作

    • 原理:将同步代码转移到专门的事件循环执行器中运行,避免阻塞主线程

  2. lambda 函数

    复制代码
    lambda session: session.bulk_save_objects(db_categorys)
    • 接收同步风格的 Session 对象作为参数

    • 调用同步的 bulk_save_objects() 方法批量保存对象

  3. bulk_save_objects() 方法

    • 高效保存对象列表(比逐个 add() 性能更高)

    • 特点:

      • 不触发 ORM 事件(如 before_insert

      • 不自动获取生成的主键值

      • 适合批量初始化数据场景

执行流程分解

  1. 当前线程(异步上下文)暂停执行

  2. SQLAlchemy 将 lambda 函数交给后台同步执行器

  3. 同步执行器:

    • 获取传统同步 Session

    • 执行批量插入操作

    • 生成如下等效 SQL:

      复制代码
      INSERT INTO task_data_set_category 
      (task_id, category_id, name, supercategory, create_time, update_time)
      VALUES (?,?,?,?,?,?), (?,?,?,?,?,?), ...;
  4. 操作完成后返回异步上下文继续执行

性能优化说明

方法 耗时示例 (1000条) 特点
逐个 session.add() ~500ms 触发ORM事件,有完整生命周期
bulk_save_objects ~50ms 无事件触发,纯SQL批量插入

注意事项

  1. 主键获取

    • 批量保存后 db_categorys 中的对象不会自动获得主键值

    • 如需主键需要额外查询或配置 return_defaults=True

  2. 关联对象

    • 不会自动处理关系对象的保存

    • 需要预先确保所有外键关系有效

  3. 异步上下文

    • 必须在 async with AsyncSession() as db: 块内使用

    • 禁止在普通同步函数中直接调用

相关推荐
花酒锄作田11 小时前
Pydantic校验配置文件
python
hboot11 小时前
AI工程师第四课 - 深度学习入门
pytorch·python·神经网络
GBASE16 小时前
G术时刻 |GBase 8s数据库事务并发控制之封锁技术介绍(下)
数据库
ZhengEnCi1 天前
P2M-Matplotlib折线图完全指南-从数据可视化到趋势分析的Python绘图利器
python·matlab·数据可视化
ZhengEnCi1 天前
P2L-Matplotlib饼图完全指南-从数据可视化到图表定制的Python绘图利器
python·matlab
曲幽1 天前
你的REST接口还在“过度投喂”数据吗?——FastAPI + GraphQL实战避坑指南
python·fastapi·web·graphql·route·cors·rest·strawberry
用户8358086187911 天前
基于 Self-RAG 与列表级重排序的进阶 RAG 系统设计与实现
python
xiezhr1 天前
逛GitHub发现了一款免费的带AI功能的数据库管理工具
数据库·ai编程·dba
Warson_L2 天前
Python `Annotated` 与 LangGraph Reducer 学习笔记
python
韩师傅2 天前
海天线算法的前世今生
python·计算机视觉