SQLAlchemy 的异步操作来批量保存对象列表

复制代码
async def create_category(db: Session, task_id, category_list, create_time):
    db_categorys = [models.TaskDataSetCategory(
        task_id=task_id,
        category_id=index + 1,
        name=tag,
        supercategory='',
        create_time=create_time,
        update_time=create_time
    ) for index, tag in enumerate(category_list)]
    await db.run_sync(lambda session: session.bulk_save_objects(db_categorys))

最后一句

核心机制解析

  1. db.run_sync() 方法

    • 这是 SQLAlchemy 异步 API(AsyncSession)的关键桥接方法

    • 作用:在异步环境中执行同步风格的 SQLAlchemy 操作

    • 原理:将同步代码转移到专门的事件循环执行器中运行,避免阻塞主线程

  2. lambda 函数

    复制代码
    lambda session: session.bulk_save_objects(db_categorys)
    • 接收同步风格的 Session 对象作为参数

    • 调用同步的 bulk_save_objects() 方法批量保存对象

  3. bulk_save_objects() 方法

    • 高效保存对象列表(比逐个 add() 性能更高)

    • 特点:

      • 不触发 ORM 事件(如 before_insert

      • 不自动获取生成的主键值

      • 适合批量初始化数据场景

执行流程分解

  1. 当前线程(异步上下文)暂停执行

  2. SQLAlchemy 将 lambda 函数交给后台同步执行器

  3. 同步执行器:

    • 获取传统同步 Session

    • 执行批量插入操作

    • 生成如下等效 SQL:

      复制代码
      INSERT INTO task_data_set_category 
      (task_id, category_id, name, supercategory, create_time, update_time)
      VALUES (?,?,?,?,?,?), (?,?,?,?,?,?), ...;
  4. 操作完成后返回异步上下文继续执行

性能优化说明

方法 耗时示例 (1000条) 特点
逐个 session.add() ~500ms 触发ORM事件,有完整生命周期
bulk_save_objects ~50ms 无事件触发,纯SQL批量插入

注意事项

  1. 主键获取

    • 批量保存后 db_categorys 中的对象不会自动获得主键值

    • 如需主键需要额外查询或配置 return_defaults=True

  2. 关联对象

    • 不会自动处理关系对象的保存

    • 需要预先确保所有外键关系有效

  3. 异步上下文

    • 必须在 async with AsyncSession() as db: 块内使用

    • 禁止在普通同步函数中直接调用

相关推荐
gsfl10 小时前
Redis 持久化机制
数据库·redis·缓存
我是华为OD~HR~栗栗呀11 小时前
Java面经(22届考研-华oD)
java·后端·python·华为od·华为
毕设源码-朱学姐11 小时前
【开题答辩全过程】以 python基于Hadoop的服装穿搭系统的设计与实现为例,包含答辩的问题和答案
开发语言·hadoop·python
十二月将至11 小时前
python读取文件的常用操作
网络·python
爱砸键盘的懒洋洋11 小时前
Python第四课:数据类型与转换
开发语言·python
老朋友此林12 小时前
一文快速入门 MongoDB 、MongoDB 8.2 下载安装、增删改查操作、索引、SpringBoot整合 Spring Data MongoDB
数据库·mongodb·springboot
炬火初现12 小时前
SQL——子查询
数据库·sql
semantist@语校12 小时前
语校网500所里程碑:日本语言学校数据库的标准化与可追溯机制
大数据·数据库·人工智能·百度·语言模型·oracle·github
野犬寒鸦12 小时前
从零起步学习Redis || 第五章:利用Redis构造分布式全局唯一ID
java·服务器·数据库·redis·分布式·后端·缓存
yenggd12 小时前
QoS之流量整形配置方法
网络·数据库·华为