SQLAlchemy 介绍与实践

postgresql 实践
pydantic 实践

1. SQLAlchemy 介绍

SQLAlchemy 是一个 ORM 框架。SQLAlchemy 是一个用于 Python 的 SQL 工具和对象关系映射(ORM)库。它允许你通过 Python 代码来与关系型数据库交互,而不必直接编写SQL语句。

简单介绍一下对象关系映射吧,对象关系映射(英语:Object Relational Mapping,简称 ORM,或O/RM,或O/R mapping),是一种程序设计技术, 用于实现面向对象编程语言里不同类型系统的数据之间的转换。 从效果上说,它其实是创建了一个可在编程语言里使用的"虚拟对象数据库"。大白话:对象模型与数据库表的映射。

1.1. SQLAlchemy 使用场景

SQLAlchemy 是一个强大的 Python ORM 框架,主要应用于以下场景:
数据库访问和操作: SQLAlchemy 提供了高层抽象来操作数据库,可以避免写原生 SQL 语句。支持多种数据库后端(MySQL、MongoDB、SQLite、PostgreSQL)。
ORM映射: 建立 Python 类与数据库表的映射关系,简化数据模型的操作,支持声明式操作。
复杂查询: SQLAlchemy 提供丰富的查询方式,如过滤、分组、联结等,可以构建复杂查询。
异步查询: 基于Greenlet 等实现异步查询,提高查询效率。
事务控制: 通过 Session 管理数据库会话和事务。
工具集成: 如数据迁移工具 Alembic,可以实现 Schema 版本控制和迁移。
大数据集查询: 基于 Pagination 实现数据分页,避免大量数据查询内存溢出。
多数据库支持: 支持 Postgres、MySQL、Oracle 等主流数据库。
Web框架集成: 框架如 Flask 可以集成 SQLAlchemy,便于 Web 应用开发。

2. SQLAlchemy 基本用法

参考:

https://www.jb51.net/python/325524ud6.htm

https://blog.51cto.com/u_13019/12307379

2.1. 安装 SQLAlchemy

在使用 SQLAlchemy 之前,首先需要安装它。可以使用以下命令使用 pip 安装:

python 复制代码
pip install sqlalchemy 
pip install pymysql		# 安装 MySQL

2.2. 连接数据库

使用 SQLAlchemy 连接到数据库,需要提供数据库的连接字符串,其中包含有关数据库类型、用户名、密码、主机和数据库名称的信息。

python 复制代码
from sqlalchemy import create_engine

# 例如,连接到 SQLite 数据库
engine = create_engine('sqlite:///example.db')

# 例如,连接到 MySQL 数据库
username = 'your_mysql_username'
password = 'your_mysql_password'
host = 'your_mysql_host'  # 例如:'localhost' 或 '127.0.0.1'
port = 'your_mysql_port'  # 通常是 3306
database = 'your_database_name'
# 创建连接引擎
engine = create_engine(f'mysql+pymysql://{username}:{password}@{host}:{port}/{database}')

2.3. 定义数据模型

使用 SQLAlchemy 的 ORM 功能,可以定义 Python 类来映射数据库中的表。每个类对应数据库中的一张表,类的属性对应表中的列。

python 复制代码
# 导入必要的模块
from sqlalchemy import Column, Integer, String, Sequence
from sqlalchemy.ext.declarative import declarative_base
 
# 创建一个基类,用于定义数据模型的基本结构
Base = declarative_base()
 
# 定义一个数据模型类,对应数据库中的 'users' 表
class User(Base):
    # 定义表名
    __tablename__ = 'users'
 
    # 定义列:id,是整数类型,主键(primary_key=True),并使用 Sequence 生成唯一标识
    id = Column(Integer, Sequence('user_id_seq'), primary_key=True)
 
    # 定义列:name,是字符串类型,最大长度为50
    name = Column(String(50))
 
    # 定义列:age,是整数类型
    age = Column(Integer)

2.4. 创建表

通过在代码中调用 create_all 方法,可以根据定义的模型创建数据库表。

python 复制代码
Base.metadata.create_all(engine)

2.5. 插入数据

使用 SQLAlchemy 进行插入数据的操作,首先需要创建一个会话(Session)对象,然后使用该对象添加数据并提交。

python 复制代码
# 导入创建会话的模块
from sqlalchemy.orm import sessionmaker
 
# 使用 sessionmaker 创建一个会话类 Session,并绑定到数据库引擎(bind=engine)
Session = sessionmaker(bind=engine)
 
# 创建一个实例化的会话对象 session
session = Session()
 
# 创建一个新的 User 实例,即要插入到数据库中的新用户
new_user = User(name='John Doe', age=30)
 
# 将新用户添加到会话中,即将其添加到数据库操作队列中
session.add(new_user)
 
# 提交会话,将所有在此会话中的数据库操作提交到数据库
session.commit()

2.6. 使用事务添加数据

如果添加过程中发生任何错误,我们将回滚事务,确保数据库的一致性。

python 复制代码
try:
    # 开始一个新的事务
    session.begin()
    # 创建新用户对象
    user1 = User(name='Alice', email='alice@example.com')
    user2 = User(name='Bob', email='bob@example.com')
    # 添加到会话中
    session.add(user1)
    session.add(user2)
    # 提交事务,将所有更改保存到数据库
    session.commit()
    print("Users added successfully.")
except Exception as e:
    # 如果在添加用户过程中发生错误,则回滚事务
    session.rollback()
    print(f"An error occurred: {e}")
finally:
    # 关闭会话
    session.close()

在这个示例中,我们使用 session.begin() 显式地开始了一个新的事务。然后,我们尝试添加两个新用户到会话中。如果在这个过程中没有发生任何错误,我们使用 session.commit() 提交事务,将所有更改保存到数据库中。但是,如果在添加用户的过程中发生了任何异常(例如,由于重复的电子邮件地址或数据库连接问题),我们将使用 session.rollback() 回滚事务,确保数据库的一致性。

2.7. 查询数据

使用 SQLAlchemy 进行查询数据的操作,可以通过查询语句或使用 ORM 查询接口。

python 复制代码
# 使用查询语句
result = engine.execute('SELECT * FROM users')
 
# 使用 ORM 查询接口
users = session.query(User).all()

3. 复杂查询条件

3.1. 连接查询(Join)

假设我们有两个模型, User 和 Order ,并且一个用户可以有多个订单。

python 复制代码
from sqlalchemy import Column, Integer, String, ForeignKey
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import relationship
Base = declarative_base()
class User(Base):
    __tablename__ = 'users'
    id = Column(Integer, primary_key=True)
    name = Column(String)
    orders = relationship("Order", back_populates="user")
    
class Order(Base):
    __tablename__ = 'orders'
    id = Column(Integer, primary_key=True)
    user_id = Column(Integer, ForeignKey('users.id'))
    product = Column(String)
    quantity = Column(Integer)
    user = relationship("User", back_populates="orders")

现在,如果我们想要查询所有下过订单的用户及其订单信息,我们可以进行连接查询:

python 复制代码
from sqlalchemy.orm import joinedload
# 加载所有用户的订单信息
users_with_orders = session.query(User).options(joinedload(User.orders)).all()
for user in users_with_orders:
    print(f"User: {user.name}")
    for order in user.orders:
        print(f"  Order: {order.product}, Quantity: {order.quantity}")

3.2. 分组和聚合(Grouping and Aggregation)

假设我们想要统计每个用户下的订单总数。

python 复制代码
from sqlalchemy import func
# 按用户分组,并计算每个用户的订单数量
order_count_by_user = session.query(User.id, User.name, func.count(Order.id).label('order_count')).\
    join(Order).group_by(User.id, User.name).all()
for user_id, user_name, order_count in order_count_by_user:
    print(f"User ID: {user_id}, Name: {user_name}, Order Count: {order_count}")

3.3. 子查询(Subquery)

如果我们想要找出订单数量超过平均订单数量的用户,我们可以使用子查询。

python 复制代码
from sqlalchemy import func, select
# 计算平均订单数量作为子查询
avg_order_quantity = select([func.avg(Order.quantity).label('avg_quantity')]).select_from(Order).alias()
# 查询订单数量超过平均值的用户及其订单信息
users_above_avg = session.query(User, Order.product, Order.quantity).\
    join(Order).filter(Order.quantity > avg_order_quantity.c.avg_quantity).all()
for user, product, quantity in users_above_avg:
    print(f"User: {user.name}, Product: {product}, Quantity: {quantity}")

3.4. 复杂筛选条件(Complex Filtering)

假设我们想要找到名字以 "A" 开头的用户,并且他们的订单中包含 "apple" 这个产品。

python 复制代码
# 查询名字以"A"开头的用户,且订单中包含"apple"产品的用户信息
users_with_apple = session.query(User).join(Order).\
    filter(User.name.startswith('A')).\
    filter(Order.product.contains('apple')).\
    distinct().all()  # 使用distinct() 确保结果中的用户不重复
for user in users_with_apple:
    print(f"User: {user.name}")

4. SQLAlchemy 实践1

4.1. 定义数据模型类

我们定义三个数据模型类:User(用户)、Post(文章)和Comment(评论)。这些类之间通过外键和关系进行关联。

python 复制代码
# 导入 SQLAlchemy 中所需的模块
from sqlalchemy import create_engine, Column, Integer, String, Text, ForeignKey
from sqlalchemy.orm import declarative_base, relationship
 
# 创建一个基类,用于定义数据模型的基本结构
Base = declarative_base()
 
# 定义数据模型类 User,对应数据库中的 'users' 表
class User(Base):
    __tablename__ = 'users'
    
    # 定义列:id,是整数类型,作为主键
    id = Column(Integer, primary_key=True)
    
    # 定义列:username,是字符串类型,最大长度为50,唯一且不可为空
    username = Column(String(50), unique=True, nullable=False)
    
    # 定义列:email,是字符串类型,最大长度为100,唯一且不可为空
    email = Column(String(100), unique=True, nullable=False)
    
    # 定义关系,与 Post 类的关系为一对多关系,通过 back_populates 指定反向关系属性名
    posts = relationship('Post', back_populates='author')
 
# 定义数据模型类 Post,对应数据库中的 'posts' 表
class Post(Base):
    __tablename__ = 'posts'
    
    # 定义列:id,是整数类型,作为主键
    id = Column(Integer, primary_key=True)
    
    # 定义列:title,是字符串类型,最大长度为100,不可为空
    title = Column(String(100), nullable=False)
    
    # 定义列:content,是文本类型,不可为空
    content = Column(Text, nullable=False)
    
    # 定义列:user_id,是整数类型,外键关联到 'users' 表的 id 列
    user_id = Column(Integer, ForeignKey('users.id'))
    
    # 定义关系,与 User 类的关系为多对一关系,通过 back_populates 指定反向关系属性名
    author = relationship('User', back_populates='posts')
    
    # 定义关系,与 Comment 类的关系为一对多关系,通过 back_populates 指定反向关系属性名
    comments = relationship('Comment', back_populates='post')
 
# 定义数据模型类 Comment,对应数据库中的 'comments' 表
class Comment(Base):
    __tablename__ = 'comments'
    
    # 定义列:id,是整数类型,作为主键
    id = Column(Integer, primary_key=True)
    
    # 定义列:text,是文本类型,不可为空
    text = Column(Text, nullable=False)
    
    # 定义列:user_id,是整数类型,外键关联到 'users' 表的 id 列
    user_id = Column(Integer, ForeignKey('users.id'))
    
    # 定义列:post_id,是整数类型,外键关联到 'posts' 表的 id 列
    post_id = Column(Integer, ForeignKey('posts.id'))
    
    # 定义关系,与 User 类的关系为多对一关系
    author = relationship('User')
    
    # 定义关系,与 Post 类的关系为多对一关系,通过 back_populates 指定反向关系属性名
    post = relationship('Post', back_populates='comments')

4.2. 创建数据库引擎和会话

这里我们选择了 SQLite 数据库,并使用 create_all 创建相应的表。

python 复制代码
# 导入 SQLAlchemy 中所需的模块
from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker
 
# 创建一个 SQLite 数据库引擎,连接到名为 'blog.db' 的数据库文件
engine = create_engine('sqlite:///blog.db')
 
# 使用 Base 对象的 metadata 属性,创建数据库中定义的所有表
Base.metadata.create_all(engine)
 
# 使用 sessionmaker 创建一个会话类 Session,并将其绑定到上面创建的数据库引擎
Session = sessionmaker(bind=engine)
 
# 创建一个实例化的会话对象 session,用于进行数据库操作
session = Session()

4.3. 进行数据库操作

这段代码演示了如何使用 SQLAlchemy 对数据库进行插入和查询操作。首先,创建了一个用户、一篇文章和一条评论,然后通过查询用户的方式,打印出该用户的所有文章及评论。

python 复制代码
# 创建一个新用户对象并设置其属性
user1 = User(username='john_doe', email='john@example.com')
 
# 将新用户对象添加到会话,表示要进行数据库插入操作
session.add(user1)
 
# 提交会话,将所有在此会话中的数据库操作提交到数据库
session.commit()
 
# 创建一篇新文章对象并设置其属性
post1 = Post(title='Introduction to SQLAlchemy', content='SQLAlchemy is a powerful ORM for Python.')
 
# 将文章的作者关联到之前创建的用户
post1.author = user1
 
# 将新文章对象添加到会话,表示要进行数据库插入操作
session.add(post1)
 
# 提交会话,将所有在此会话中的数据库操作提交到数据库
session.commit()
 
# 创建一条新评论对象并设置其属性
comment1 = Comment(text='Great article!', author=user1, post=post1)
 
# 将评论对象添加到会话,表示要进行数据库插入操作
session.add(comment1)
 
# 提交会话,将所有在此会话中的数据库操作提交到数据库
session.commit()
 
# 查询用户名为 'john_doe' 的用户,并打印其所有文章及评论
user = session.query(User).filter_by(username='john_doe').first()
print(f"User: {user.username}")
 
# 遍历用户的所有文章
for post in user.posts:
    print(f"Post: {post.title}")
 
    # 遍历文章的所有评论
    for comment in post.comments:
        print(f"Comment: {comment.text}")

5. SQLAlchemy 实践2 数据库初始化操作

main.py

python 复制代码
from sqlalchemy import create_engine
from sqlalchemy_utils import create_database, database_exists

from sqlalchemy import and_, or_, func
from sqlalchemy.exc import SQLAlchemyError
from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker
from sqlalchemy.pool import SingletonThreadPool

from database import Base
from database import TUsers

def is_db_exist(db_url: str):
    engine = create_engine(
        db_url, max_overflow=0, pool_size=16, pool_timeout=5, pool_recycle=-1
    )
    
    if not database_exists(engine.url):
        create_database(engine.url)
        return False
    else:    
        return True
    
def init_database(db_url: str):
    # SQLALCHEMY_DATABASE_URL = "mysql+pymysql://root:password@localhost:3306/location_db"
    # # SQLALCHEMY_DATABASE_URL = "sqlite:///./location_db.db"

    # 设置连接池的大小
    engine = create_engine(
        db_url, 
        max_overflow=0,         # 超过连接池大小外最多创建的连接
        pool_size=16,           # 连接池大小
        pool_timeout=5,         # 池中没有线程最多等待的时间,否则报错
        pool_recycle=-1         # 多久之后对线程池中的线程进行一次连接的回收(重置)
    )
    # 创建数据库
    Base.metadata.create_all(engine)
    # # 创建数据库连接
    # _session = sessionmaker(autocommit=False, autoflush=False, bind=engine)()

if __name__ == '__main__':
    # 数据库参考
    db_host = "127.0.0.1"
    db_user = "root"
    db_password = "********"
    db_url = '%s%s:%s@%s/%s' % ("mysql+pymysql://", db_user, db_password, db_host, "local_db")
    if not is_db_exist(db_url):
        init_database(db_url)

    from account import AlchemyTool
    alchemytool = AlchemyTool(db_url=db_url)
    alchemytool.create_user()

database.py

python 复制代码
from sqlalchemy import Column, Integer, String, DateTime, Text
from sqlalchemy.ext.declarative import declarative_base
from datetime import datetime, timedelta

# sqlalchemy
Base = declarative_base()

class TUsers(Base):
    __tablename__ = 'users'

    user_id     = Column(String(32), primary_key=True, index=True)
    user_name   = Column(String(32), nullable=False)

    def to_dict(self):
        return {c.name: getattr(self, c.name, None) for c in self.__table__.columns}

account.py

python 复制代码
from sqlalchemy import and_, or_, func
from sqlalchemy.exc import SQLAlchemyError
from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker
from sqlalchemy.pool import SingletonThreadPool

from database import Base
from database import TUsers

class AlchemyTool(object):
    def __init__(self, db_url: str):
        print("AlchemyTool init")

        # 设置连接池的大小
        db_config = {
            "pool_size": 10
        }
        #engine = create_engine(SQLALCHEMY_DATABASE_URL, **db_config)
        # engine = create_engine(db_url, 
        #         #poolclass = SingletonThreadPool,
        #         connect_args = {'check_same_thread': False}
        #     )
        engine = create_engine(
            db_url, max_overflow=0, pool_size=16, pool_timeout=5, pool_recycle=-1
        )
        # # 创建数据库
        # Base.metadata.create_all(engine)
        # 创建数据库连接
        self.__session = sessionmaker(autocommit=False, autoflush=False, bind=engine)()

    # ############################### User ###############################
    def create_user(self):

        try:
            # db_location = TUsers(**user_base.dict(), user_id=user_id, creator=creator, editor=editor, state=state)
            db_location = TUsers(user_id="id2222", user_name="name")
            self.__session.add(db_location)
            self.__session.commit()
        except SQLAlchemyError as e:
            print(f"Error.AlchemyTool.create_user SQLAlchemyError:{str(e)}")
            self.__session.rollback()
            db_location = None
        finally:
            pass
相关推荐
许苑向上11 分钟前
最详细【Elasticsearch】Elasticsearch Java API + Spring Boot集成 实战入门(基础篇)
java·数据库·spring boot·elasticsearch
python15622 分钟前
Python Pandas内存管理技巧助力高效处理大数据
大数据·python·pandas
Python大数据分析@24 分钟前
学习python中的pandas有没有好的教程推荐?
python·学习·pandas
哪 吒26 分钟前
华为OD机试 - 无重复字符的元素长度乘积的最大值(Python/JS/C/C++ 2024 C卷 100分)
javascript·python·华为od
科研小达人1 小时前
Langchain调用模型使用FAISS
python·chatgpt·langchain·faiss
Biomamba生信基地1 小时前
jupyter如何切换内核
ide·python·jupyter
T0uken1 小时前
【ESP32+MicroPython】网络编程基础
网络·python·esp32
豆本-豆豆奶1 小时前
给初学者的 Jupyter Notebook 教程
开发语言·python·jupyter·安装教程·notebook
勤奋的大熊猫1 小时前
Jupyter lab 打开时默认使用 Notebook 而不是浏览器
ide·python·jupyter
CodeCraft Studio1 小时前
【实用技能】在 SQL Server 中使用 LIMIT 子句的替代方案
数据库·sql·sqlserver