Django `select_related` 查询优化

目标

  • 理解 N+1 查询问题及其性能影响
  • 掌握 select_related 的作用和使用方法
  • 能够分析 Django ORM 生成的 SQL 语句
  • 在实际开发中正确应用查询优化技巧

一、问题引入:N+1 查询问题

1.1 数据模型定义

python 复制代码
# models.py
class Author(models.Model):
    name = models.CharField(max_length=100)
    country = models.CharField(max_length=50)

class Book(models.Model):
    title = models.CharField(max_length=200)
    author = models.ForeignKey(Author, on_delete=models.CASCADE)
    publish_date = models.DateField()

1.2 存在性能问题的代码

python 复制代码
# views.py (存在N+1查询问题)
books = Book.objects.all()
for book in books:
    print(f"书名:{book.title}, 作者:{book.author.name}")

1.3 对应的 SQL 查询

sql 复制代码
-- 第一次查询:获取所有书籍
SELECT 
    "library_book"."id",
    "library_book"."title", 
    "library_book"."author_id",
    "library_book"."publish_date"
FROM "library_book";

-- 后续 N 次查询:为每本书单独查询作者
SELECT "library_author"."id", "library_author"."name", "library_author"."country"
FROM "library_author" WHERE "library_author"."id" = 1;

SELECT "library_author"."id", "library_author"."name", "library_author"."country"
FROM "library_author" WHERE "library_author"."id" = 2;

-- ... 依此类推,产生 N+1 次查询

问题分析:如果有 100 本书,将产生 101 次数据库查询,严重影响性能。


python 复制代码
# views.py (优化后的代码)
books = Book.objects.select_related('author').all()
for book in books:
    print(f"书名:{book.title}, 作者:{book.author.name}")

2.2 优化后的 SQL

sql 复制代码
SELECT 
    "library_book"."id",
    "library_book"."title",
    "library_book"."author_id", 
    "library_book"."publish_date",
    -- 通过 JOIN 一次性获取作者信息
    "library_author"."id",
    "library_author"."name",
    "library_author"."country"
FROM "library_book"
INNER JOIN "library_author" 
    ON ("library_book"."author_id" = "library_author"."id");

优化效果 :无论有多少本书,都只执行 1 次 数据库查询。


3.1 深度关联查询

扩展数据模型:

python 复制代码
class Country(models.Model):
    name = models.CharField(max_length=50)
    code = models.CharField(max_length=3)

class Author(models.Model):
    name = models.CharField(max_length=100)
    country = models.ForeignKey(Country, on_delete=models.CASCADE)

class Book(models.Model):
    title = models.CharField(max_length=200)
    author = models.ForeignKey(Author, on_delete=models.CASCADE)
    publish_date = models.DateField()

深度关联查询:

python 复制代码
# 一次性获取 Book -> Author -> Country 的所有数据
books = Book.objects.select_related('author__country').all()
for book in books:
    print(f"{book.title} - {book.author.name} - {book.author.country.name}")

对应的 SQL:

sql 复制代码
SELECT 
    "library_book"."id",
    "library_book"."title",
    "library_book"."author_id",
    "library_book"."publish_date",
    -- 作者表字段
    "library_author"."id",
    "library_author"."name", 
    "library_author"."country_id",
    -- 国家表字段(通过第二次 JOIN)
    "library_country"."id",
    "library_country"."name",
    "library_country"."code"
FROM "library_book"
INNER JOIN "library_author" 
    ON ("library_book"."author_id" = "library_author"."id")
INNER JOIN "library_country" 
    ON ("library_author"."country_id" = "library_country"."id");

四、实践技巧与注意事项

4.1 查看生成的 SQL 语句

方法1:使用 query 属性

python 复制代码
books = Book.objects.select_related('author')
print(books.query)

方法2:配置 Django SQL 日志

settings.py 中添加:

python 复制代码
LOGGING = {
    'version': 1,
    'disable_existing_loggers': False,
    'handlers': {
        'console': {
            'level': 'DEBUG',
            'class': 'logging.StreamHandler',
        },
    },
    'loggers': {
        'django.db.backends': {
            'handlers': ['console'],
            'level': 'DEBUG',
        },
    },
}

4.2 使用原则

  1. 适用场景

    • 一对一关系(OneToOneField)
    • 多对一关系(ForeignKey)
    • 需要立即访问关联对象字段时
  2. 不适用场景

    • 多对多关系(ManyToManyField)
    • 反向的多对一关系
    • 对于这些情况,应该使用 prefetch_related
  3. 注意事项

    • 不要过度使用深度关联
    • 考虑查询返回的数据量
    • 只在确实需要访问关联对象时使用

五、总结对比

5.1 性能对比表

查询方式 查询次数 适用场景 SQL 类型
普通查询 N+1 次 不确定是否需要关联对象 简单查询 + 多次关联查询
select_related 1 次 确定需要访问关联对象的所有字段 JOIN 查询

5.2 核心要点

  1. 解决问题:N+1 查询问题
  2. 实现原理:使用 SQL JOIN 语句一次性加载关联数据
  3. 使用语法Model.objects.select_related('foreign_key_field')
  4. 深度关联 :使用双下划线 'field__related_field'
  5. 记忆口诀 :"往前拿,用 select_related"

5.3 最佳实践

python 复制代码
# 好的实践:明确知道需要作者信息
books = Book.objects.select_related('author').filter(publish_date__year=2023)
for book in books:
    # 这里会频繁访问 author 的字段
    display_info = f"{book.title} by {book.author.name}"

# 不好的实践:不确定是否需要关联对象
books = Book.objects.select_related('author').filter(publish_date__year=2023)
for book in books:
    # 如果这里根本不访问 book.author,就浪费了 JOIN 的性能
    print(book.title)
相关推荐
潜心编码3 小时前
基于Django的医疗电子仪器系统
前端·数据库·1024程序员节
芙蓉王真的好13 小时前
Django 新手常见错误:模板找不到、数据库连接失败的解决办法
数据库·django·sqlite
言之。3 小时前
django model Manager
数据库·django·sqlite
乌暮5 小时前
数据库--JDBC编程
java·数据库·学习
CodeCraft Studio5 小时前
FastReport VCL发布2026.1版本:全面支持RAD Studio 13,PDF输出功能显著增强
数据库·pdf·rad studio·fastreport·报表设计器·报表开发工具·vcl
Elias不吃糖6 小时前
Qt 6以上版本都试用 连接 MySQL 数据库全流程(CMake 环境)
数据库·qt·mysql
不是二师兄的八戒6 小时前
MySQL 中 HAVING 子句的深度解析与实战指南
数据库·mysql
l1t6 小时前
Duckdb rusty_sheet插件使用心得
数据库·sql·lua·duckdb·rusty_sheet