第三章:SQL 高级功能与性能优化

1. 窗口函数(Window Functions)​

用于在结果集的"窗口"(指定行范围)内执行计算,保留原数据行的同时生成聚合或排序结果。

​1.1 核心语法​
复制代码
SELECT 
    column1,
    column2,
    [窗口函数] OVER (
        PARTITION BY 分组列 
        ORDER BY 排序列 
        [ROWS/RANGE 范围定义]
    ) AS 别名
FROM 表名;
​1.2 常用窗口函数​
  • ​排序类​​:

    复制代码
    ROW_NUMBER()   -- 行号(唯一,无重复)
    RANK()         -- 排名(允许并列,后续跳过序号)
    DENSE_RANK()   -- 密集排名(允许并列,后续不跳号)

    示例:按分数对学生排名

    复制代码
    SELECT 
        name, score,
        ROW_NUMBER() OVER (ORDER BY score DESC) AS row_num,
        RANK() OVER (ORDER BY score DESC) AS rank,
        DENSE_RANK() OVER (ORDER BY score DESC) AS dense_rank
    FROM students;
  • ​聚合类​​:

    复制代码
    SUM() OVER (PARTITION BY 分组列)  -- 分组求和
    AVG() OVER (ORDER BY 排序列 ROWS BETWEEN 2 PRECEDING AND CURRENT ROW)  -- 滑动平均

    示例:计算每个学生的累计总分

    复制代码
    SELECT 
        name, score,
        SUM(score) OVER (ORDER BY enroll_date) AS cumulative_sum
    FROM students;
  • ​分布类​​:

    复制代码
    LAG(column, n)  -- 获取前第n行的值
    LEAD(column, n)  -- 获取后第n行的值
    NTILE(4)        -- 将数据分为4组

​2. 存储过程与函数​
​2.1 存储过程(Stored Procedure)​

封装复杂逻辑,可重复调用:

复制代码
-- 创建存储过程(示例:根据年龄筛选学生)
DELIMITER //
CREATE PROCEDURE GetStudentsByAge(IN min_age INT, IN max_age INT)
BEGIN
    SELECT name, age 
    FROM students 
    WHERE age BETWEEN min_age AND max_age;
END //
DELIMITER ;

-- 调用存储过程
CALL GetStudentsByAge(18, 25);
​2.2 自定义函数(User-Defined Function)​

返回单一值,可在查询中使用:

复制代码
-- 创建函数(示例:计算折扣价)
CREATE FUNCTION CalculateDiscount(price DECIMAL(10,2), discount_rate DECIMAL(3,2))
RETURNS DECIMAL(10,2)
DETERMINISTIC
BEGIN
    RETURN price * (1 - discount_rate);
END;

-- 使用函数
SELECT product_name, price, CalculateDiscount(price, 0.1) AS discounted_price
FROM products;

​3. 触发器(Triggers)​

在指定事件(INSERT/UPDATE/DELETE)前后自动执行:

复制代码
-- 创建触发器(示例:在插入订单时更新库存)
CREATE TRIGGER UpdateInventoryAfterOrder
AFTER INSERT ON orders
FOR EACH ROW
BEGIN
    UPDATE products 
    SET stock = stock - NEW.quantity 
    WHERE product_id = NEW.product_id;
END;

-- 插入订单后,库存自动减少
INSERT INTO orders (product_id, quantity) VALUES (101, 5);

​4. 动态SQL​

构建灵活查询(示例:根据条件动态筛选):

复制代码
-- 使用预处理语句(MySQL示例)
SET @sql = CONCAT('SELECT * FROM students WHERE 1=1');
-- 动态添加条件
IF age_filter IS NOT NULL THEN
    SET @sql = CONCAT(@sql, ' AND age = ', age_filter);
END IF;

PREPARE stmt FROM @sql;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;

​5. JSON 数据处理​

现代数据库支持 JSON 类型和操作:

复制代码
-- 创建含 JSON 列的表
CREATE TABLE user_profiles (
    user_id INT PRIMARY KEY,
    profile JSON
);

-- 插入 JSON 数据
INSERT INTO user_profiles VALUES (1, '{"name": "Alice", "hobbies": ["reading", "music"]}');

-- 查询 JSON 字段
SELECT 
    user_id,
    profile->'$.name' AS name,
    JSON_EXTRACT(profile, '$.hobbies[0]') AS first_hobby
FROM user_profiles;

-- 更新 JSON 字段
UPDATE user_profiles 
SET profile = JSON_SET(profile, '$.age', 25) 
WHERE user_id = 1;

​6. 性能优化技巧​
​6.1 分析执行计划​

使用 EXPLAIN 查看查询优化路径:

复制代码
EXPLAIN SELECT * FROM students WHERE age > 20;
​6.2 索引优化​
  • ​覆盖索引​:索引包含查询所需的所有字段。
  • ​避免全表扫描​:对 WHERE 和 JOIN 中的列建索引。
  • ​复合索引顺序​:将高区分度的列放在前面。
​6.3 避免隐式类型转换​
复制代码
-- 错误示例(将数字与字符串比较)
SELECT * FROM students WHERE id = '100';

-- 正确写法
SELECT * FROM students WHERE id = 100;
​6.4 分页查询优化​

避免 LIMIT offset, size 在大偏移量时的性能问题:

复制代码
-- 优化写法(基于有序唯一列)
SELECT * FROM students 
WHERE id > 1000  -- 上次查询的最大ID
ORDER BY id 
LIMIT 10;

​7. 递归查询(CTE)​

处理层次结构数据(如组织结构):

复制代码
-- 查询所有下属员工(示例表:employee(id, name, manager_id))
WITH RECURSIVE Subordinates AS (
    SELECT id, name, manager_id 
    FROM employee 
    WHERE id = 1  -- 根节点(CEO)
    UNION ALL
    SELECT e.id, e.name, e.manager_id 
    FROM employee e
    INNER JOIN Subordinates s ON e.manager_id = s.id
)
SELECT * FROM Subordinates;

​8. 视图与物化视图​
​8.1 视图(View)​

虚拟表,简化复杂查询:

复制代码
CREATE VIEW HighScoreStudents AS
SELECT name, score 
FROM students 
WHERE score >= 90;

-- 使用视图
SELECT * FROM HighScoreStudents;
​8.2 物化视图(Materialized View)​

物理存储查询结果(需数据库支持,如 PostgreSQL):

复制代码
CREATE MATERIALIZED VIEW SalesSummary AS
SELECT product_id, SUM(quantity) AS total_sales
FROM orders
GROUP BY product_id;

-- 刷新物化视图
REFRESH MATERIALIZED VIEW SalesSummary;

​9. 综合实战:电商数据分析​
复制代码
-- 统计每个用户的订单数、总金额及最近购买时间
SELECT 
    u.user_id,
    u.name,
    COUNT(o.order_id) AS order_count,
    SUM(o.amount) AS total_amount,
    MAX(o.order_date) AS last_order_date
FROM users u
LEFT JOIN orders o ON u.user_id = o.user_id
GROUP BY u.user_id;

-- 分析销售额的月度增长趋势(窗口函数)
SELECT 
    DATE_FORMAT(order_date, '%Y-%m') AS month,
    SUM(amount) AS monthly_sales,
    LAG(SUM(amount)) OVER (ORDER BY DATE_FORMAT(order_date, '%Y-%m')) AS prev_month_sales,
    (SUM(amount) - LAG(SUM(amount)) OVER (ORDER BY DATE_FORMAT(order_date, '%Y-%m'))) / LAG(SUM(amount)) OVER (ORDER BY DATE_FORMAT(order_date, '%Y-%m')) * 100 AS growth_rate
FROM orders
GROUP BY month;

​10. 本章练习​
  1. 使用窗口函数计算每个学生的分数与班级平均分的差值。

  2. 编写存储过程:根据用户ID删除订单,并自动退还库存。

  3. 优化以下分页查询(假设表含百万数据):

    复制代码
    SELECT * FROM orders ORDER BY order_date DESC LIMIT 100000, 10;
相关推荐
spionbo5 分钟前
Vue 表情包输入组件实现代码及完整开发流程解析
前端·javascript·面试
全宝5 分钟前
✏️Canvas实现环形文字
前端·javascript·canvas
lyc2333335 分钟前
鸿蒙Core File Kit:极简文件管理指南📁
前端
我这里是好的呀6 分钟前
全栈开发个人博客12.嵌套评论设计
前端·全栈
我这里是好的呀7 分钟前
全栈开发个人博客13.AI聊天设计
前端·全栈
金金金__8 分钟前
Element-Plus:popconfirm与tooltip一起使用不生效?
前端·vue.js·element
lyc2333338 分钟前
小L带你看鸿蒙应用升级的数据迁移适配📱
前端
用户268128510666914 分钟前
react-pdf(pdfjs-dist)如何兼容老浏览器(chrome 49)
前端
阿怼丶15 分钟前
🚀 如何在内网中运行 Cesium?基于 NestJS 构建离线地形与影像服务
前端·gis