SQL 学习 - 技术栈

时隔6年，又开始学数据库，从头开始！

1. 基础

统计分析
- COUNT()：统计数量 → 算用户数、订单数（搭配DISTINCT去重）
- SUM()：求和 → 算GMV、总消费金额
- AVG()：求平均 → 算客单价、平均消费

sql 复制代码

-- 统计近30天的订单数据
SELECT 
  COUNT(DISTINCT order_id) AS 订单数,
  SUM(pay_amount) AS 总GMV,
  AVG(pay_amount) AS 客单价
FROM orders
WHERE pay_time >= DATE_SUB(CURDATE(), INTERVAL 30 DAY);

排序
- 升序：ORDER BY ASC
- 降序：ORDER BY DESC
WHERE筛原始数据，GROUP BY分组后筛统计结果用HAVING
四舍五入保留n位小数

sql 复制代码

-- 例1：字段四舍五入，保留3位
ROUND(price, 3)

-- 例2：计算后再四舍五入（留存率/转化率必用）
ROUND(COUNT(b.user_id)/COUNT(a.user_id), 3)

-- 例3：完整SQL
SELECT 
  user_id,
  ROUND(score, 3) AS 分数_保留3位
FROM exam;

判断是否为空用 IS NULL 和 IS NOT NULL，而不是 =
多分组，多关键字排序

sql 复制代码

SELECT s.student_id, s.student_name, sub.subject_name, IFNULL(COUNT(e.student_id), 0) AS attended_exams
FROM Students s
CROSS JOIN Subjects sub
LEFT JOIN Examinations e
ON s.student_id = e.student_id
    AND sub.subject_name = e.subject_name
GROUP BY s.student_id, sub.subject_name
ORDER BY s.student_id ASC, sub.subject_name ASC

2. 多表关联

2.1 按 id 匹配数据（JOIN ... ON ...）

（1）JOIN (INNER JOIN)

核心：两个表取交集

（2）LEFT JOIN

核心：以左表为基准，保留左表所有数据，右表能匹配上就显示，匹配不上显示NULL

sql 复制代码

-- 合并用户表和订单表，查用户姓名+订单金额
SELECT u.name, o.order_id, o.pay_amount
FROM users u  -- 给表起别名（简化写法，u=users，o=orders）
LEFT JOIN orders o
ON u.user_id = o.user_id;  -- 关联条件：用户ID一致

（3）RIGHT JOIN（极少用，用LEFT JOIN即可）

核心：右表全留

（4）FULL JOIN（MySQL不支持）

核心：两表全留

2.2 全排列（不用ON）

笛卡尔积 CROSS JOIN

直接把「左表每一行」和「右表每一行」全组合

2.3 用法区分

有关系要匹配 → 用 INNER/LEFT JOIN + ON
要全覆盖、补 0、全组合 → 用 CROSS JOIN

3. 时间筛选

sql 复制代码

-- 模板1：近7天（直接复制，改表名/字段名）
WHERE 时间字段 >= DATE_SUB(CURDATE(), INTERVAL 7 DAY)

-- 模板2：近30天（最常用）
WHERE 时间字段 >= DATE_SUB(CURDATE(), INTERVAL 30 DAY)

-- 模板3：昨日（补充，高频）
WHERE DATE(时间字段) = DATE_SUB(CURDATE(), INTERVAL 1 DAY)

4. 主键与外键

主键：自己唯一
外键：参照别人主键；保证数据不乱改、不乱加

例子：

两张表：
- 用户表 user：id（主键）、姓名
- 订单表 order：order_id、user_id（这个就是外键）
order 表里的 user_id，关联 user 表的主键 id

意思就是：订单只能绑真实存在的用户，不能瞎填一个不存在的 user_id

外键的作用
- 保证数据合法：不能出现 "不存在的用户" 的订单
- 防止乱删：用户有订单，就不能随便删这个用户
- 关联关系固定：表里不乱飘脏数据