时隔6年,又开始学数据库,从头开始!
1. 基础
- 统计分析
- COUNT():统计数量 → 算用户数、订单数(搭配DISTINCT去重)
- SUM():求和 → 算GMV、总消费金额
- AVG():求平均 → 算客单价、平均消费
sql
-- 统计近30天的订单数据
SELECT
COUNT(DISTINCT order_id) AS 订单数,
SUM(pay_amount) AS 总GMV,
AVG(pay_amount) AS 客单价
FROM orders
WHERE pay_time >= DATE_SUB(CURDATE(), INTERVAL 30 DAY);
- 排序
- 升序:ORDER BY ASC
- 降序:ORDER BY DESC
- WHERE筛原始数据,GROUP BY分组后筛统计结果用HAVING
- 四舍五入保留n位小数
sql
-- 例1:字段四舍五入,保留3位
ROUND(price, 3)
-- 例2:计算后再四舍五入(留存率/转化率必用)
ROUND(COUNT(b.user_id)/COUNT(a.user_id), 3)
-- 例3:完整SQL
SELECT
user_id,
ROUND(score, 3) AS 分数_保留3位
FROM exam;
- 判断是否为空用 IS NULL 和 IS NOT NULL,而不是 =
- 多分组,多关键字排序
sql
SELECT s.student_id, s.student_name, sub.subject_name, IFNULL(COUNT(e.student_id), 0) AS attended_exams
FROM Students s
CROSS JOIN Subjects sub
LEFT JOIN Examinations e
ON s.student_id = e.student_id
AND sub.subject_name = e.subject_name
GROUP BY s.student_id, sub.subject_name
ORDER BY s.student_id ASC, sub.subject_name ASC
2. 多表关联
2.1 按 id 匹配数据(JOIN ... ON ...)
(1)JOIN (INNER JOIN)
核心:两个表取交集
(2)LEFT JOIN
核心:以左表为基准,保留左表所有数据,右表能匹配上就显示,匹配不上显示NULL
sql
-- 合并用户表和订单表,查用户姓名+订单金额
SELECT u.name, o.order_id, o.pay_amount
FROM users u -- 给表起别名(简化写法,u=users,o=orders)
LEFT JOIN orders o
ON u.user_id = o.user_id; -- 关联条件:用户ID一致
(3)RIGHT JOIN(极少用,用LEFT JOIN即可)
核心:右表全留
(4)FULL JOIN(MySQL不支持)
核心:两表全留
2.2 全排列(不用ON)
笛卡尔积 CROSS JOIN
直接把「左表每一行」和「右表每一行」全组合
2.3 用法区分
- 有关系要匹配 → 用 INNER/LEFT JOIN + ON
- 要全覆盖、补 0、全组合 → 用 CROSS JOIN
3. 时间筛选
sql
-- 模板1:近7天(直接复制,改表名/字段名)
WHERE 时间字段 >= DATE_SUB(CURDATE(), INTERVAL 7 DAY)
-- 模板2:近30天(最常用)
WHERE 时间字段 >= DATE_SUB(CURDATE(), INTERVAL 30 DAY)
-- 模板3:昨日(补充,高频)
WHERE DATE(时间字段) = DATE_SUB(CURDATE(), INTERVAL 1 DAY)
4. 主键与外键
- 主键:自己唯一
- 外键:参照别人主键;保证数据不乱改、不乱加
例子:
- 两张表:
- 用户表 user:id(主键)、姓名
- 订单表 order:order_id、user_id(这个就是外键)
- order 表里的 user_id,关联 user 表的主键 id
意思就是:订单只能绑真实存在的用户,不能瞎填一个不存在的 user_id
- 外键的作用
- 保证数据合法:不能出现 "不存在的用户" 的订单
- 防止乱删:用户有订单,就不能随便删这个用户
- 关联关系固定:表里不乱飘脏数据