

select
u.university,qd.difficult_level,
round(count(qpd.question_id)/count(distinct qpd.device_id),4) avg_answer_cnt
from
user_profile u
inner join
question_practice_detail qpd
on
u.device_id=qpd.device_id
inner join
question_detail qd
on
qpd.question_id=qd.question_id
group by
university,difficult_level;
🔹 SELECT 子句
u.university:从用户表user_profile中取出学校名称qd.difficult_level:从题目表question_detail中取出题目难度ROUND(..., 4):把计算结果四舍五入保留四位小数COUNT(qpd.question_id``):统计所有被用户做过的题目总次数(即刷题总数)COUNT(DISTINCT qpd.device_id):统计该分组下的独立用户数(避免同一个用户多次刷题被重复计算)AS avg_answer_cnt:给计算结果起一个别名,叫 "平均答题数"(as省略)
🔹 FROM & JOIN 子句
FROM user_profile u:从用户信息表开始查询,并给表起别名uJOIN question_practice_detail qpd ON u.device_id = qpd.device_id:通过device_id(用户唯一标识)把用户表和答题记录表关联起来,这样就能知道每个用户做了哪些题JOIN question_detail qd ON qpd.question_id = qd.question_id:通过question_id(题目唯一标识)把答题记录表和题目详情表关联起来,这样就能知道每道题的难度
🔹 GROUP BY子句
GROUP BY:按照学校 和题目难度 对数据进行分组,这样后续的聚合计算(COUNT)就会在每个分组内独立进行