特殊统计SQL实例分析:活动答题记录表的多维度统计
引言
在进行数据分析时,我们经常面临复杂的数据结构和多样的业务场景,例如一项为期7天的在线答题活动,每位用户每天有3次答题机会,每次答题包含5道题目,每完成一个批次(即5道题)并全部答对,则状态标记为"Y"。这里通过一系列SQL查询实例,深入解析如何从这样的活动答题记录表中筛选出活动期间每日都有答题正确的用户。
数据表结构
为了便于说明,我们先设定如下数据表结构:
sql
CREATE TABLE `answer_records` (
`user_id` INT,
`question_id` INT, -- 题号
`status` CHAR(1), -- 答题状态,'Y'表示全部答对
`batch------no` INT, -- 题目批次,每个批次包含5道题
`create_time` DATE, -- 创建时间
);
应用场景与SQL查询实例
问题一:活动7天,每人每天有3次机会,每次机会答5道题,每5道题一个批次,答对有状态status为Y。现在需要获取活动期间每天都答题正确的人
sql
-- CSDN-小小野猪
select user_id
from (
select user_id,
to_char(create_time, 'yyyy-mm-dd') as day,
count(distinct question_id) as batch_count
from t_question_record
where status = 'true'
group by user_id, to_char(create_time, 'yyyy-mm-dd')
) t
group by user_id
having count(day) = 7 and min(batch_count) = 3
这个查询将返回在活动期间每日至少有一次答题全对的所有用户的ID及其对应日期。
总结
通过上述SQL查询实例,我们对活动答题记录表进行了深度的数据挖掘和统计分析,实现了从海量数据中快速准确地提取关键信息的目标。在实际工作中,根据具体业务需求,可能还需要进一步细化或扩展查询条件以适应更多样化的场景。