SQL学习,大厂面试真题(1):观看各个视频的平均完播率

各个视频的平均完播率

1、视频信息表

ID AuthorName Category Age Start Time
1 张三 影视 30 2024-01-01 7:00:00
2 李四 美食 60 2024-01-01 7:00:00
3 王麻子 旅游 90 2024-01-01 7:00:00
bash 复制代码
(video_id-视频ID,  AuthorName-创作者, tag-类别标签, duration-视频时长(秒), release_time-发布时间)

2、视频互动表

ID Group Start Time End Time Status Flag1 Flag2 Value
1 1 2024-06-01 10:00:00 2024-06-01 10:00:30 0 1 1 null
2 1 2024-06-01 10:00:00 2024-06-01 10:00:24 0 0 1 null
3 1 2024-06-01 11:00:00 2024-06-01 11:00:34 0 1 0 1
1 2 2024-09-01 10:00:00 2024-09-01 10:00:42 1 0 1 null
2 2 2024-06-01 11:00:00 2024-06-01 11:00:30 1 0 1 null
3 1 2024-06-01 12:00:00 2024-06-01 11:00:34 0 1 0 1
bash 复制代码
(uid-用户ID, video_id-视频ID, start_time-开始观看时间, end_time-结束观看时间, if_follow-是否关注, if_like-是否点赞, if_retweet-是否转发, comment_id-评论ID)

问题:计算2024年里有播放记录的每个视频的完播率(结果保留三位小数),并按完播率降序排序

注:视频完播率是指完成播放次数占总播放次数的比例。简单起见,结束观看时间与开始播放时间的差>=视频时长时,视为完成播放。

SQL实现过程:

1、创建表和插入数据

sql 复制代码
CREATE TABLE dy_video_info (
    id INT PRIMARY KEY AUTO_INCREMENT COMMENT '自增ID',
    video_id INT UNIQUE NOT NULL COMMENT '视频ID',
    authorname VARCHAR(16) NOT NULL COMMENT '创作者ID',
    tag VARCHAR(16) NOT NULL COMMENT '类别标签',
    duration INT NOT NULL COMMENT '视频时长(秒数)',
    release_time datetime NOT NULL COMMENT '发布时间'
)CHARACTER SET utf8 COLLATE utf8mb3_general_ci;


INSERT INTO dy_video_info(video_id, authorname, tag, duration, release_time) VALUES
  (1, '张三', '影视', 31, '2024-01-01 7:00:00'),
  (2, '李四', '美食', 65, '2024-01-01 7:00:00'),
  (3, '王麻子', '搞笑', 90, '2024-01-01 7:00:00');
  

CREATE TABLE dy_user_video_log (
    id INT PRIMARY KEY AUTO_INCREMENT COMMENT '自增ID',
    uid INT NOT NULL COMMENT '用户ID',
    video_id INT NOT NULL COMMENT '视频ID',
    start_time datetime COMMENT '开始观看时间',
    end_time datetime COMMENT '结束观看时间',
    if_follow TINYINT COMMENT '是否关注',
    if_like TINYINT COMMENT '是否点赞',
    if_retweet TINYINT COMMENT '是否转发',
    comment_id INT COMMENT '评论ID'
) CHARACTER SET utf8 COLLATE utf8mb3_general_ci;

INSERT INTO dy_user_video_log(uid, video_id, start_time, end_time, if_follow, if_like, if_retweet, comment_id) VALUES
  (1, 1, '2024-06-01 10:00:00', '2024-06-01 10:00:30', 0, 1, 1, null),
  (2, 1, '2024-06-01 10:00:00', '2024-06-01 10:00:24', 0, 0, 1, null),
  (3, 3, '2024-06-01 11:00:00', '2024-06-01 11:00:34', 0, 1, 0, 1),
  (1, 2, '2024-09-01 10:00:00', '2024-09-01 10:00:42', 1, 0, 1, null),
  (2, 2, '2024-06-01 11:00:00', '2024-06-01 11:00:30', 1, 0, 1, null),
  (3, 3, '2024-06-01 11:00:00', '2024-06-01 11:00:34', 0, 1, 0, 1);

a、先分析:

b、计算结束时间和开始时间的差值:

sql 复制代码
SELECT video_id ,
	  end_time - start_time as avg_comp_play_rate
FROM dy_user_video_log ORDER BY  video_id

c、加入结束时间减开始时间大于30的记为1,其他的记为0

sql 复制代码
SELECT 
    video_id,
	avg_comp_play_rate,
    IF(avg_comp_play_rate > 30, 1, 0) AS play_rate_result
FROM 
(
    SELECT 
        video_id,
		
        (end_time - start_time) as avg_comp_play_rate
    FROM 
        dy_user_video_log
) AS derived_table_name;

2、SQL实现效果

sql 复制代码
-- 选择视频ID和计算平均完成播放率
SELECT 
    a.video_id, -- 选择视频的ID
    -- 计算平均完成播放率,四舍五入到小数点后三位
    round(
        -- 使用条件求和和计数函数计算完成播放率
        sum(
            if(
                -- 如果视频的结束时间减去开始时间大于等于视频的时长,则认为是完成播放
                end_time - start_time >= duration, 
                1, -- 完成播放记为1
                0  -- 否则记为0
            )
        ) / -- 将完成播放的个数除以总播放次数
        count(start_time), -- 计算总播放次数
        3 -- 四舍五入到小数点后三位
    ) as avg_comp_play_rate -- 将计算结果命名为avg_comp_play_rate
FROM 
    dy_user_video_log a -- 从dy_user_video_log表中选择数据,别名为a
-- 左连接dy_video_info表,别名为b,根据视频ID匹配
LEFT JOIN dy_video_info b
    on a.video_id = b.video_id
WHERE 
    year(start_time) = 2024 -- 筛选出开始时间年份为2024的记录
GROUP BY 
    a.video_id -- 根据视频ID分组
ORDER BY 
    avg_comp_play_rate DESC; -- 按平均完成播放率降序排列
相关推荐
深蓝海拓14 分钟前
Pyside6(PyQT5)中的QTableView与QSqlQueryModel、QSqlTableModel的联合使用
数据库·python·qt·pyqt
C嘎嘎嵌入式开发2 小时前
什么是僵尸进程
服务器·数据库·c++
Yeats_Liao4 小时前
Navicat 导出表结构后运行查询失败ERROR 1064 (42000): You have an error in your SQL syntax;
数据库·sql
明月看潮生5 小时前
青少年编程与数学 02-007 PostgreSQL数据库应用 15课题、备份与还原
数据库·青少年编程·postgresql·编程与数学
明月看潮生5 小时前
青少年编程与数学 02-007 PostgreSQL数据库应用 14课题、触发器的编写
数据库·青少年编程·postgresql·编程与数学
加酶洗衣粉9 小时前
MongoDB部署模式
数据库·mongodb
Suyuoa9 小时前
mongoDB常见指令
数据库·mongodb
添砖,加瓦9 小时前
MongoDB详细讲解
数据库·mongodb
Zda天天爱打卡9 小时前
【趣学SQL】第二章:高级查询技巧 2.2 子查询的高级用法——SQL世界的“俄罗斯套娃“艺术
数据库·sql
我的运维人生9 小时前
MongoDB深度解析与实践案例
数据库·mongodb·运维开发·技术共享