SQL笔试题【数据岗】

视频号数据分析组外包招聘笔试题时间限时 45 分钟完成

题目 根据 3 张表表结构,写出具体求解的 SQL 代码 (搞笑品类定义:视频分类或者视频创建者分类为"搞笑") l

题目 1:输出一张搞笑品类 dws 表,用于分析作者近 3 条视频情况:输出每个视频 创建者 user_id 最近发布的 3 个视频,在过去一周内的曝光,点赞总数;需要产出字段:视频 创 建者 user_id,曝光用户数,点赞用户数,曝光次数、点赞次数

sql 复制代码
SELECT
	vu.video_user_id AS user_id,
	count( DISTINCT uva.video_id ) AS video_count,
	sum( CASE WHEN uva.action_type = 1 THEN 1 ELSE 0 END ) AS exposure_user_count,
	sum( CASE WHEN uva.action_type = 2 THEN 1 ELSE 0 END ) AS like_user_count,
	sum( CASE WHEN uva.action_type = 1 THEN 1 ELSE 0 END ) AS exposeure_count,
	sum( CASE WHEN uva.action_type = 2 THEN 1 ELSE 0 END ) AS like_count 
FROM
	t_user_video_action_d uva
	JOIN t_video_d v ON uva.video_id = v.video_id
	JOIN t_video_user_d vu ON v.video_user_id = vu.video_user_id 
WHERE
	v.video_type = '搞笑' 
	AND uva.ds >= to_date ( to_char ( SYSDATE,' YYYYMMDD' ) - 7,' YYYYMMDD' ) 
GROUP BY
	vu.video_user_id 
ORDER BY
	vu.video_user_id;

题目 2:输出一个取数结果:在 20221103 日创建的视频中,如果视频描述中带有 "搞笑段 子","脱口秀"两个关键词即为"搞笑类内容",不带有这两个关键词为"非搞笑类内 容",最终输出 20221103 日搞笑与非搞笑视频去重数量

sql 复制代码
SELECT
	count( DISTINCT CASE WHEN v.video_description LIKE ' %搞笑段子%' OR v.video_description LIKE ' %脱口秀%' THEN video_id ELSE NULL END ) AS funny_count,
	Count( DISTINCT CASE WHEN v.video_description NOT LIKE ' %搞笑段子%' AND v.video_description NOT LIKE ' %脱口秀%' THEN v.video_id ELSE NULL END ) AS not_funny_count form t_video_d v 
WHERE
	v.ds = to_date ( ' 20221103',' YYYYMMDD' );

题目 3:计算每个用户每天第一次曝光视频的时间戳,运行速度越快越好,输出字段 日期, 用户 id,时间戳

sql 复制代码
SELECT
	uva.ds AS date,
	uva.user_id,
	min( uva.TIMESTAMP ) AS first_exposure_timestamp form t_user_video_action_d uva 
WHERE
	uva.action_type = 1 
GROUP BY
	uva.user_id,
	uva.ds;

题目 4:输出一张 dws 表,查询过去任意日期的曝光活跃用户的 7 日留存率,输出字 段日 期,用户 id,7 日留存率具体表结构如下表 1 用户行为表:t_user_video_action_d l分区:ds(格式 yyyyMMdd) l主键:user_id、video_id l含义:一个用户对一个视频的所有行为聚合,每天增量 字段名字段含义类型

sql 复制代码
SELECT
	uvu.ds AS date,
	uvu.video_user_id AS user_id,
CASE
	
	WHEN count( DISTINCT first_action.video_user_id ) = 0 THEN
	0 ELSE sum( CASE WHEN to_char ( uvu.ds,' YYYYMMDD' ) BETWEEN first_action.first_ds AND first_action.first_ds + 6 THEN 1 ELSE 0 END ) 
	END / count( distion first_action.video_user_id ) AS retention_rate Form t_video_user_d uvu
	JOIN ( SELECT user_id, video_id, ds AS first_ds form t_user_video_action_d WHERE action_type = 1 GROUP BY user_id, video_id, ds ORDER BY ds ASC ) first_action ON uvu.video_user_id = first_action.user_id 
GROUP BY
	uvu.video_user_id,
uvu.ds;
相关推荐
科研小白_8 分钟前
基于遗传算法优化BP神经网络(GA-BP)的数据时序预测
人工智能·算法·回归
兮兮能吃能睡8 分钟前
SQL中常见的英文术语及其含义
数据库·sql·oracle
Terry Cao 漕河泾9 分钟前
基于dtw算法的动作、动态识别
算法
Elastic 中国社区官方博客1 小时前
根据用户行为数据中的判断列表在 Elasticsearch 中训练 LTR 模型
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
王道长服务器 | 亚马逊云3 小时前
AWS CloudWatch:服务器的“眼睛”,实时监控一切动向
服务器·数据库·aws
Miraitowa_cheems3 小时前
LeetCode算法日记 - Day 73: 最小路径和、地下城游戏
数据结构·算法·leetcode·职场和发展·深度优先·动态规划·推荐算法
野蛮人6号3 小时前
力扣热题100道之560和位K的子数组
数据结构·算法·leetcode
Swift社区4 小时前
LeetCode 400 - 第 N 位数字
算法·leetcode·职场和发展
fengfuyao9855 小时前
BCH码编译码仿真与误码率性能分析
算法
小白不想白a5 小时前
每日手撕算法--哈希映射/链表存储数求和
数据结构·算法