问题类型 :SQL优化
问题描述 :用户浏览日志(date, user_id, video_id), 统计 2020.03.29 观看不同视频个数的前5名 user_id。
思路 :主要注意预计算,避免直接去重
解决方案 :
Hive_HQL_Hive优化_复杂SQL_观看不同视频个数的前5名_sql观看视频数最多的前五名用户_高达一号的博客-CSDN博客
问题类型 :窗口函数使用
问题 求连续n月的下单用户
有如下表 ,求连续3个月的下单用户
order_no | uid | dep_no | amount | datetime
1 | 2002 | 20 | 2000.0 | 2023-04-25 12:30:20
解题方案 : Hive_HQL_复杂SQL_连续发单天数_hive支持复杂sql_高达一号的博客-CSDN博客
问题 求年度分月份,累计下单金额
有如下表 ,求业务部分月的年累计订单金额
order_no | uid | dep_no | amount | datetime
1 | 2002 | 20 | 2000.0 | 2023-04-25 12:30:20
问题 求路径访问深度
今天面试遇到了一道题,通过HQL 求访问深度以及当前页与下一页面的地址
前提假设:
1.用户只访问同一page一次
2.用户单一标签页跳转
有如下图1 转换为 图2 格式,即访问路径问题
问题答案 : HIVE_SQL_复杂SQL_求访问深度以及前一跳和下一跳的地址_高达一号的博客-CSDN博客
问题类型 :SQL巧解答
问题 已知登陆表中有 uid、login_time,求每个用户的最大连续登陆天数
uid、login_time
A | 2020-08-01 10:00:00
(该问题为窗口函数问题中 : 连续n月下单用户的延申题目,可以两道问题一起考察)