SQL_SQL_常见面试问题

问题类型 :SQL优化

问题描述 :用户浏览日志(date, user_id, video_id), 统计 2020.03.29 观看不同视频个数的前5名 user_id。

思路 :主要注意预计算,避免直接去重

解决方案 :

Hive_HQL_Hive优化_复杂SQL_观看不同视频个数的前5名_sql观看视频数最多的前五名用户_高达一号的博客-CSDN博客

问题类型 :窗口函数使用

问题 求连续n月的下单用户

有如下表 ,求连续3个月的下单用户

order_no | uid | dep_no | amount | datetime

1 | 2002 | 20 | 2000.0 | 2023-04-25 12:30:20

解题方案 : Hive_HQL_复杂SQL_连续发单天数_hive支持复杂sql_高达一号的博客-CSDN博客

问题 求年度分月份,累计下单金额

有如下表 ,求业务部分月的年累计订单金额

order_no | uid | dep_no | amount | datetime

1 | 2002 | 20 | 2000.0 | 2023-04-25 12:30:20

问题 求路径访问深度

今天面试遇到了一道题,通过HQL 求访问深度以及当前页与下一页面的地址

前提假设:

1.用户只访问同一page一次

2.用户单一标签页跳转

有如下图1 转换为 图2 格式,即访问路径问题

问题答案 : HIVE_SQL_复杂SQL_求访问深度以及前一跳和下一跳的地址_高达一号的博客-CSDN博客

问题类型 :SQL巧解答

问题 已知登陆表中有 uid、login_time,求每个用户的最大连续登陆天数

uid、login_time

A | 2020-08-01 10:00:00

(该问题为窗口函数问题中 : 连续n月下单用户的延申题目,可以两道问题一起考察)

问题答案 : SQL 求最大连续登陆天数_连续登录天数sql_机灵小布衣的博客-CSDN博客

相关推荐
zhangjin12228 小时前
kettle从入门到精通 第九十七课 ETL之kettle kettle资源仓库的5种方式
数据仓库·etl·kettle插件·kettle资源仓库
Leo.yuan4 天前
数据清洗(ETL/ELT)原理与工具选择指南:企业数字化转型的核心引擎
大数据·数据仓库·数据挖掘·数据分析·etl
面朝大海,春不暖,花不开9 天前
使用 Python 实现 ETL 流程:从文本文件提取到数据处理的全面指南
python·etl·原型模式
陈敬雷-充电了么-CEO兼CTO11 天前
推荐算法系统系列>推荐数据仓库集市的ETL数据处理
大数据·数据库·数据仓库·数据挖掘·数据分析·etl·推荐算法
.不吃糖.22 天前
MySQL 与 Oracle 分区表详解:相同点与不同点
数据库·mysql·oracle·etl·分区表
isNotNullX23 天前
ETL连接器好用吗?如何实现ETL连接?
大数据·数据库·数据仓库·信息可视化·etl
isNotNullX25 天前
一文辨析:数据仓库、数据湖、湖仓一体
大数据·数据仓库·数据治理·etl·元数据
isNotNullX1 个月前
kettle好用吗?相较于国产ETL工具有哪些优劣之处?
大数据·数据库·数据仓库·信息可视化·etl
RestCloud1 个月前
ETL常见的数据转换方式
数据仓库·mysql·etl·数据处理·数据集成工具·集成平台
一个java开发1 个月前
开源免费ETL工具==PYTHON实现
python·开源·etl