横扫SQL面试——流量与转化率分类

横扫SQL面试

在广告、电商、OTA(在线旅游)等业务中,常常需要对实体(如商品、酒店、用户)进行"流量 × 转化"的二维分析。

流量与转化率分类

输出:


思路:

text 复制代码
原始数据
   ↓
【打标阶段】→ 计算排名、是否有订单、总数等基础指标
   ↓
【分类阶段】→ 基于规则打标签(高流高转 / 高流低转 / 低流高转)
   ↓
【输出阶段】→ 过滤目标标签,返回结果

优雅:

核心思想:

不要在一行中完成所有逻辑。
把复杂问题拆解为"计算指标"和"应用规则"两个阶段代码更清晰

Spark窗口函数 :https://spark.apache.org/docs/latest/sql-ref-syntax-qry-select-window.html


给大家贴一个 测试用例,可以在本地跑一下试一下~

sql 复制代码
CREATE TABLE hotel (
    id INT,
    pv INT,
    cnt INT
);

INSERT INTO hotel VALUES
(1, 1000, 100),
(2, 950,  50),
(3, 900,  10),
(4, 800,  0),
(5, 700,  30),
(6, 600,  50),
(7, 500,  10),
(8, 400,  5),
(9, 300,  0),
(10, 200,  20);

相关推荐
武子康44 分钟前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康1 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天1 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
武子康3 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
武子康4 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP5 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库5 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
AI周红伟5 天前
周红伟:智能体全栈构建实操:OpenClaw部署+Agent Skills+Seedance+RAG从入门到实战
大数据·人工智能·大模型·智能体
B站计算机毕业设计超人5 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法
计算机程序猿学长5 天前
大数据毕业设计-基于django的音乐网站数据分析管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)
大数据·django·课程设计