横扫SQL面试——流量与转化率分类

横扫SQL面试

在广告、电商、OTA(在线旅游)等业务中,常常需要对实体(如商品、酒店、用户)进行"流量 × 转化"的二维分析。

流量与转化率分类

输出:


思路:

text 复制代码
原始数据
   ↓
【打标阶段】→ 计算排名、是否有订单、总数等基础指标
   ↓
【分类阶段】→ 基于规则打标签(高流高转 / 高流低转 / 低流高转)
   ↓
【输出阶段】→ 过滤目标标签,返回结果

优雅:

核心思想:

不要在一行中完成所有逻辑。
把复杂问题拆解为"计算指标"和"应用规则"两个阶段代码更清晰

Spark窗口函数 :https://spark.apache.org/docs/latest/sql-ref-syntax-qry-select-window.html


给大家贴一个 测试用例,可以在本地跑一下试一下~

sql 复制代码
CREATE TABLE hotel (
    id INT,
    pv INT,
    cnt INT
);

INSERT INTO hotel VALUES
(1, 1000, 100),
(2, 950,  50),
(3, 900,  10),
(4, 800,  0),
(5, 700,  30),
(6, 600,  50),
(7, 500,  10),
(8, 400,  5),
(9, 300,  0),
(10, 200,  20);

相关推荐
武子康1 小时前
大数据-101 Spark Streaming 有状态转换详解:窗口操作与状态跟踪实战 附多案例代码
大数据·后端·spark
expect7g2 小时前
COW、MOR、MOW
大数据·数据库·后端
武子康17 小时前
大数据-98 Spark 从 DStream 到 Structured Streaming:Spark 实时计算的演进
大数据·后端·spark
阿里云大数据AI技术17 小时前
2025云栖大会·大数据AI参会攻略请查收!
大数据·人工智能
代码匠心20 小时前
从零开始学Flink:数据源
java·大数据·后端·flink
Lx3521 天前
复杂MapReduce作业设计:多阶段处理的最佳实践
大数据·hadoop
武子康1 天前
大数据-100 Spark DStream 转换操作全面总结:map、reduceByKey 到 transform 的实战案例
大数据·后端·spark
expect7g1 天前
Flink KeySelector
大数据·后端·flink
阿里云大数据AI技术2 天前
StarRocks 助力数禾科技构建实时数仓:从数据孤岛到智能决策
大数据
Lx3522 天前
Hadoop数据处理优化:减少Shuffle阶段的性能损耗
大数据·hadoop