横扫SQL面试——流量与转化率分类

横扫SQL面试

在广告、电商、OTA(在线旅游)等业务中,常常需要对实体(如商品、酒店、用户)进行"流量 × 转化"的二维分析。

流量与转化率分类

输出:


思路:

text 复制代码
原始数据
   ↓
【打标阶段】→ 计算排名、是否有订单、总数等基础指标
   ↓
【分类阶段】→ 基于规则打标签(高流高转 / 高流低转 / 低流高转)
   ↓
【输出阶段】→ 过滤目标标签,返回结果

优雅:

核心思想:

不要在一行中完成所有逻辑。
把复杂问题拆解为"计算指标"和"应用规则"两个阶段代码更清晰

Spark窗口函数 :https://spark.apache.org/docs/latest/sql-ref-syntax-qry-select-window.html


给大家贴一个 测试用例,可以在本地跑一下试一下~

sql 复制代码
CREATE TABLE hotel (
    id INT,
    pv INT,
    cnt INT
);

INSERT INTO hotel VALUES
(1, 1000, 100),
(2, 950,  50),
(3, 900,  10),
(4, 800,  0),
(5, 700,  30),
(6, 600,  50),
(7, 500,  10),
(8, 400,  5),
(9, 300,  0),
(10, 200,  20);

相关推荐
大树8812 小时前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
大志哥12312 小时前
ES和Logstash日志链路系统上线后遭遇切片爆炸(解决)
大数据·elasticsearch
果丁智能14 小时前
物联网智能锁赋能集中式住宿:身份核验与远程权限管控的全链路技术实践
大数据·人工智能·物联网·智能家居
ApacheSeaTunnel14 小时前
实战演示 | 基于 Apache SeaTunnel 与 Apache DolphinScheduler 实现 MySQL 到 Doris 离线定时增量同步
大数据·mysql·开源·doris·数据集成·seatunnel·数据同步
weixin_3975740915 小时前
PDF复杂表格的1:1还原引擎:跨页表格自动拼接技术实战
大数据·人工智能·pdf
极光代码工作室15 小时前
基于数据仓库的电商数据分析平台
大数据·hadoop·python·spark·数据可视化
BD_Marathon15 小时前
SQL学习指南——视图
数据库·sql
秋名山码民15 小时前
Graph RAG 深度解析:从向量检索到知识推理的技术演进
大数据·人工智能·rag
2601_9620725516 小时前
李梦娇常识4600问|题库|打印版
sql·华为od·华为·c#·华为云·.net·harmonyos
Database_Cool_16 小时前
大规模数据分析降本指南:AnalyticDB Serverless 弹性架构实战
数据仓库·阿里云·架构·数据分析·serverless