窗口函数替代GROUP BY时必须显式声明ORDER BY,否则结果无序且不稳定;空OVER()会触发全表排序,嵌套窗口函数易致多次扫描,性能下降显著。窗口函数替代 GROUP BY + 子查询时,ORDER BY 必须显式声明很多同学把 ROW_NUMBER() 或 RANK() 套进子查询里,以为能直接"降维"替代分组聚合,结果发现结果乱序、重复或报错。根本原因是:窗口函数不保证输出顺序,除非你写明 ORDER BY 子句。常见错误现象:SELECT id, ROW_NUMBER() OVER (PARTITION BY category) FROM t ------ 缺少 ORDER BY,数据库可能按任意物理顺序编号,每次执行结果都可能不同。必须写成 ROW_NUMBER() OVER (PARTITION BY category ORDER BY created_at DESC)如果业务逻辑依赖"最新一条",ORDER BY 不能只靠主键或时间字段的默认索引,要显式指定且确保该列非空、有索引MySQL 8.0+ 和 PostgreSQL 支持,但旧版 MySQL(5.7)根本不支持窗口函数,别在生产环境硬套OVER () 空括号写法会触发全表排序,性能杀手写 COUNT(*) OVER () 看似只是加个总数列,但实际会让优化器对整张表做一次隐式排序(尤其在 PostgreSQL 中),即使你没写 ORDER BY。这是因为某些引擎把空 OVER 视为"全局窗口",而实现上依赖排序缓冲区。使用场景:需要每行都带总行数、最大值等聚合指标,但又不想多扫一遍表。PostgreSQL 中,改用 count(*) OVER () 配合 SELECT DISTINCT ON 或提前物化中间结果更稳SQL Server 可以用 OPTION (RECOMPILE) 让优化器感知参数变化,避免缓存低效执行计划如果只是要总行数,优先考虑先查 SELECT COUNT(*) FROM t,再 JOIN 回去------比窗口函数更可控嵌套窗口函数(如 ROW_NUMBER() OVER (ORDER BY ...) 套在 MAX() OVER (PARTITION BY ...) 里)容易触发多次扫描一个语句里出现多个不同 PARTITION BY 或不同 ORDER BY 的窗口函数,PostgreSQL 和 SQL Server 往往无法复用排序结果,会分别排序两次甚至三次。实测大表(千万级)下,耗时可能翻倍。 Fotor AI Image Generator Fotor 平台的 AI 图片生成器
相关推荐
Warson_L12 小时前
Python `Annotated` 与 LangGraph Reducer 学习笔记韩师傅12 小时前
海天线算法的前世今生韩师傅12 小时前
当你的甲方设备过烂,要如何快速出效果?Warson_L12 小时前
LangGraph的MessageState and HumanMessage韩师傅12 小时前
当你的甲方吐槽天空不够蓝,你应该如何应对Warson_L13 小时前
python的类&继承Warson_L13 小时前
类型标注/type annotationThreeS15 小时前
手搓MiniVLA全实战教程-一步一步用pytorch解释原理与思路金銀銅鐵17 小时前
[Python] 模 n 乘法的逆元计算器