窗口函数替代GROUP BY时必须显式声明ORDER BY,否则结果无序且不稳定;空OVER()会触发全表排序,嵌套窗口函数易致多次扫描,性能下降显著。窗口函数替代 GROUP BY + 子查询时,ORDER BY 必须显式声明很多同学把 ROW_NUMBER() 或 RANK() 套进子查询里,以为能直接"降维"替代分组聚合,结果发现结果乱序、重复或报错。根本原因是:窗口函数不保证输出顺序,除非你写明 ORDER BY 子句。常见错误现象:SELECT id, ROW_NUMBER() OVER (PARTITION BY category) FROM t ------ 缺少 ORDER BY,数据库可能按任意物理顺序编号,每次执行结果都可能不同。必须写成 ROW_NUMBER() OVER (PARTITION BY category ORDER BY created_at DESC)如果业务逻辑依赖"最新一条",ORDER BY 不能只靠主键或时间字段的默认索引,要显式指定且确保该列非空、有索引MySQL 8.0+ 和 PostgreSQL 支持,但旧版 MySQL(5.7)根本不支持窗口函数,别在生产环境硬套OVER () 空括号写法会触发全表排序,性能杀手写 COUNT(*) OVER () 看似只是加个总数列,但实际会让优化器对整张表做一次隐式排序(尤其在 PostgreSQL 中),即使你没写 ORDER BY。这是因为某些引擎把空 OVER 视为"全局窗口",而实现上依赖排序缓冲区。使用场景:需要每行都带总行数、最大值等聚合指标,但又不想多扫一遍表。PostgreSQL 中,改用 count(*) OVER () 配合 SELECT DISTINCT ON 或提前物化中间结果更稳SQL Server 可以用 OPTION (RECOMPILE) 让优化器感知参数变化,避免缓存低效执行计划如果只是要总行数,优先考虑先查 SELECT COUNT(*) FROM t,再 JOIN 回去------比窗口函数更可控嵌套窗口函数(如 ROW_NUMBER() OVER (ORDER BY ...) 套在 MAX() OVER (PARTITION BY ...) 里)容易触发多次扫描一个语句里出现多个不同 PARTITION BY 或不同 ORDER BY 的窗口函数,PostgreSQL 和 SQL Server 往往无法复用排序结果,会分别排序两次甚至三次。实测大表(千万级)下,耗时可能翻倍。 Fotor AI Image Generator Fotor 平台的 AI 图片生成器
相关推荐
weelinking1 小时前
【产品】00_产品经理用Claude实现产品系列介绍一直不明飞行1 小时前
Java的equals(),hashCode()应该在什么时候重写2301_803934612 小时前
Go语言如何做网络爬虫_Go语言爬虫开发教程【指南】WL_Aurora2 小时前
Python爬虫实战(六):新发地蔬菜价格数据采集.盲敲代码的阿豪2 小时前
Python 入门基础教程(爬虫前置版)秋92 小时前
windows中安装redisweixin199701080162 小时前
[特殊字符] 智能数据采集:数字化转型的“数据石油勘探队”(附Python实战源码)Cosolar3 小时前
万字详解:RAG 向量索引算法与向量数据库架构及实战想唱rap3 小时前
IO多路转接之pollSeaTunnel3 小时前
AI 让 SeaTunnel 读源码和调试过时了吗?