SQL如何快速提取分组中最晚时间点数据_结合窗口函数实现

用 ROW_NUMBER() 按组内时间倒序标号可精准取每组最新一条记录,避免 RANK()/DENSE_RANK() 因并列时间导致多返回、不可控等问题,且比 GROUP BY + MAX() 关联更可靠;需注意 NULL 处理、分区键一致性及排序稳定性。用 ROW_NUMBER() 按组内时间倒序标号核心思路是给每组数据按 created_at(或你的时间字段)降序排个名,取名次为 1 的那条。这比 GROUP BY + MAX() 再关联回原表更直接、也更可靠------后者在有并列最晚时间时可能漏数据。实操建议:确保时间字段不为空,否则 NULL 会被排到最后(ORDER BY xxx DESC 默认把 NULL 当最小值),导致标号错乱;可加 WHERE created_at IS NOT NULL 过滤分区键(PARTITION BY)必须和业务分组逻辑一致,比如按 user_id 分组就写 PARTITION BY user_id,别漏掉复合条件如 PARTITION BY tenant_id, user_id排序用 ORDER BY created_at DESC,如果时间精度到秒但存在微秒级差异,建议显式补上 , id DESC 防止窗口函数随机选行(尤其 PostgreSQL / MySQL 8.0+)SELECT * FROM ( SELECT *, ROW_NUMBER() OVER ( PARTITION BY user_id ORDER BY created_at DESC, id DESC ) AS rn FROM orders) t WHERE rn = 1;RANK() 和 DENSE_RANK() 什么时候不能替代 ROW_NUMBER()当同一组里有多条记录时间完全相同时,RANK() 会把它们全标为 1,接着跳到 3;DENSE_RANK() 也是全标 1,接着标 2。如果你只要一条"最晚记录",这两种函数会导致结果多于预期------尤其是做 UPDATE 或 INSERT SELECT 时容易重复写入。常见错误现象:本想每用户取一条最新订单,结果某用户有两条同秒创建的订单,RANK() 返回了两条,下游逻辑崩了用 DENSE_RANK() 后接 WHERE dr = 1,看似没问题,但实际无法控制哪条被保留,不同执行计划下结果不一致Oracle 中 RANK() 对 NULL 的处理和 ROW_NUMBER() 不同,混用易出错MySQL 5.7 或旧版 PostgreSQL 怎么办这些版本不支持窗口函数,硬上 ROW_NUMBER() 会报错 FUNCTION xxx does not exist 或直接语法失败。得换策略,但别用相关子查询(WHERE time = (SELECT MAX(...) FROM ...)),它在大数据量下极慢,且仍无法解决并列时间问题。 通义听悟 阿里云通义听悟是聚焦音视频内容的工作学习AI助手,依托大模型,帮助用户记录、整理和分析音视频内容,体验用大模型做音视频笔记、整理会议记录。

相关推荐
FreakStudio9 分钟前
硬件版【Cursor】?aily blockly IDE尝鲜封神,实战硬伤尽显
python·单片机·嵌入式·大学生·面向对象·并行计算·电子diy·电子计算机
测试员周周2 小时前
【Appium 系列】第06节-页面对象实现 — LoginPage 实战
开发语言·前端·人工智能·python·功能测试·appium·测试用例
2301_783848652 小时前
优化文本分类中堆叠模型的网格搜索性能:避免训练卡顿的实战指南
jvm·数据库·python
TE-茶叶蛋3 小时前
DBeaver 的Explain 执行计划,分析sql的性能
数据库·sql
CLX05053 小时前
如何安装Oracle 12c Cloud Control_OMS服务端组件与Agent部署
jvm·数据库·python
m0_617493944 小时前
PySide6 网络请求深度实测:从基础 API 调用到数据解析实战指南
数据库
知识汲取者4 小时前
每日一篇高频面试题系列之【MySQL 锁】
数据库·mysql
老纪4 小时前
SQL中如何查找特定的空值行:WHERE IS NULL深度解析
jvm·数据库·python
麦聪聊数据4 小时前
数据 API 平台选型:深度解读数据服务的四大关键技术与架构底座
数据库·sql
噜噜噜阿鲁~4 小时前
python学习笔记 | 10.0、面向对象编程
笔记·python·学习