Oracle 11g数据库与某个表的最新一笔记录进行关联

背景:最近在写Power BI的看板,而表中的数据都是上亿条记录的,各个表的关联关系非常复杂。而对于某些表,用户又只要看到最新的数据。

举个例子,比如A关联B表,正常来说看板是这样写的。

复制代码
select * from a
left join b
on a.xx = b.xx

但是实际上,用户只需要B表中,按某些字段划分的最新记录。

我就写成了这样:

复制代码
WITH C AS
 (SELECT B.*,
         ROW_NUMBER() OVER(PARTITION BY B.XXX,B.XXXXX ORDER BY B.INDATE DESC) AS rn
    FROM B )
SELECT *
FROM A
LEFT JOIN C
ON A.XX = C.XX AND C.RN = 1;

这个sql语句中用到了row_number()的窗口函数(Oracle内置函数),它根据B表中的XXX和XXXXX字段分组,然后根据B表中的INDATE进行了排序。

with c as 则是将结果集存放到内存中,建一个临时表c存储这些结果数据,然后a表直接跟c关联,c.rn = 1 就是最新的记录。

但是,由于我所在公司的数据量太大,这样跑的效率仍然很低。

于是,我改成了如下写法:

复制代码
WITH c AS (
    SELECT 
        b.xx,
        b.xxxxx,
        MAX(b.indate) AS indate
    FROM 
        scstadmin.b
    GROUP BY 
        b.xx,
        b.xxxxx
)
select * from a
left join b
on a.xx = b.xx 
and b.indate = (select indate from c where c.xx=b.xx and c.xxxxx= b.xxxxx);

这样写的好处是:

1.通过 WITH 子句 (c) 预先计算出每个 xx 最新的 indate,避免对整个表使用 ROW_NUMBER()。减少数据库对无用信息的计算次数,效率自然提升。

2.在主查询中将 b.indate 与子查询的最大时间进行匹配,从而仅选择最新的记录。

当然,语法优化只能优化一部分效率,最简单且有效的写法是对b表中的XX、XXXXX和indate字段做复合索引:(XX, XXXXX,INDATE DESC)。这可以极大地提高 ROW_NUMBER() 的性能。

一小段小记,希望可以帮到大家。

相关推荐
罗光记17 分钟前
《人工智能安全治理研究报告(2025年)发布
数据库·其他·百度·新浪微博
202321336054 刘36 分钟前
Linux常用命令分类整理
linux·运维·数据库
Q741_14738 分钟前
海致星图招聘 数据库内核研发实习生 一轮笔试 总结复盘(2) 作答语言:C/C++ 哈夫曼编码 LRU
c语言·数据库·c++·算法·笔试·哈夫曼编码·哈夫曼树
齐 飞1 小时前
快速删除mysql表中所有数据-TRUNCATE TABLE
数据库·mysql
想摆烂的不会研究的研究生1 小时前
每日八股——Redis(2)
数据库·redis·缓存
optimistic_chen1 小时前
【Redis系列】主从复制
linux·数据库·redis·缓存·中间件·命令行·主从复制
一个天蝎座 白勺 程序猿1 小时前
KingbaseES 处理 PL/SQL 运行时错误全解析:从异常捕获到异常处理的实践指南
数据库·sql·oracle·kingbasees
leo_2321 小时前
表&表结构--SMP(软件制作平台)语言基础知识之三十三
数据库·开发工具·表结构·smp(软件制作平台)·应用系统
C***11501 小时前
Spring TransactionTemplate 深入解析与高级用法
java·数据库·spring
+VX:Fegn08952 小时前
计算机毕业设计|基于springboot + vue建筑材料管理系统(源码+数据库+文档)
数据库·vue.js·spring boot·后端·课程设计