ORACLE 分页排序后的数据重复或缺失问题

今天一大早业务人员就反映说用户导出的订单数据,有好几单是重复,并且缺失了某一单。

第一步:查询数据表。表里实际数据没有重复,也没有缺失。那么就可能是导出过程出错了(因为是异步分页导出,所以最先怀疑这部分代码)

第二步:复现问题(实际上遇到生产问题第一步就是复现问题,但是我忘了.... )

第三步:检查异步分页 导出代码,简直是脏乱差一塌糊涂,但是运行没毛病(大多数代码都是如此,经过好几波素质不一程序员的蹂躏,再整洁的代码也会乱套)

第四步:检查查询语句

在第三步没问题之后,其实我就已经怀疑是分页问题了。

观察导出的数据,发现重复的记录都在两页分界的上下,比如记录A,它在第2页有一条记录,在第3页又有一条记录,但是不会在同一页出现两条相同记录。

导出分页是以 ORDER_DATE 字段排序,值都是 2025-01-13 00:00:00 这种,时分秒全是0,

如果是同一天的订单,那 ORDER_DATE 就都一样,排序相当于无效,每次查询结果的次序不固定,也就导致分页错乱了

On ROWNUM and Limiting Results 这篇文章中模拟了该问题

sql 复制代码
-- 创建表和数据
create table t as
select mod(level,5) id, 
	trunc(dbms_random.value(1,100)) data 
from dual
connect by level <= 10000;

-- 第1次查询
select * 
from (
	select a.*, rownum rnum
	from (
		select id, data
		from t
		order by id
	) a
	where rownum <= 150
)
where rnum >= 148;

-- 第2次查询
select * 
from (
	select a.*, rownum rnum
	from (
		select id, data
		from t
		order by id
	) a
	where rownum <= 151
)
where rnum >= 148;

会发现第1次和第2次查询结果中,rownum 相同的数据并不相同,说明 rownum 并不固定。

One important thing about using this pagination query is that the ORDER BY statement should order by something unique. If what you are ordering by is not unique, you should add something to the end of the ORDER BY to make it so.

分页查询中重要的事情是,ORDER BY 语句应该有唯一性,如果 order by 字段不唯一,那么你也应该加上一些东西最终让它唯一。

相关推荐
jnrjian4 天前
ORA-01017 查找机器名 用户名 以及library cache lock 参数含义
数据库·oracle
TTc_4 天前
oracle中的union和union all有什么区别?
数据库·oracle
山峰哥4 天前
吃透 SQL 优化:告别慢查询,解锁数据库高性能
服务器·数据库·sql·oracle·性能优化·编辑器
南 阳4 天前
Python从入门到精通day37
数据库·python·oracle
轩情吖4 天前
MySQL库的操作
android·数据库·mysql·oracle·字符集·数据库操作·编码集
脱发的老袁4 天前
【数据库】Oracle手动清理归档日志
数据库·oracle
jnrjian4 天前
Oracle 共享池 库缓存下的 Library Cache Lock
数据库·缓存·oracle
新缸中之脑5 天前
在Reddit上探索未满足的需求
数据库·oracle
light blue bird5 天前
产线多并发客户端指令操作场景组件
jvm·oracle·.net·winform
坐吃山猪5 天前
Neo4j04_数据库事务
数据库·oracle·neo4j