clickhouse查询使用order by和limit，不同limit查询出现重复数据问题【已解决】

山高终有顶，人行无尽头2024-12-25 20:03

简单来说就是表里有时间戳字段timestamp，我想当然的以为这个字段是唯一的，于是根据timestamp进行排序，分页查询，但是处理过程中发现，一直有重复数据处理。

经过排查发现是因为timestamp字段在数据库中并不是唯一的，也就是存在多行数据的timestamp字段相同的情况 。

于是改成使用uuid 排序就行了。

这种情况的根本原因是排序的不确定性：当多个行的排序键相同时，ClickHouse 无法保证它们在分页之间的顺序稳定。

ClickHouse 的 ORDER BY 是基于指定字段排序的。如果排序字段有重复值，ClickHouse 没有隐式的二级排序规则（除非你显式指定额外的列排序）。因此，在分页时，LIMIT 会随机选择结果集中的一部分行，这可能导致：

某些行出现在当前页的尾部。

由于排序的不确定性，这些行可能又被下一页再次选中。

优先考虑调整 ORDER BY 字段，确保其唯一性（推荐方案）