分页查询的几种方式及其适用场景

传统偏移量

即 LIMIT OFFSET,OFFSET 子句跳过的行仍需被扫描,数据量较大会存在性能问题。

适用于B端后台数据较小的场景。

基于游标

适用于具有唯一字段且单调的表结构,一般以自增主键id作为游标列。查询时带上上一次返回的cursor,查询第一页数据不用传,后续分页必传。如:select * from table where id < cursor limit 20 ,这将从cursor行开始扫描,大数据量下相较于传统偏移量方式表现更好,特别适合C端应用的滚动分页场景。

一种更好的方式是:查询时多查一条记录,用于判断是否还有更多数据,从而减少一次查询操作。

封装为一个通用的工具类

python 复制代码
class Paginator:
    def __init__(self, query):
        self.query = query
        self.data = None
​
    def paginate(self, page: int, page_size: int, max_per_page=None):
        """分页查询"""
        if page_size is None:
            page_size = 20
​
        if page is None or page <= 0:
            raise ValueError("page or page size is None!")
​
        if max_per_page and page_size > max_per_page:
            raise ValueError("per page size exceeded the max limit!")
​
        offset = page_size * (page - 1)
        self.data = self.query.slice(offset, offset + page_size).all()
        return self
​
    @property
    def total(self):
        return self.query.count()
​
    @property
    def items(self):
        return self.data
​
​
class ScrollPaginator(Paginator):
    """滚动分页(基于游标)"""
​
    def __init__(self, query: Query, model: db.Model):
        """
​
        :param query: 查询对象
        :param model: model对象
        """
        super().__init__(query)
        self.model = model
        self.data = []
        self.has_more = False
        self.last_score = None
​
    def paginate(
        self, last_score: Union[str, int], limit=20, max_limit=100, order_col="id", is_reversed=True
    ):
        """
        基于游标分页
        :param order_col: 排序字段名
        :param last_score: 查询列表中最后一项的id
        :param max_limit: 最大分页限制
        :param limit: 滚动步长,使用limit+1用于判断是否还有更多数据
        :param is_reversed: 按时间倒序
        :return:
        """
        if limit < 1:
            raise ValueError("limit must >= 1")
        if max_limit and limit > max_limit:
            raise ValueError("per page size exceeded the max limit!")
​
        if last_score:  # 非首次查询
            if is_reversed:
                filters = [getattr(self.model, order_col) < int(last_score)]
            else:
                filters = [getattr(self.model, order_col) > int(last_score)]
            self.query = self.query.filter(*filters)
​
        queryset = self.query.limit(limit + 1).all()
        if (length := len(queryset)) >= 1:
            if length > limit:
                self.data = queryset[:-1]
                self.has_more = True
                last = queryset[-2]
            else:
                self.data = queryset
                last = queryset[-1]
​
            self.last_score = getattr(last, order_col)
​
        return self
​
    @property
    def last(self):
        return self.last_score
​
    @property
    def more(self):
        return self.has_more

redis zset

见另一篇文章:juejin.cn/post/732933...

相关推荐
神奇小汤圆8 分钟前
阿里面试官:什么才是可工程化落地的RAG项目
后端
ZPYZTech20 分钟前
用 Wails + Go + Vue3 开发桌面软件,聊聊踩过的坑
后端
倔强的石头_39 分钟前
kingbase备份与恢复实战(七)—— 恢复演练与验收:从“能恢复”到“可交付预案”
数据库
满昕欢喜42 分钟前
第2章 SQL Server 2019服务器管理
数据库·sqlserver
giaz14n9X1 小时前
Redis 分布式锁进阶第五十一篇
数据库·redis·分布式
念越1 小时前
【数据库系统概论期末复习】第四章 数据库安全性重点与常考题整理
数据库·数据库系统概论
好家伙VCC1 小时前
区块链双向支付通道实战:从签名到结算
java·后端·区块链·asp.net
拾贰_C2 小时前
【mysql | windows | installation】 MySQL5.安装
数据库·windows·mysql
睡不醒男孩0308232 小时前
达梦数据安装详细步骤(包含CLup一键部署达梦数据库实例)
数据库·达梦·clup
真实的菜2 小时前
【无标题】Redis 从入门到精通(七):缓存设计与最佳实践 —— 穿透、击穿、雪崩与一致性终极指南
数据库·redis·缓存