openGauss 之索引回表

一. 前言

​ 在openGauss中如果表有索引信息,查询的谓词条件中又包含索引列,openGauss支持通过索引信息快速拿到需要访问元组的位置信息,然后直接到该位置上取出元组数据,称之为回表查询。如下所示,利用索引索引列id=55快速找到t111上对应元组的位置信息,然后通过位置信息拿到id为55的元组中所有列的数据。

本文通过走读openGauss的代码了解openGauss是怎样实现回表查询的。

二. Insert处理

​ 要想实现能快速回表,那么insert时需要保存索引和物理表的位置信息关系。openGauss的insert的入口在ExecInsertT中,保存索引列与元组的位置信息代码流程如下所示:

复制代码
ExecInsertT
    pTSelf = tableam_tops_get_t_self(result_relation_desc, tuple) // pTSelf保存着的是索引对应物理表元组位置信息
        relation->rd_tam_ops->tops_get_t_self(tup);
            HeapamTopsGetTSelf
                return tup->t_self   // 元组的物理表位置信息,即元组的t_self
    ExecInsertIndexTuples
        index_insert(..values, tupleid...)  // value为索引值,tupleid为对应物理表中元组位置信息
            btinsert_internal
                _bt_doinsert
                    _bt_insertonpg
                        _bt_pgaddtup(...itup...)  // 保存索引和其物理表中元组位置信息,itup为索引对应物理表元组位置信息
三. 回表查询

​ 回表查询是在访问索引时,能通过索引的条件拿到元组的tid信息,然后到对应的物理表的tid位置上直接读取元组信息,代码入口在IndexNext,代码流程如下所示:

复制代码
IndexNext
    scan_handler_idx_getnext
        index_getnext
            tid = index_getnext_tid(scan, direction);  // 此函数将会拿到索引对应的物理表的元组地址
                DatumGetBool(FunctionCall2(procedure, PointerGetDatum(scan), Int32GetDatum(direction)));
                    btgettuple
                        _bt_gettuple_internal
                            if (!BTScanPosIsValid(so->currPos))
                                res = _bt_first(scan, dir);   // 首次扫描会将根据谓词条件二分法查找索引,并且保持满足谓词条件的起始地址和条数
                            else
                                res = _bt_next(scan, dir);  // 初始化过之后,只要没有超过条数,直接返回下一条即可
                                    currItem = &so->currPos.items[so->currPos.itemIndex];
                                        scan->xs_ctup.t_self = currItem->heapTid;    // 回表元组的地址信息   
            IndexFetchTuple(scan)   // scan中保存有需要扫描元组的位置信息tid
                tableam_scan_index_fetch_tuple
                    HeapamScanIndexFetchTuple
                        heapam_index_fetch_tuple
                            ItemPointer tid = &scan->xs_ctup.t_self     // 对应上边索引返回的元组的地址信息
                                heap_hot_search_buffer    // 拿到包含所有列完整的元组数据
相关推荐
胚芽鞘68144 分钟前
关于java项目中maven的理解
java·数据库·maven
sun0077004 小时前
mysql索引底层原理
数据库·mysql
workflower7 小时前
MDSE和敏捷开发相互矛盾之处:方法论本质的冲突
数据库·软件工程·敏捷流程·极限编程
Tony小周7 小时前
实现一个点击输入框可以弹出的数字软键盘控件 qt 5.12
开发语言·数据库·qt
lifallen7 小时前
Paimon 原子提交实现
java·大数据·数据结构·数据库·后端·算法
TDengine (老段)8 小时前
TDengine 数据库建模最佳实践
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
Elastic 中国社区官方博客8 小时前
Elasticsearch 字符串包含子字符串:高级查询技巧
大数据·数据库·elasticsearch·搜索引擎·全文检索·lucene
Gauss松鼠会8 小时前
GaussDB应用场景全景解析:从金融核心到物联网的分布式数据库实践
数据库·分布式·物联网·金融·database·gaussdb
守城小轩9 小时前
Chromium 136 编译指南 - Android 篇:开发工具安装(三)
android·数据库·redis
尽兴-9 小时前
如何将多个.sql文件合并成一个:Windows和Linux/Mac详细指南
linux·数据库·windows·sql·macos