GaussDB（PostgreSQL）查询执行计划参数解析技术文档

定义：Index Cond 是指在索引扫描过程中，用于过滤索引条目的条件。
作用：它决定了数据库在读取索引时，哪些索引条目需要被检索，可以显著减少需要访问的索引条目数量，提高查询效率。
示例场景 ：如果查询条件为 dealer_team_id = ANY ('{1107,1114,1120,1121,1122}')，且 dealer_team_id 列上有索引，数据库会利用这个索引条件来快速定位到符合条件的索引条目，这个条件就是 Index Cond。

定义：Recheck Cond 是指在从索引中获取到堆表（实际数据存储的地方）的行指针后，再次对这些行进行条件过滤的条件。
作用：由于索引可能并不包含表中的所有列，而且索引条件可能使用了索引表达式或函数，所以即使行在索引层面满足条件，实际数据行可能并不完全满足查询的所有条件。此时，Recheck Cond 会在访问堆表时，对行进行再次检查，确保其符合所有查询条件。
示例场景 ：在查询中，除了 dealer_team_id 的条件外，还有 confirm_time 范围条件以及其他条件。数据库在通过 Index Cond 找到符合条件的索引条目后，会根据 Recheck Cond 再次检查这些行是否满足所有其他条件。

定义：Hash Cond 是哈希连接操作中的连接条件，用于指定两个表之间如何进行匹配。
作用：它定义了两个表之间进行哈希连接时的匹配条件，通常是两个表中用于连接的列的比较。
示例场景 ：Hash Cond: ((dma.dma_oprt_psi_item_detail.install_area_code)::text = "*VALUES*".column1) 表示将左表中的 install_area_code 列与右表中的 column1 列进行比较，以找到匹配的行。

定义：Hash Semi Join 是一种连接操作，用于从左表中选择与右表匹配的行。
工作原理 ：
- 构建哈希表 ：从右表（内表）读取数据并构建哈希表，哈希表的键是连接条件中指定的列。
- 探测哈希表 ：从左表（外表）读取数据，并在哈希表中查找匹配的键。
- 返回匹配行 ：对于左表中在哈希表中找到匹配键的行，将其返回作为结果。
适用场景 ：通常用于实现 EXISTS 或 IN 子查询。

归并排序（Merge Sort）
- 工作原理 ：基于分治策略。将数组分成两个子数组，分别对子数组进行排序，然后将排序后的子数组合并成一个有序数组。
- 时间复杂度 ：时间复杂度稳定为 O(nlogn)。
- 适用场景 ：适用于需要稳定排序的场景，或者当数据量较大且可以使用外部排序时。
堆排序（Heap Sort）
- 工作原理 ：利用堆数据结构，将数组组织成一个堆，然后反复从堆中取出最大（或最小）元素，并将其放到已排序区域的末端。
- 时间复杂度 ：时间复杂度为 O(nlogn)。
- 适用场景 ：适用于对时间复杂度要求严格且需要原地排序的场景。
插入排序（Insertion Sort）
- 工作原理 ：逐个将元素插入到已排序序列的适当位置。
- 时间复杂度 ：平均和最坏时间复杂度为 O(n2)。
- 适用场景 ：适用于小规模数据或数据基本有序的场景。
外部排序（External Sort）
- 工作原理 ：用于处理无法完全加载到内存的大规模数据。将数据分成多个块，对每个块进行内部排序，然后通过多路归并将排序后的块合并成最终的有序数据。
- 适用场景 ：适用于处理大数据量的排序操作，尤其是在数据量超过内存容量时。

通过理解这些参数和排序方法，可以更好地分析和优化数据库查询的性能。