PgSQL-执行器机制-Unique算子

PgSQL-执行器机制-Unique算子

PgSQL中输出去重的元组有多种方法,比如通过HashAgg或者GroupAgg。这里我们介绍第三种方法,通过Unique算子来完成这个功能。当然语句上可以是:select distinct(id1) from t;

1、ExecUnique

执行器执行算子的函数都是ExecXXX,其中XXX代表某个算子。Unique算子的执行是由函数ExecUnqiue完成,当然这个函数执行的前提是Unique节点的子节点传来的元组是有序的,比如子节点是Sort算子。

执行逻辑比较简单:

php 复制代码
ExecUnique
  outerPlan = outerPlanState(node);//子计划节点
  resultTupleSlot = node->ps.ps_ResultTupleSlot;//返回的元组存在此处
  for (;;){//for循环找到最后一个重复的值
    slot = ExecProcNode(outerPlan);//从子节点拉取数据
    if (TupIsNull(slot)){//子节点拉取完
      return NULL;//执行结束
    }
    //总是返回第一个元组,第一个元组时resultTupleSlot为空
    if (TupIsNull(resultTupleSlot))
      break;
    //后面相同的记录进行Qual比较
    econtext->ecxt_innertuple = slot;
    econtext->ecxt_outertuple = resultTupleSlot;
    if (!ExecQualAndReset(node->eqfunction, econtext))
      break;//直到元组不同时结束循环
  }
  //将获取的元组拷贝到resultTupleSlot中并返回
  return ExecCopySlot(resultTupleSlot, slot);

1)获取第一个元组时,node->ps.ps_ResultTupleSlot中没有数值,即为NULL

2)从子节点拉取一个元组值,此时直接中断循环,将该元组值赋值给node->ps.ps_ResultTupleSlot并返回

3)再次迭代进入ExecUnique函数,node->ps.ps_ResultTupleSlot仍旧是上次保存的元组值,不为空。For循环从子节点再拉取一个元组值,需要和上次保存的值进行比较,若相同则继续循环拉取下个值进行比较,直到和node->ps.ps_ResultTupleSlot值不相等

4)退出循环后,将下一组的第一个值保存到node->ps.ps_ResultTupleSlot返回。

这样就完成了数值的去重,这里重申下,使用ExecUnique的前提是子节点的元组是有序的。

2、ExecQualAndReset

看下实现的关键函数ExecQualAndReset,该函数通过表达式计算完成数值比较。

表达式的计算步骤为ExprState *eqfunction。由函数ExecInitUnique进行初始化:

相关推荐
橙子家1 天前
浏览器缓存之【身份与会话管理】:Cookies 和 Private state tokens
前端
To_OC1 天前
LC 49 字母异位词分组:想到哈希表很简单,选对 key 才是精髓
javascript·算法·leetcode
最新资讯动态1 天前
HDC 2026 | 对话鲸鸿动能:存量时代,品牌如何夺回营销“主动权”?
前端
最新资讯动态1 天前
游戏出海,从产品走向体系
前端
最新资讯动态1 天前
20人团队跑出百万DAU、大厂也来抢量:谁在鸿蒙生态跑出加速度
前端
最新资讯动态1 天前
千万开发者背后,鸿蒙商业化的B面
前端
爱勇宝1 天前
AI 时代:智商决定起点,情商决定走多远
前端·ai编程
kyriewen1 天前
用了半年 Claude Code 后,我尝试关掉它写了一周代码——结果比想象中严重
前端·javascript·ai编程
IT_陈寒1 天前
Vite的静态资源打包让我熬夜到三点,这坑千万别跳
前端·人工智能·后端
小bo波1 天前
使用Thread子类创建线程 VS 使用Runnable接口创建线程的区别
java·多线程·thread·并发编程·runnable