GreenPlum/Cloudberry UDP数据连接及接收缓存

GreenPlum/Cloudberry UDP数据连接及接收缓存

GPDB/Cloudberry生产环境中,一般使用UDP连接在Segment之间进行数据发送和接收。执行计划在MPP架构下分布式执行时,一旦需要Motion算子传输数据,比如非分布键进行join时,就需要在segment之间传输数据。此时就用到了UDP连接,需要了解segment发送端和接收端绑定哪个IP和端口,从而知晓数据向哪里发送,接收端接收到数据后向哪里回复ACK告知数据收到了。同时发送端需要通过哪个socket发送,接收端需要通过哪个socket接收,发送缓存和接收缓存有多大等等这些问题都需要了解,才能帮助DBA在复杂的环境中调优接收队列长度等配置项,从而达到最优性能。

本文介绍UDP连接什么时候构建以及他们接收缓存和发送缓存是如何构建的。

1、构建UDP连接的流程

构建UDP连接的流程如下图所示:

1)客户端连接到master上时,master服务端会fork出一个进程提供服务,该进程作为QD会将执行计划分发给segment执行

2)Fork出的进程初始化时,通过cdb_setup函数绑定随机端口和IP。注意这里会随机绑定两个端口listenerPort和ICSenderPort

每个连接都有发送缓存和接收缓存,由gp_udp_bufsize_k控制,如果该参数为0,则默认使用2MB。当然这里仅是软件层的设置,具体设置多大还有结合操作系统层的设置,软件层设置超过操作系统层设置后,就用操作系统层的最大设置值:

3)QD通过initPlan函数向segment发送执行计划时,通过libpq作为一个客户端连接segment,segment会fork出一个进程作为QE为该执行计划服务。当然该QE进程初始化时也会调用cdb_setup绑定两个端口,生成两个socket,同时将listenerPort通过sendQEDetails发送给QD。QD将该端口保存到对应的segdbDesc->motionListener中,随后注册到slice表的CdbProcess链表的primaryProcessess中。

4)随后QD和QE都会调用SetupInterconnect完成连接的设置。如果该进程上执行的slice有子slice就需要创建对应接收连接结构,若有父slice就需要创建发送连接结构

5)作为接收端 ,需要得到子slice的大小,也就是子slice中有多少QE进程,就为每个QE进程创建对应的接收连接,同时连接的srcListenerPort设置为发送端QE的listener_portdsListenerPort为本进程的listener_port,此时连接的conn->peer不需要设置,接收数据后才会将对应发送端的ip和端口拷贝到该peer,从而向该目标发送ACK

6)作为发送端 ,需要得到父slice大小,也就是父slice有多少进程,本进程需要向这么多进程发送数据。为每个父端进程创建发送连接,连接的srcListenerPort设置为本进程的listener_portdsListenerPort为发送端QE的listener_por **t,**此时conn->peer需要设置为接收端的IP和listener_port,同时发送连接pEntry.txfd设置为ICSenderSocket。

2、发送和接收示意图

发送和接收使用的socket和端口如下图所示,ICSenderSocket用于发送数据和接收ACK,UDP_listenerFd用于接收数据和发送ACK,这样将发送数据和ACK分开,使用不同socket,简化接收和发送的处理逻辑,增加并发性能:

发送和接收流程如下图所示:

相关推荐
观无4 分钟前
Modbus RTU 与 Modbus TCP 温湿度采集
网络·网络协议·tcp/ip
空中海16 分钟前
3.4 状态同步与生命周期管理
android·网络
航Hang*18 分钟前
Windows Server 配置与管理——第7章:配置DNS服务器
运维·服务器·网络·windows·安全·虚拟化
xixixi7777722 分钟前
通信产业的“全维度加速”:从5G-A商用、6G冲刺到卫星互联网密集组网
大数据·网络·人工智能·ai·多模型
@insist1231 小时前
网络工程师-网络安全核心加密技术体系:对称 / 非对称加密、数字签名与证书全解析
网络·安全·web安全·网络工程师·软考·软件水平考试
盐真卿1 小时前
华为数通 | VRRP负载分担与网关冗余实验:主备切换+流量分流,企业高可用网络实战
网络·华为
014-code1 小时前
Redis 删除缓存失败怎么办?重试、死信、补偿的工程化方案
数据库·redis·缓存
晏宁科技YaningAI1 小时前
分布式通信系统的容错机制
网络协议·微服务·系统架构·gateway·信息与通信·paas
isyangli_blog1 小时前
4、sdn 网络性能的测试与验证
网络
qq_260241231 小时前
将盾CDN:网络安全情报共享的实践与挑战
网络·安全·web安全