GreenPlum/Cloudberry UDP数据连接及接收缓存

GreenPlum/Cloudberry UDP数据连接及接收缓存

GPDB/Cloudberry生产环境中,一般使用UDP连接在Segment之间进行数据发送和接收。执行计划在MPP架构下分布式执行时,一旦需要Motion算子传输数据,比如非分布键进行join时,就需要在segment之间传输数据。此时就用到了UDP连接,需要了解segment发送端和接收端绑定哪个IP和端口,从而知晓数据向哪里发送,接收端接收到数据后向哪里回复ACK告知数据收到了。同时发送端需要通过哪个socket发送,接收端需要通过哪个socket接收,发送缓存和接收缓存有多大等等这些问题都需要了解,才能帮助DBA在复杂的环境中调优接收队列长度等配置项,从而达到最优性能。

本文介绍UDP连接什么时候构建以及他们接收缓存和发送缓存是如何构建的。

1、构建UDP连接的流程

构建UDP连接的流程如下图所示:

1)客户端连接到master上时,master服务端会fork出一个进程提供服务,该进程作为QD会将执行计划分发给segment执行

2)Fork出的进程初始化时,通过cdb_setup函数绑定随机端口和IP。注意这里会随机绑定两个端口listenerPort和ICSenderPort

每个连接都有发送缓存和接收缓存,由gp_udp_bufsize_k控制,如果该参数为0,则默认使用2MB。当然这里仅是软件层的设置,具体设置多大还有结合操作系统层的设置,软件层设置超过操作系统层设置后,就用操作系统层的最大设置值:

3)QD通过initPlan函数向segment发送执行计划时,通过libpq作为一个客户端连接segment,segment会fork出一个进程作为QE为该执行计划服务。当然该QE进程初始化时也会调用cdb_setup绑定两个端口,生成两个socket,同时将listenerPort通过sendQEDetails发送给QD。QD将该端口保存到对应的segdbDesc->motionListener中,随后注册到slice表的CdbProcess链表的primaryProcessess中。

4)随后QD和QE都会调用SetupInterconnect完成连接的设置。如果该进程上执行的slice有子slice就需要创建对应接收连接结构,若有父slice就需要创建发送连接结构

5)作为接收端 ,需要得到子slice的大小,也就是子slice中有多少QE进程,就为每个QE进程创建对应的接收连接,同时连接的srcListenerPort设置为发送端QE的listener_portdsListenerPort为本进程的listener_port,此时连接的conn->peer不需要设置,接收数据后才会将对应发送端的ip和端口拷贝到该peer,从而向该目标发送ACK

6)作为发送端 ,需要得到父slice大小,也就是父slice有多少进程,本进程需要向这么多进程发送数据。为每个父端进程创建发送连接,连接的srcListenerPort设置为本进程的listener_portdsListenerPort为发送端QE的listener_por **t,**此时conn->peer需要设置为接收端的IP和listener_port,同时发送连接pEntry.txfd设置为ICSenderSocket。

2、发送和接收示意图

发送和接收使用的socket和端口如下图所示,ICSenderSocket用于发送数据和接收ACK,UDP_listenerFd用于接收数据和发送ACK,这样将发送数据和ACK分开,使用不同socket,简化接收和发送的处理逻辑,增加并发性能:

发送和接收流程如下图所示:

相关推荐
ACP广源盛139246256738 小时前
IX8024与科学大模型的碰撞@ACP#筑牢科研 AI 算力高速枢纽分享
运维·服务器·网络·数据库·人工智能·嵌入式硬件·电脑
Empty-Filled9 小时前
AI生成测试用例功能怎么测:一个完整实战案例
网络·人工智能·测试用例
码云数智-大飞10 小时前
本地部署大模型:隐私安全与多元优势一站式解读
运维·网络·人工智能
jinanwuhuaguo10 小时前
(第二十九篇)OpenClaw 实时与具身的跃迁——从异步孤岛到数字世界的“原住民”
前端·网络·人工智能·重构·openclaw
汤愈韬10 小时前
三种常用 NAT 的经典案例
网络协议·网络安全·security
等风来不如迎风去11 小时前
【win11】最佳性能:fix 没有壁纸,一直黑屏
网络·人工智能
Harvy_没救了11 小时前
【网络部署】 Win11 + VMware CentOS8 + Nginx 文件共享服务 Wiki
运维·网络·nginx
汤愈韬11 小时前
NAT Server 与目的Nat
网络·网络协议·网络安全·security
2401_8734794012 小时前
断网时如何实时判断IP归属?嵌入本地离线库,保障风控不中断
运维·服务器·网络
7ACE13 小时前
Wireshark TS | TLP 超时时间
网络·网络协议·tcp/ip·wireshark·tcpdump