使用 libpq 的 COPY 协议维护自定义 PG 到 PG 连接

1. 引言

最近在我的开发工作中,需要在主节点上的 PG 后端与备节点上的其他 PG 后端之间维护一个自定义连接,以传输除现有 walsender/walreceiver 连接所传输的 WAL 数据之外的自定义数据。当然,我可以简单地创建一个新的独立后端并自己维护一个 socket 连接来传输自定义数据。从技术上讲,这是可行的,但也会带来一些问题。自定义连接的持久性、用户安全性、数据加密都需要额外处理。那么,为什么不直接使用 libpq 来为我们处理这些问题呢?本文将分享基于 PG14 使用 libpq COPY 协议维护自定义数据连接的经验。

2. 在 libpqwalreceiver.c 中创建新例程

该文件位于 src/backend/replication/libpqwalreceiver,并被编译为一个共享库 (.so),其中包含与 libpq 库相关的例程,这些例程允许 PG 后端在不将 libpq 编译到后端代码中的情况下使用 libpq。当 PG 后端进程需要使用 libpq 时,它需要先使用 load_file() 调用加载共享库。

我的需求很简单,我需要的新例程是 connectsendrecv,类似于普通的 socket 交互。我这里没有定义 close 函数,因为我希望只要主节点和备节点在运行,连接就保持持久。当其中一个节点退出时,连接会在检测到对端断开后自动终止。

3. 连接例程

与用于复制的 libpqrcv_connect 例程不同,我的情况简单得多。我只需要让备节点连接到主节点,因此我可以简单地重用备节点的 primary_conninfo 配置参数来建立连接。这将触发主节点派生一个新的后端进程来服务这个连接。代码片段如下所示:

我还将 libpq socket 连接设置为使用阻塞 socket,并将 asyncStatus 设置为 PGASYNC_COPY_BOTH,以表示我将进行双向数据通信。

4. 发送例程

我的发送例程与用于复制的 libpqrcv_send 例程完全相同。两者都使用 PQputCopyData 来向主节点发送数据流。为了保持一致性,我对其进行了重命名。代码片段如下:

5. 接收例程

与用于复制的 libpqrcv_recv 例程也非常相似,代码几乎完全相同。只是根据我的需求,连接需要是同步连接。这意味着我的备节点在等待主节点响应时会阻塞。为了使接收同步,我必须将 PQgetCopyData 的第三个参数传递为 0。因此,如果你对异步连接没有问题,这个例程的代码也可以与 libpqrcv_recv 完全相同。

6. 让备节点发送自定义数据

现在我们已经为自己的目的创建了 libpq 包装例程,我们可以让备节点向主节点发送一些自定义数据并等待响应。注意,我发送了一个字母'N',后面跟着三个示例自定义数据:100、200、300。Libpq COPY 使用字母 d 来表示 COPY 命令,而我们在这里做的是在 d 命令中包装我们自己的命令。

c 复制代码
StringInfoData buf_blk_request;
    WalReceiverConn *wrconn;
    int len;

    load_file("libpqwalreceiver", false);

    wrconn = netbuf_connect("dbname=postgres  host=127.0.0.1 port=5550");

    initStringInfo(&buf_blk_request);
    pq_sendbyte(&buf_blk_request, 'N');
    pq_sendint32(&buf_blk_request, 100);
    pq_sendint32(&buf_blk_request, 200);
    pq_sendint32(&buf_blk_request, 300);
    pq_flush();

    /* Send it */
    netbuf_send(wrconn, buf_blk_request.data, buf_blk_request.len);

    /* Read the data */
    len = netbuf_recv(wrconn, &tmp, &fd);
    if (len > 0)
    {
        /*
         * Something was received from primary
         */
    }

7. 让主节点接收自定义数据

当我们使用上述方法发送数据时,主节点的 postmaster 主循环将接收数据并决定如何处理。因为我们使用的是 COPY 协议,第一个字符是 d,而 src/backend/tcop/postgres.c 中已经有一个针对该字符的处理程序。因此,我们需要在 postgres.c 中的 d 处理程序下添加额外代码,以接收和处理备节点发送的数据,并在需要时提供响应。

c 复制代码
case 'd':           /* copy data */
        elog(DEBUG2, "copy data request received");
        int op;

        op = pq_getmsgbyte(&input_message);
        if (op == 'N')
        {
            StringInfoData buf_blk_reply;
            int data1, data2, data3;

            /* receive custom data here */
            data1 = pq_getmsgint(&input_message, 4);
            data2 = pq_getmsgint(&input_message, 4);
            data3 = pq_getmsgint(&input_message, 4);
            pq_getmsgend(&input_message);


            /* send another custom data back to standby here */
            pq_beginmessage(&buf_blk_reply, 'd');
            pq_sendint32(&buf_blk_request, 400);
            pq_sendint32(&buf_blk_request, 500);
            pq_sendint32(&buf_blk_request, 600);
            pq_endmessage(&buf_blk_reply);
            pq_flush();
        }
        break;

8. 总结

基于 libpq COPY,我创建了一个主节点与备节点之间的独立通信通道,可用于传输自定义数据,类似于通常处理普通 socket 的方式。这一切都基于 libpq 已支持的 COPY 协议,在该协议中,我们包装了自己的数据。在上述示例中,当备节点向主节点发送 100、200、300 时,主节点能够接收这些数据并响应 400、500、600。这个简单的示例可以扩展以支持您开发中可能需要的其他功能。使用 COPY 来实现我自己的目的可能不是最优雅的方式,但它对我来说是有效的。

相关推荐
Jacob02343 小时前
Python与PostgreSQL实战:打造实时地理空间数据处理与管理系统
javascript·python·postgresql
bulabulabula1 天前
基于 Apache Flink CDC 的 PostgreSQL 到 OpenSearch 实时数据同步方案
大数据·postgresql·flink
__风__4 天前
windows 上编译PostgreSQL
数据库·postgresql
白夜4 天前
PostgreSQL用户和权限的常用操作
postgresql
auspicious航6 天前
PostgreSQL 高可用与负载均衡
数据库·postgresql
吴声子夜歌6 天前
PostgreSQL——表的基本操作
数据库·postgresql
kobe_OKOK_6 天前
查看ubuntu server 的基本信息
数据库·ubuntu·postgresql
~央千澈~7 天前
MongoDB 从3.4.0升级到4.0.0完整指南实战-优雅草蜻蜓I即时通讯水银版成功升级-卓伊凡|bigniu
数据库·postgresql