PostgreSQL archive_command 场景下的 postgres 免密 SSH 配置与排查实录

一、背景说明

生产环境中,PostgreSQL 的归档配置如下:

复制代码
archive_command = 'rsync -a %p postgres@10.1.1.2:/var/lib/pgsql/archive/%f'

关键特征:

  • 使用 postgres 用户

  • 通过 rsync + ssh

  • 每个 WAL 段一次独立连接

  • 无交互(必须免密)

为了复现并分析 rsync/ssh 在该模型下的性能上限,我在两台新服务器上搭建了等价环境:

角色 IP 说明
A(发送端) 192.168.1.167 模拟主库,执行 archive_command
B(接收端) 192.168.1.240 模拟归档机
Jumpserver -- 仅用于人工登录,不参与运行时链路

⚠️ 注意

archive_command 运行时是 A → B 直连不会经过 jumpserver,jumpserver 仅用于"人工运维操作"。


二、目标

实现:

复制代码
A 上的 postgres 用户
→ 通过 SSH 免密
→ 直连 B 上的 postgres 用户
→ 执行 rsync

三、免密登录配置步骤

1️⃣ A 上生成 postgres 用户的 SSH key

复制代码
sudo -u postgres -i
echo $HOME
# /var/lib/pgsql

mkdir -p ~/.ssh
chmod 700 ~/.ssh

ssh-keygen -t ed25519 -N '' -f ~/.ssh/id_ed25519

生成:

  • /var/lib/pgsql/.ssh/id_ed25519

  • /var/lib/pgsql/.ssh/id_ed25519.pub


2️⃣ 通过 jumpserver 登录到 B,注入公钥

由于 B 无密码、只能通过 jumpserver 登录,无法使用 ssh-copy-id,只能手工注入。

在 B 上:

复制代码
sudo -u postgres -i

mkdir -p ~/.ssh
chmod 700 ~/.ssh

cat >> ~/.ssh/authorized_keys <<'EOF'
ssh-ed25519 AAAAC3... postgres@ip-192-168-1-167
EOF

chmod 600 ~/.ssh/authorized_keys
exit

3️⃣ 修复 SELinux 上下文(非常关键)

B 上执行:

复制代码
restorecon -Rv /var/lib/pgsql/.ssh

输出示例:

复制代码
Relabeled /var/lib/pgsql/.ssh to ssh_home_t
Relabeled /var/lib/pgsql/.ssh/authorized_keys to ssh_home_t

如果跳过这一步,在 SELinux Enforcing 的系统上,免密会"看起来都对但就是不生效"。


四、问题出现:A 连接 B 卡住

在 A 上验证免密:

复制代码
sudo -u postgres ssh -o BatchMode=yes postgres@192.168.1.240 "echo OK"

现象:

  • 命令卡住,无输出

  • 不报权限错误

  • 不提示密码


五、排查过程(关键)

1️⃣ 使用 ssh 调试模式定位阶段

复制代码
sudo -u postgres ssh -vvv postgres@192.168.1.240

输出停留在:

复制代码
debug1: Connecting to 192.168.1.240 [192.168.1.240] port 22.

👉 说明:连接卡在 TCP 层,尚未进入 SSH 协议


2️⃣ 验证端口连通性

复制代码
nc -vz 192.168.1.240 22

结果:连接失败


3️⃣ 结论定位

  • jumpserver 能连 B

  • A → B 22 端口不通

  • SSH 尚未进入认证阶段

👉 根因:安全组 / 防火墙未放通 A → B 的 22 端口


4️⃣ 修复

在云平台安全组中:

  • 放通 192.168.1.167 → 192.168.1.240:22

六、修复后验证

再次在 A 上执行:

复制代码
sudo -u postgres ssh -o BatchMode=yes postgres@192.168.1.240 "echo OK"

输出:

复制代码
OK

免密登录成功 🎉


八、Checklist(30 秒自检版)

  • A → B 的 22 端口是否放通

  • postgres home 权限是否 700

  • authorized_keys 权限是否 600

  • SELinux context 是否为 ssh_home_t

  • postgres 是否允许 ssh 登录

相关推荐
only_Klein2 小时前
postgresql-repmgr-pgpool
数据库·postgresql·高可用
難釋懷2 小时前
Redis分布式锁误删情况说明
数据库·redis·分布式
dblens 数据库管理和开发工具2 小时前
开源向量数据库比较:Chroma, Milvus, Faiss,Weaviate
数据库·开源·milvus·faiss·chroma·weaviate
草莓熊Lotso4 小时前
Linux 基础 IO 初步解析:从 C 库函数到系统调用,理解文件操作本质
linux·运维·服务器·c语言·数据库·c++·人工智能
Cx330❀4 小时前
从零实现Shell命令行解释器:原理与实战(附源码)
大数据·linux·数据库·人工智能·科技·elasticsearch·搜索引擎
岁岁种桃花儿10 小时前
MySQL从入门到精通系列:InnoDB记录存储结构
数据库·mysql
jiunian_cn12 小时前
【Redis】hash数据类型相关指令
数据库·redis·哈希算法
冉冰学姐12 小时前
SSM在线影评网站平台82ap4(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·ssm框架·在线影评平台·影片分类
知识分享小能手13 小时前
SQL Server 2019入门学习教程,从入门到精通,SQL Server 2019数据库的操作(2)
数据库·学习·sqlserver