news 2026/2/10 2:38:56

PostgreSQL archive_command 场景下的 postgres 免密 SSH 配置与排查实录

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
PostgreSQL archive_command 场景下的 postgres 免密 SSH 配置与排查实录

一、背景说明

生产环境中,PostgreSQL 的归档配置如下:

archive_command = 'rsync -a %p postgres@10.1.1.2:/var/lib/pgsql/archive/%f'

关键特征:

  • 使用postgres 用户

  • 通过rsync + ssh

  • 每个 WAL 段一次独立连接

  • 无交互(必须免密)

为了复现并分析 rsync/ssh 在该模型下的性能上限,我在两台新服务器上搭建了等价环境:

角色

IP

说明

A(发送端)

192.168.1.167

模拟主库,执行 archive_command

B(接收端)

192.168.1.240

模拟归档机

Jumpserver

仅用于人工登录,不参与运行时链路

⚠️注意

archive_command 运行时是A → B 直连不会经过 jumpserver,jumpserver 仅用于“人工运维操作”。


二、目标

实现:

A 上的 postgres 用户 → 通过 SSH 免密 → 直连 B 上的 postgres 用户 → 执行 rsync

三、免密登录配置步骤

1️⃣ A 上生成 postgres 用户的 SSH key

sudo -u postgres -i echo $HOME # /var/lib/pgsql mkdir -p ~/.ssh chmod 700 ~/.ssh ssh-keygen -t ed25519 -N '' -f ~/.ssh/id_ed25519

生成:

  • /var/lib/pgsql/.ssh/id_ed25519

  • /var/lib/pgsql/.ssh/id_ed25519.pub


2️⃣ 通过 jumpserver 登录到 B,注入公钥

由于B 无密码、只能通过 jumpserver 登录,无法使用 ssh-copy-id,只能手工注入。

在 B 上:

sudo -u postgres -i mkdir -p ~/.ssh chmod 700 ~/.ssh cat >> ~/.ssh/authorized_keys <<'EOF' ssh-ed25519 AAAAC3... postgres@ip-192-168-1-167 EOF chmod 600 ~/.ssh/authorized_keys exit

3️⃣ 修复 SELinux 上下文(非常关键)

B 上执行:

restorecon -Rv /var/lib/pgsql/.ssh

输出示例:

Relabeled /var/lib/pgsql/.ssh to ssh_home_t Relabeled /var/lib/pgsql/.ssh/authorized_keys to ssh_home_t

如果跳过这一步,在SELinux Enforcing的系统上,免密会“看起来都对但就是不生效”。


四、问题出现:A 连接 B 卡住

在 A 上验证免密:

sudo -u postgres ssh -o BatchMode=yes postgres@192.168.1.240 "echo OK"

现象:

  • 命令卡住,无输出

  • 不报权限错误

  • 不提示密码


五、排查过程(关键)

1️⃣ 使用 ssh 调试模式定位阶段

sudo -u postgres ssh -vvv postgres@192.168.1.240

输出停留在:

debug1: Connecting to 192.168.1.240 [192.168.1.240] port 22.

👉说明:连接卡在 TCP 层,尚未进入 SSH 协议


2️⃣ 验证端口连通性

nc -vz 192.168.1.240 22

结果:连接失败


3️⃣ 结论定位

  • jumpserver 能连 B

  • A → B22 端口不通

  • SSH 尚未进入认证阶段

👉根因:安全组 / 防火墙未放通 A → B 的 22 端口


4️⃣ 修复

在云平台安全组中:

  • 放通 192.168.1.167 → 192.168.1.240:22


六、修复后验证

再次在 A 上执行:

sudo -u postgres ssh -o BatchMode=yes postgres@192.168.1.240 "echo OK"

输出:

OK

免密登录成功 🎉


八、Checklist(30 秒自检版)

  • A → B 的 22 端口是否放通

  • postgres home 权限是否 700

  • authorized_keys 权限是否 600

  • SELinux context 是否为 ssh_home_t

  • postgres 是否允许 ssh 登录

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/9 7:40:50

2026-02-04 校⻓公开直播

一、开年解读 还有一点原因是最近发现有些股票确实挺好 一直强调淡化指数,关注板块; 三月之前由于特朗普会有来华预期,所以在访华之前中美博弈相关风险影响不会很大;

作者头像 李华
网站建设 2026/2/9 7:21:46

FX5U与JE-C伺服通讯:从入门到实战

FX5U和je-C伺服通讯案例和学习资料&#xff0c;绝无仅有。物超所值 最近在工作中接触到了三菱FX5U PLC与JE-C伺服电机的通讯配置&#xff0c;感觉这个过程既有趣又有挑战性。作为一个刚入行的工程师&#xff0c;一开始面对伺服系统时&#xff0c;确实有点摸不着头脑&#xff0…

作者头像 李华
网站建设 2026/2/9 7:46:45

阿里开源Qwen3-Coder-Next,80B参数仅激活3B的MoE顶尖编程助手

阿里刚刚开源了极强的小型 MoE 代码模型 Qwen3-Coder-Next。Qwen3-Coder-Next 以 800 亿总参数量和仅 30 亿的激活参数量&#xff0c;在代码生成与智能体任务中展示了极高的效能与潜力。尽管激活参数规模很小&#xff0c;在 SWE-Bench&#xff08;Verified、Multilingual、Pro&…

作者头像 李华
网站建设 2026/2/9 7:17:56

为什么你的年度计划只值两个字“要钱”?这份“自检清单”能救命

每年这个时候&#xff0c;数据团队最怕两件事&#xff1a; 第一&#xff0c;写年度计划时觉得自己是公司的核心大脑。 第二&#xff0c;讲年度计划时发现自己在老板眼里只是个成本中心。 你写了20页的“数仓重构、湖仓一体、AI底座”&#xff0c;老板翻完只问了一句&#xf…

作者头像 李华
网站建设 2026/2/9 6:55:33

高效索引之HNSW_SQ:如何同时兼顾RAG的速度、召回率与成本

在RAG在内的高维向量检索场景里&#xff0c;我们常常会陷入一个不可能三角&#xff1a;硬件不变的情况下&#xff0c;想要更快的查询速度&#xff0c;就得牺牲一部分召回率&#xff1b;如果想要召回率与速度同时兼顾&#xff0c;就得增加硬件预算……那么&#xff0c;有没有一种…

作者头像 李华