实验室服务器远程访问终极方案:SSH 反向隧道 + systemd 自动重连

🚀 实验室服务器远程访问终极方案:SSH 反向隧道 + systemd 自动重连

适用于:

  • 没有公网 IP 的实验室服务器
  • 想用 VSCode / SSH / Jupyter 远程开发
  • 希望稳定、自动重连、开机自启

🧠 一、问题背景

在很多实验室环境中:

  • GPU 服务器(内网机器)❌ 没有公网 IP
  • 无法直接 SSH ❌
  • 无法用 VS Code Remote ❌
  • Jupyter / TensorBoard 无法访问 ❌

但通常:

👉 可以访问外网(主动连接)


💡 二、核心思路(关键!)

我们引入一台有公网 IP 的云服务器作为"跳板机"。

text 复制代码
实验室服务器 C  --->  云服务器 B  <---  本地电脑 A
        	(主动连接)

核心技术:

👉 SSH 反向隧道(Reverse SSH Tunnel)

本质一句话:

让内网服务器主动"把自己暴露"到公网。


⚙️ 三、环境准备

1️⃣ 云服务器 B(阿里云等)

确保 SSH 配置允许端口转发:

bash 复制代码
sudo vim /etc/ssh/sshd_config

修改为:

bash 复制代码
AllowTcpForwarding yes
GatewayPorts yes

重启 SSH:

bash 复制代码
sudo systemctl restart sshd

2️⃣ 开放安全组端口

在云服务器控制台开放:

复制代码
TCP 12345

3️⃣ 实验室服务器 C

准备 SSH 私钥:

bash 复制代码
chmod 600 /root/.ssh/aliyun.pem

测试连接:

bash 复制代码
ssh -i /root/.ssh/aliyun.pem root@47.104.XXX.XXX

🔌 四、建立反向 SSH 隧道

在实验室服务器执行:

bash 复制代码
ssh -i /root/.ssh/aliyun.pem \
-o ServerAliveInterval=30 \
-o ServerAliveCountMax=3 \
-o ExitOnForwardFailure=yes \
-NR 0.0.0.0:12345:localhost:22 \
root@47.104.XXX.XXX

🔍 参数解释

参数 含义
-R 远程端口转发
12345 云服务器开放端口
localhost:22 映射到本机 SSH
-N 不执行命令
ServerAliveInterval 心跳保活
ExitOnForwardFailure 转发失败直接退出

🧪 五、验证连接

在云服务器 B:

bash 复制代码
ss -tln | grep 12345

应看到:

复制代码
0.0.0.0:12345

在本地电脑 A:

bash 复制代码
ssh -p 12345 用户名@47.104.XXX.XXX

连接成功 🎉


🔄 六、实现自动重连 + 开机自启(关键)

使用 systemd 创建服务。


1️⃣ 创建服务文件

bash 复制代码
sudo nano /etc/systemd/system/reverse-ssh.service

写入:

ini 复制代码
[Unit]
Description=Persistent reverse SSH tunnel
After=network-online.target
Wants=network-online.target

[Service]
Type=simple
User=root
ExecStart=/usr/bin/ssh \
  -i /root/.ssh/aliyun.pem \
  -o StrictHostKeyChecking=accept-new \
  -o ServerAliveInterval=30 \
  -o ServerAliveCountMax=3 \
  -o ExitOnForwardFailure=yes \
  -o TCPKeepAlive=yes \
  -N -R 0.0.0.0:12345:localhost:22 \
  root@47.104.XXX.XXX
Restart=always
RestartSec=10

[Install]
WantedBy=multi-user.target

2️⃣ 启动服务

bash 复制代码
sudo systemctl daemon-reload
sudo systemctl enable reverse-ssh
sudo systemctl start reverse-ssh

3️⃣ 查看状态

bash 复制代码
systemctl status reverse-ssh

💻 七、VS Code 远程连接

编辑本地 SSH 配置:

text 复制代码
~/.ssh/config
ssh 复制代码
Host lab
    HostName 47.104.XXX.XXX
    Port 12345
    User 实验室用户名

VS Code Remote SSH 直接连接:

复制代码
lab

🌐 八、扩展:Jupyter / TensorBoard / Web服务

修改 service:

ini 复制代码
ExecStart=/usr/bin/ssh \
  -i /root/.ssh/aliyun.pem \
  -o ServerAliveInterval=30 \
  -o ServerAliveCountMax=3 \
  -N \
  -R 0.0.0.0:12345:localhost:22 \
  -R 0.0.0.0:8888:localhost:8888 \
  -R 0.0.0.0:6006:localhost:6006 \
  root@47.104.XXX.XXX

对应服务

端口 服务
12345 SSH
8888 Jupyter
6006 TensorBoard

访问方式:

复制代码
http://47.104.XXX.XXX:8888

🧩 九、常见问题

❓ Q1:必须有公网 IP 吗?

❌ 不需要

✅ 只需要能访问外网


❓ Q2:为什么连接不上?

常见原因:

  • 没开 GatewayPorts yes
  • 安全组没放行端口
  • 端口被占用

❓ Q3:为什么端口是 127.0.0.1?

👉 没开启公网绑定

解决:

bash 复制代码
GatewayPorts yes

🔥 十、最终效果

你将获得:

能力 是否支持
SSH 远程
VS Code Remote
Jupyter
TensorBoard
HTTP 服务
自动重连
开机自启

🧠 总结

👉 systemd + SSH 反向隧道 = 实验室远程访问标准方案

相关推荐
倔强的石头10619 小时前
【Linux指南】基础IO系列(七):“一切皆文件” 底层实现 ——struct file 与统一 IO 接口的魔法
linux·运维·服务器
网络小白不怕黑19 小时前
1.1 VMware部署Rocky Linux 9 (GPT分区表,最小化安装)
linux·服务器·gpt
qq_2975746719 小时前
RocketMQ 系列文章(高级篇第 1 篇):高可用集群部署与运维监控实战指南
运维·rocketmq·java-rocketmq
克莱因35819 小时前
思科Cisco 静态NAT
服务器·网络·思科
恒创科技HK19 小时前
Windows香港云服务器新开注意事项(含远程连接教程)
运维·服务器·windows
满天星830357719 小时前
【Linux/多路复用】poll和epoll的使用
linux·服务器·c++·后端
waves浪游19 小时前
进程间通信(上)
linux·运维·服务器·开发语言·c++
环流_19 小时前
网络原理-TCP协议
服务器·网络·tcp/ip
61900833619 小时前
win wsl2 指定目录安装Ubuntu-24.04开启ssh sftp
linux·ubuntu·ssh
easy_coder19 小时前
一次部署阻塞的根因分析:自动提交与手动提交链路混用的代价
运维·云计算