【故障复盘】VS Code Remote-SSH 连接失败:ZeroTier 链路异常与 GLIBC 版本冲突双重坑
0. 前言
在进行远程开发时,VS Code Remote-SSH 是我们的核心生产力工具。但在复杂的组网环境(如 ZeroTier)和老旧服务器(如 Ubuntu 18.04)下,常会遇到"昨天还好好的,今天突然连不上"的情况。
今天在 macOS (arm64) 上通过 VS Code Insiders 连接课题组服务器时,经历了一场从"底层链路不通"到"服务挂死"再到"版本不兼容"的排查之旅。在此记录复盘,希望能帮到遇到类似问题的同学。
1. 现象描述
阶段一:主机不可达 (Host is down)
VS Code 报错:
connect to host 10.164.xxx.xxx port 2025: Host is down
UnparsableOutput
命令行验证:
执行 ssh -v -p 2025 10.164.xxx.xxx 同样卡在 Connecting...。这说明问题出在底层网络链路,而非 VS Code 插件本身。
阶段二:连接被拒绝 (Connection Refused)
在修复网络链路后,报错发生了变化:
ssh: connect to host 10.164.xxx.xxx port 2025: Connection refused
这说明:TCP 包能到达远端,但远端没有 SSH 服务在监听目标端口。
2. 深度排查与修复过程
Step 1:定位虚拟网组网异常 (ZeroTier)
由于连接依赖 ZeroTier 虚拟局域网,首先在本机检查节点状态:
bash
sudo zerotier-cli info
# 关键结果:200 info ... OFFLINE
原因: 本机 ZeroTier 客户端一度处于离线状态。
修复: 重启 ZeroTier 服务并等待状态更新为 ONLINE。
Step 2:修复远端 SSH 服务
网络恢复后依然 Refused。通过其他跳板机进入该服务器检查服务状态:
bash
# 查看 SSH 服务状态
sudo systemctl status sshd
# 检查端口监听情况
ss -lntp | grep -E ':2025'
修复: 确认服务异常后,执行 sudo systemctl restart sshd 重启服务,连接恢复正常。
Step 3:隐藏的坑------GLIBC 版本不兼容
在连接另一台老服务器(Ubuntu 18.04)时,SSH 认证已成功,但 VS Code Server 启动失败:
text
This machine does not meet Visual Studio Code Server's prerequisites
find GLIBC >= v2.28.0 (but found v2.27.0)
发现: VS Code Insiders 对远端 glibc 要求更高(要求 v2.28+),而 Ubuntu 18.04 等老系统仅提供 v2.27,导致 Server 无法运行。
3. 最终可用方案
为了兼顾老旧服务器的稳定性,我最终采取了以下策略:
- 环境隔离 :
- 对于老旧系统(glibc 2.27),继续使用 VS Code 1.80 等稳定版,不使用 Insiders。
- 对于新服务器,使用最新版 VS Code 享受新功能。
- 排错优先级 :
- 始终遵循 "原生命令行 SSH -> 插件层" 的排查顺序。
4. 避坑清单:远程 SSH 排查万能手册
建议收藏以下命令,遇到连接问题按顺序自检:
A. 网络连通性 (Infrastructure)
bash
# 测试 Ping
ping -c 4 <remote-ip>
# 测试 TCP 端口是否开放
nc -vz -w 5 <remote-ip> 2025
# 强制详细模式连接(查看具体卡在哪一步)
ssh -vvv -p <port> <user>@<host>
B. 虚拟网状态 (ZeroTier)
bash
sudo zerotier-cli info
sudo zerotier-cli listnetworks
sudo zerotier-cli listpeers
C. 远端服务状态 (Service)
bash
sudo systemctl status sshd
sudo systemctl restart sshd
# 确认端口是否真的在监听
ss -lntp | grep -E ':22|:2025'
D. 兼容性检查 (Environment)
bash
# 检查远端 GLIBC 版本
ldd --version | head -n 1
5. 总结
- UnparsableOutput 通常是次生错误:不要被它迷惑,优先看前面的原始 SSH 报错。
- 版本不一定越新越好:在科研环境中,服务器系统往往较老且无法轻易升级,保留一个低版本且稳定的 VS Code 是很有必要的。
- 分层排查 :按照 网络层 -> 服务层 -> 软件兼容层 的逻辑,能解决 90% 的连接问题。