目录
[准备阶段:基准锁定(割接前 T-15min)](#准备阶段:基准锁定(割接前 T-15min))
[验收阶段:对比复测(割接后 T+5min)](#验收阶段:对比复测(割接后 T+5min))
[(1)场景 A:验证通过](#(1)场景 A:验证通过)
[(2)场景 B:发现异常(紧急)](#(2)场景 B:发现异常(紧急))
适用场景:核心路由切换、链路迁移、防火墙割接等高风险操作。
准备阶段:基准锁定(割接前 T-15min)
建立"黄金基准"所有后续对比均以此为准,基准不准,验证无效。
(1)环境确认
测试源:核心业务服务器或关键汇聚节点。
测试目的端:公网高稳地址(推荐 114.114.114.114 或 223.5.5.5),严禁使用内网网关(易受策略影响)。
前置检查:确认测试机 CPU/内存负载正常,无其他大流量下载任务。
(2)执行"双命令"采样
打开终端,依次执行以下两条命令,禁止省略任何参数。
🪟 Windows 环境
:: 1. 路径指纹提取(-d: 不解析域名,纯IP显示,防DNS干扰)
tracert -d 114.114.114.114
:: 2. 质量基线采样(-n 50: 发送50个包,确保统计样本充足)
ping -n 50 114.114.114.114
🐧 Linux 环境
# 1. 路径指纹提取(-n: 不解析域名)
traceroute -n 114.114.114.114
# (若无traceroute,可用 mtr -n -c 10 114.114.114.114 替代)
# 2. 质量基线采样(-c 50: 发送50个包)
ping -c 50 114.114.114.114
(3)数据固化(必须执行)
命令结束后,立即全屏截图。文件命名
实施阶段:长连监控(割接窗口期)
目标:利用长连 Ping (Long-Ping) 捕捉毫秒级抖动,精确计算中断时长(MTTR)。
(1)启动长连监控
在割接指令下达前 1 分钟,开启独立终端窗口,执行长连命令。
纪律:此窗口全程禁止关闭、禁止最小化、禁止中断,直到收到"割接完成"指令。
🪟 Windows 长连命令
:: -t 参数表示无限循环发送,直到手动 Ctrl+C 终止
ping -t 114.114.114.114
右键标题栏 -> 属性 -> 布局,将"屏幕缓冲区大小"高度设为 9999,防止滚动日志丢失早期数据。
🐧 Linux 长连命令
# Linux 默认即为长连,直接运行即可
ping 114.114.114.114
若需自动保存日志以便后续分析,可使用重定向:
ping 114.114.114.114 | tee ping_log_$(date +%F).txt
(2)实时监控与异常判定
盯着滚动日志,按以下标准记录异常:
|------|---------------------------------------|---------------|-----------------------|
| 异常类型 | 现象特征 | 判定阈值 | 记录动作 |
| 硬中断 | 连续 请求超时 / Destination Unreachable | 连续 ≥3秒 不通 | 记录 开始时间 与 恢复时间,计算总时长。 |
| 软抖动 | 延迟数值剧烈跳变 | 延迟 > 基线 200% | 记录 最大延迟峰值 (Max RTT)。 |
| 间歇丢包 | 偶尔出现超时,随后恢复 | 1分钟内丢包 ≥2 次 | 记录发生时间点及频次。 |
(3)结束统计
收到"割接完成"通知后,在长连窗口按 Ctrl+C 终止,保存记录。
验收阶段:对比复测(割接后 T+5min)
验证网络是否"真恢复"(路径回切且质量达标),防止"假通"(走备用高延迟链路)。
(1)执行复测
收到完成指令后 5分钟内,重复第一阶段的"双命令"操作。
(2)"找茬式"比对表
将 PreCheck 与 PostCheck 截图并列,逐项核对。任意一项不达标即视为验证失败。
|----------------|-----------------------------|----------------------|------------------------|
| 比对维度 | 通过标准 (Pass) | 失败标准 (Fail & Alert) | 风险解读 |
| 路径指纹 (第一跳IP) | 完全一致 (字符级匹配) | IP 发生变更 | 路由未回切主链路,可能走了高成本/低质备线。 |
| 平均延迟 (Avg RTT) | 波动 < 10% (例: 30ms → ≤33ms) | 波动 ≥ 10% 或 翻倍 | 链路拥塞、绕路或设备性能瓶颈。 |
| 丢包率 (Loss) | 0% | > 0% | 接口错包、带宽不足或链路劣化。一票否决。 |
| 路由跳数 (Hops) | 基本一致 (±1跳) | 跳数显著增加 (>2跳) | 路径迂回,增加了故障点。 |
汇报模板(标准化输出)
验证结束后 3分钟内,在指挥群发送结论。拒绝模糊描述,直接填空。
(1)场景 A:验证通过
【 ✅ 验证通过】[节点名称] 割接复测正常
路径一致性:第一跳 IP [192.168.x.x] 无变化,路由已回切。
质量指标:
延迟:[32]ms (割接前 [30]ms),波动 [6.7]%,正常。
丢包:0%。
中断统计:长连监控显示中断 [45] 秒,符合预期。
附件:PreCheck.png, PostCheck.png, DuringCheck.png
(2)场景 B:发现异常(紧急)
【 🚨 异常告警】[节点名称] 割接复测失败!
路由未回切:第一跳由 [旧IP] 变为 [新IP]。
延迟飙升:由 [30]ms 升至 [150]ms。
出现丢包:丢包率 [5]%。
长连数据:中断时长 [XX] 秒,最大延迟 [XXX]ms。
附件:对比截图及长连日志。
注意事项
数据真实性:截图必须包含完整的命令行输出和系统时间。严禁 P 图、严禁只截局部。
时效性红线:割接后复测必须在 5-10 分钟内 完成。超过此时限,网络自愈机制可能掩盖真实问题,数据失效。
工具自检:动手前务必确认 traceroute (Linux) 或 tracert (Win) 命令可用,避免临阵磨枪。
禁 Ping 处理:若第一跳设备配置了禁 Ping (*),自动顺延至第二跳作为路径指纹基准,逻辑不变。
长连防断:对于长时间割接(>30分钟),Windows 用户需注意电源管理设置,防止休眠导致长连中断。