目录
[1. 分治法(Divide and Conquer)](#1. 分治法(Divide and Conquer))
[2. 排除法(Elimination)](#2. 排除法(Elimination))
[1. 物理层排查(设备与线路)](#1. 物理层排查(设备与线路))
[2. 网络层诊断(协议与配置)](#2. 网络层诊断(协议与配置))
[3. 应用层排查(服务与策略)](#3. 应用层排查(服务与策略))
[4. 无线网络专项排查](#4. 无线网络专项排查)
一、排查方法论:分治法与排除法的结合
1. 分治法(Divide and Conquer)
原理 :将网络系统拆分为独立层级(物理层→网络层→应用层),逐层验证
典型场景:
- 客户端访问失败:验证本地网络 → 核心交换机 → 服务器端口 → 应用服务进程
- 服务端响应延迟:检查带宽占用 → TCP重传率 → 数据库连接池状态
2. 排除法(Elimination)
关键操作:
- 组件替换:用正常网线/交换机替换可疑设备(如级联端口频繁UP/DOWN时)
- 策略禁用 :临时关闭防火墙规则验证拦截误判(思科ASA使用
no access-list 101
删除ACL)
二、分层诊断实战手册
1. 物理层排查(设备与线路)
硬件检测三板斧
-
网线状态:
# 使用测线仪验证关键线路(如核心交换机与路由器级联线) cable-test interface gigabitethernet 0/0/1
-
设备指示灯:
状态 含义 处理建议 持续绿灯 正常 - 高频闪烁 广播风暴 启用端口风暴控制 storm-control broadcast level 80
红灯/熄灭 硬件故障 替换备用端口或设备 -
温度与电源:
- 核心交换机表面温度>50℃时,立即启用备用风扇模块
- 检查UPS日志:
show power-supply
(华为设备)
运维经验
思科设备使用
show log
查看端口UP/DOWN历史记录,华为设备用display logbuffer
定位异常事件
2. 网络层诊断(协议与配置)
地址冲突与路由验证
-
IP-MAC绑定检查:
arp -a # Windows查看ARP表 arp -n # Linux查看ARP表
- 发现同一IP对应多个MAC地址?立即用
arp -d
清除缓存并扫描全网段(推荐工具:Advanced IP Scanner)
- 发现同一IP对应多个MAC地址?立即用
-
路由追踪进阶技巧:
mtr -n 8.8.8.8 # 持续监测路由质量(替代传统tracert)[1](@ref)
https://example.com/mtr-demo.png
MTR输出解读:重点关注第3-5跳(本地ISP)与倒数2-3跳(目标ISP)的丢包率(Loss%)与延迟(Avg)
流量协议分析
-
Wireshark关键指标 :
异常现象 可能原因 解决方案 TCP重传率>5% 网络拥塞/链路质量差 使用QoS策略限流: policy-map LIMIT_BANDWIDTH
ARP广播包占比>30% ARP欺骗攻击 启用动态ARP检测(DAI): ip arp inspection vlan 10
3. 应用层排查(服务与策略)
服务端口检测
-
基础连通性验证:
telnet 10.1.1.100 80 # 测试HTTP服务 nc -zv 10.1.1.100 3306 # Linux测试MySQL端口
-
连接池深度分析:
netstat -an | grep TIME_WAIT | wc -l # 检查TIME_WAIT连接数
-
若TIME_WAIT超过1万,优化内核参数:
sysctl -w net.ipv4.tcp_tw_reuse=1 # 允许复用TIME_WAIT连接
-
安全策略陷阱
-
防火墙误拦截排查
show access-list 101 hit-count # 思科查看ACL命中次数 iptables -L -n -v # Linux检查规则匹配计数
4. 无线网络专项排查
环境干扰检测
-
信道优化策略:
频段 推荐信道 避坑指南 2.4GHz 1/6/11 避免相邻AP使用重叠信道 5GHz 149/153/157 避开雷达信道(52-64) -
AP负载管理:
- 单AP连接终端>30时,启用负载均衡:
client load-balancing enable
- 信号强度<-65dBm时,增加AP或调整天线方向
- 单AP连接终端>30时,启用负载均衡: