案例1、客户报修:无法通过sdwan链路访问总部及其他分支机构的网络。
远程在电脑上执行命令:tracert -d 172.16.1.2(总部文件服务器)
核心交换机上连接着出口路由器和SD-WAN路由器,根据静态路由的盏,下一跳应该是sdwan才对,但是tracert命令显示,下一跳是出口路由器。
远程登录华为交换机(核心),看了一下路由表,应该是优先级的问题,所有请求全部从默认路由出去了,并不会走sd-wan链路。
删除现在有的默认路由
Undo ip route-static 0.0.0.0 0.0.0 192.168.10.1
重写默认路由,调整优先级
Ip route-static 0.0.0.0 0.0.0.0 192.168.10.1 perference 100
去总部和另外两个分支机构的静态路由,优先级是60,这样的话,电脑访问总部和分支机构的网络,就会从sd-wan出去了。
至此,故障解决,完全没碰SDWAN设备,至于为什么路由优先级变了,那我就不知道了,无非就是调整配置的时候没细致吧。
案例2、客户报修:无法通过sdwan链路访问部分设备。
远程登录客户的设备,发现是用爱快路由器的SD-WAN组网,公益版,一共就两个节点,运行状态"已开启",在线设备数量:2,链路质量:优,能有啥问题?没毛病啊。
但是,客户显然不会没事找茬,所以,问题肯定是有的。
点击"管理",点击路由节点后面的"设置",马上就猜到问题所在了。
"本地路由通告"未开启,想来是一端增加了网段,没能通告给对方网络,那当然就无法访问了。
点击就开启了通告,顺便再看了看路由器里面的路由表和回程路由,都没什么问题,备份路由配置文件后,通知客户测试。
客户反馈已经能连接无端设备,表示故障解决。
**案例3、**SD-WAN链路经常突发性跑满,但又不是真实业务流。
客户报修:SD-WAN链路经常满载,但是查的时候,并没有发现真实的业务数据流有多大,甚至根本就没有真实的业务数据注。
某外企,防火墙上有两链路,一条是普通的宽带,用于日常上网;另外一条是SD-WAN,连接到广州总部,然后经广州连接国外,广州那边根据实际的业务需要,限制为10兆宽带。
正常情况下,真实的业务数据流,跑不满10兆,但是经常全部跑满,某天排查故障的时候,中断了正常的业务,链路还是跑满,简直不可理喻。
广州和苏州两地的IT,抓了半天的包,又分析了半天,也没什么结果。
我听了也直接晕,感觉很没道理,无从着手,关键是你根本就不知道,它什么时候抽风。
用于SD-WAN连接的设备,也是爱快路由,征得广州IT总监的同意后,我就在我的Zabbix添加了这台爱快路由,用于监测流量,跑到80%时以邮件形式告警。
几天后,突然收到邮件,提示流量达到限速的90%,赶紧远程登录设备,看是哪台设备。