【背景介绍】
某网络环境中,DeviceA与DeviceB两台某W设备通过100GE接口直连,建立了OSPF邻居关系。近期网络中出现OSPF邻居频繁振荡的情况,导致路由反复收敛,业务流量转发受到严重影响。
组网结构如下:
经基础检查发现:
– 网络中无相关告警信息
– 业务故障时段与OSPF邻居状态变化时间高度吻合
【处理思路】
针对OSPF邻居振荡问题,通常需从链路状态、协议配置、设备硬件三个维度排查,处理思路如下:
检查设备日志中OSPF邻居状态变化记录及原因
分析物理链路的UP/DOWN情况
排查光模块、光纤等硬件是否存在异常
【排查分析】
第一步:查看DeviceA的OSPF日志
执行display logbuffer命令后,发现故障时段存在大量OSPF邻居DOWN的记录:

所有记录显示邻居DOWN的原因均为收到1-way hello报文。
第二步:同步核查DeviceB的日志
在相同时间点,DeviceB同样有OSPF邻居DOWN的记录:

其中明确提到主要原因为“Physical Interface State Change”(物理接口状态变化)。
第三步:验证物理接口状态
进一步查看DeviceB的物理接口日志,发现存在频繁的UP/DOWN记录:

由此确认,接口状态的不稳定导致了OSPF邻居的反复振荡:接口DOWN时邻居关系中断,接口UP后重新协商建立,进而引发对端设备的邻居状态也随之变化。
【原理及解决方案】
故障原因
光纤或光模块异常导致链路频繁UP/DOWN,使得OSPF邻居状态反复变化。当接口DOWN时,OSPF邻居关系中断;接口恢复UP后,设备重新发送HELLO报文进行协商,对端收到报文后会重置邻居状态,从而形成振荡。
解决方案
更换异常的光纤或光模块,恢复链路稳定性。
发表回复