【背景介绍】
某集团的制造工厂采购某J的AC+AP组建无线局域网供现场AGV使用,共三百多个点位。但在AGV运行过程中,网络出现丢包现象,导致小车无法顺利实现搬运。
现场拓扑如下:

核心上接AC控制器和上位机,下联汇聚交换机接入各个AP提供无线SSID服务
上位机/核心/汇聚等设备网段:10.22.12.0/24
AGV小车网段:10.22.13.0/24
【问题描述】
在测试中,电脑接入车间无线,在小车运行过程中,服务器长ping小车,服务器侧发生明显丢包,且丢包均发生在小车从库门穿过的时候。
服务器侧ping结果:
[1022.13.3的回复: ]来自
字节=32
时间=2.68ms
ping次数:1626
丢包次数:156
丢包率:9.59%
总平均时延4.68
【处理思路】
针对此类网络丢包问题,通常从以下几个方面考虑:
确认设备连接及拓扑是否存在问题;
检查设备运行过程中的异常情况,如漫游、端口变化等;
分析网络配置是否适配实际使用场景。
【排查分析】
第一步:分析丢包场景及设备连接
从测试结果来看,丢包主要发生在服务器侧,且与小车从库门穿过相关,初步判断问题可能出在有线部分。同时,AC中的漫游日志显示,小车运行过程中会连接到多个AP,而这些AP分别接在两台接入交换机上,存在小车的MAC在核心不同端口来回漂移的情况。
第二步:确定问题根源
基于上述情况,推测小车漫游后,连接核心的端口发生改变,但数据仍往原端口转发,导致约10s的断连,这就是造成丢包的原因。
【原理及解决方案】
针对该问题,在华为交换机上进行了如下配置:
关闭防mac漂移策略:
undo mac-address flapping detection;
配置MAC刷新ARP功能:
mac-address update arp;
关闭ARP表项检查功能:
undo arp anti-attack entry-check send-ackenable;
关闭ARP报文限速:
undo arp anti-attack rate-limitenable。
调整后再次测试,服务器侧ping测试结果如下:

小车移动过程中,最多在漫游时发生一次丢包,实际运行中无网络断连情况,问题得到解决。
发表回复