故障案例:测试交换机的组播性能,组播业务启用2分钟后出现少量丢包

故障案例:测试交换机的组播性能,组播业务启用2分钟后出现少量丢包

https://support.huawei.com/enterprise/zh/doc/EDOC1000075592/be0a2d5

涉及产品和版本
所有版本的S系列交换机
组网情况
如图所示,Switch一端与组播服务器相连,一端与下挂用户相连。Switch上组播表项数目较多,现网测试单台设备的组播转发性能。

图片.png

现象描述
当接收组播报文的接口GE1/0/1和发送组播报文的接口GE1/0/2在同一个VLAN时,组播表项建立好后一般2分钟左右就开始出现少量丢包,然后是各个组开始随机丢弃。
如果将接口GE1/0/1和接口GE1/0/2划分为不同的VLAN,则没有出现丢包。
原因分析
用户网段中存在多个IGMP查询器,且IGMP查询器的查询间隔不一致,导致设备二层组播表项误老化。
操作步骤
(1)执行命令display cpu-defend statistics all查看上送CPU的报文统计,没有发现IGMP丢包计数;
(2)执行命令display multicast forwarding-table采集三层组播转发表项,表项的up-time为39分钟,说明三层表项中间断过;
(3)执行命令display igmp-snooping port-info verbose采集二层组播协议表项,出接口的up-time长短不一,有的时间很短,并且大部分出接口的超时时间expire-time快到5秒以后,才刚刚刷新;
(4)执行命令display igmp interface,发现IGMP的查询器没有选举在Switch上面,而是选在测试仪上面,再查看测试仪配置,发现测试仪的查询器间隔为125秒。

    由于设备二层组播默认查询间隔为60秒,所以二层组播超时时间为130秒,也就是说只有5秒的时间来刷新大量组播表项,此时设备收包处理不及时,则会导致表项误老化,从而出现随机丢包。

解决方法
将测试仪上的查询器功能关闭后,问题解决。
建议与总结
随机丢包问题大部分存在以下原因:
(1)IGMP协议报文受设备cpcar限制,出现丢包,从而导致表项误删除;
(2)网段内存在多个查询器,且查询器间隔不一致,导致表项误删除;
(3)流量突发,超过端口缓存处理能力,出现随机丢包;

因此应该按照前面定位过程中的方式一一去排查,从而确认根因。然后根据对应原因,结合网络部署来解决问题。


1、本站资源长期持续更新。
2、本资源基本为原创,部分来源其他付费资源平台或互联网收集,如有侵权请联系及时处理。
3、本站大部分文章的截图来源实验测试环境,请不要在生产环境中随意模仿,以免带来灾难性后果。

转载请保留出处:  www.zh-cjh.com珠海陈坚浩博客 » 故障案例:测试交换机的组播性能,组播业务启用2分钟后出现少量丢包

作者: cjh


手机扫一扫,手机上查看此文章:

一切源于价值!

其他 模板文件不存在: ./template/plugins/comment/pc/index.htm

未雨绸缪、居安思危!

数据安全、有备无患!

注意操作、数据无价!

一切源于价值!