检查接口出方向是否存在Discard计数
检查接口出方向是否存在Discard计数
https://support.huawei.com/enterprise/zh/doc/EDOC1000075592/82448e05
本节点内容也应该包含在“检查设备的接口状态”章节,但由于拥塞造成丢包的现网问题较多,所以在此单独介绍。
网络中,有时会出现在非常短的时间(毫秒级别)内收到非常多的突发数据,以至于瞬时突发速率达到平均速率的数十倍、数百倍,甚至超过端口带宽的现象。这种现象被称为微突发。网管设备或网络性能监控软件通常是基于比较长的时间(数秒到数分钟)计算网络实时带宽。在这种情况下,流量速率通常是一条比较平稳的曲线,如图9-3所示。
图9-3 宏观流量速率
但是,一秒钟对于一个高速收发数据包的接口来说是非常长的一个时间段。如果将数据更改为毫秒级进行观察,流量速率很可能是带锯齿的。如果锯齿突变很大,可以认为是微突发,如图9-4所示。
图9-4 微观流量速率
目前的运维手段很难监控到微突发,原因如下:
- 网管软件的数据统计依赖于设备数据的上报,且网管软件的轮询周期一般是分钟级别,计算的是平均流量。
- 交换机默认端口带宽的统计周期是300秒,可以设置的最小统计间隔为10秒。
- 交换机的端口峰值速率统计周期为秒级,只能计算出秒级内的平均最大值。
因此,需要通过获取报文后进行分析,才能证明网络中的确存在微突发。详细过程请参考小窍门:拥塞丢包的界定。
拥塞是指网络资源不足而造成速率下降,引入额外延时的现象。当网络中存在大量的组播流容易引起流量突发,或者多业务并存的复杂环境下,拥塞现象极为常见。流量突发导致设备接口发送带宽超出限制,设备出现拥塞丢包。
拥塞主要在以下的场景发生:
- 高速率端口向低速率端口发送流量,流量超过低速率端口的带宽。
- 多个端口向一个端口发送流量,流量叠加之和超过发送端口的带宽。
- 端口的出方向配置限速或者流量整形,发送的流量超过限速或者流量整形的阈值。
- 网络流量存在突发,在某个时刻,端口流量超过端口的带宽。
出现拥塞丢包时,按照以下步骤处理:
检查端口是否存在Discard丢包计数。
在任意视图执行命令display interface interface-type interface-number,或在接口视图执行命令display this interface,查看设备连接用户侧端口出方向报文计数,存在Discard丢包计数则说明端口曾经存在拥塞。在业务受到影响时,观察该Discard是否增加。
- 如果不增加,则业务影响与Discard丢包无关。请跳过该节,参考检查是否存在环路进行问题定位。
- 如果增加,则业务影响与Discard丢包相关,请执行下一步。
对于支持display qos queue statistics命令行的单板,可以通过该命令行了解各个队列的丢包情况。
<HUAWEI> display qos queue statistics interface gigabitethernet 1/0/1
(2)配置接口缓存管理的突发模式为增强模式,检查端口Discard计数是否增加。
当突发流量的瞬时速率超过交换机的转发能力时,交换机会将突发的数据进行缓存以便稍后发送。如果交换机没有足够的缓存,那么超出的数据只能丢弃,这就产生了拥塞丢包。
一般来说,交换机接口缓存较小,接口上的流量如果突发达到接口带宽的50%~60%左右就会出现丢包现象。而在接口上配置缓存管理的突发模式为增强模式,单个接口可以抢占到更多的剩余动态缓存,接口应对流量突发的能力更强,拥塞丢包现象就会减少。
<HUAWEI> system-view
[HUAWEI] interface gigabitethernet 1/0/2
[HUAWEI-GigabitEthernet1/0/1] qos burst-mode enhanced
X1E系列单板不支持此命令。
配置为增强模式时,qos burst-mode(接口视图)命令与qos burst-mode(系统视图)命令不能同时配置,且上述两条命令均不能与qos queue length命令同时配置。
重新执行步骤1,检查端口Discard计数是否增加。
如果不增加,则拥塞问题解决。观察丢包现象是否解决,如果未解决,请跳过该节,参考检查是否存在环路进行问题定位。
如果仍然增加或设备不支持qos burst-mode命令,则需要优化网络,请执行下一步。
(3)优化网络。
一般从以下方面考虑,来进行网络优化:
1)端口扩容
如果有多条流量冲突,可以用更高速率的端口扩大设备之间的链路带宽,或者用Eth-Trunk增加成员端口负载分担。
2)对设备的上行流量做限速或进行流量整形
突发是造成网络中无规则丢包的主要原因,当突发的尺寸超过端口缓存的限制时,就会存在业务丢包,从而可能影响到客户的业务。从这方面来说,在上游设备对用户的数据做限速或进行流量整形,在一定程度上可以减少突发的产生或者减少突发尺寸,在下行设备上出现突发的拥塞丢包的可能性就会降低。
X系列单板设备可以支持HQoS,提供精细化的QoS服务。HQoS通过多级队列进一步细化区分业务流量,对多个用户、多种业务等传输对象进行统一管理和分层调度,更能保证业务流量的公平性以及平稳性。
3)对端口业务进行差分服务,关键业务入高优先级队列,在拥塞时得到优先处理
一般而言,接口上承载的业务比较多,有高优先级的业务(如语音,视频业务),也有低优先级的业务(如上网业务)。对于高优先级的业务在上行设备指定不同的优先级,或者在设备的入方向进优先级映射,确保在出方向时,关键业务入高优先级队列,在出方向配置PQ调度,确保高优先级的业务能够得到优先调度。
4)如果设备使用了组播业务,通过调整组播源服务器发包方式,对服务器发包优化,减小发生流量拥塞的情况。
2、本资源基本为原创,部分来源其他付费资源平台或互联网收集,如有侵权请联系及时处理。
3、本站大部分文章的截图来源实验测试环境,请不要在生产环境中随意模仿,以免带来灾难性后果。
转载请保留出处: www.zh-cjh.com珠海陈坚浩博客 » 检查接口出方向是否存在Discard计数
作者: cjh
手机扫一扫,手机上查看此文章: |
一切源于价值!
其他 模板文件不存在: ./template/plugins/comment/pc/index.htm