程序员开发实例大全宝库

网站首页 > 编程文章 正文

TOP故障快速定位指导—负载分担不均衡

zazugpt 2024-08-19 03:18:38 编程文章 21 ℃ 0 评论

常见原因

  • 跨框Eth-Trunk没有去使能本地优先转发功能。
  • 报文类型与负载分担的配置不匹配。
  • Eth-Trunk和ECMP级联场景。
  • 成员口数量不是2的N次方。

故障诊断流程

图1 负载分担不均衡故障诊断流程图

故障处理步骤

  1. 检查是否为跨框Eth-Trunk。通过执行命令行display eth-trunk trunk-id,查看回显信息中的成员接口名。判断是否为跨框Eth-Trunk。如果是跨框Eth-Trunk,请在Eth-Trunk接口视图下执行命令行local-preference disable,去使能Eth-Trunk接口流量本地优先转发功能。如果不是跨框Eth-Trunk,请执行步骤2。
  2. 识别报文的类型。
    1. 获取报文进行分析。
    2. 在设备上通过端口镜像或者报文捕获功能抓取报文,这里以报文捕获功能为例:
    3. 在用户视图下执行命令行capture-packet interface interface-type interface-number destination file file-name,抓取该Eth-Trunk接口的报文。
    4. 将抓取的报文进行解析,确定报文的类型,如IP报文、MPLS报文、TRILL报文、FCoE报文等。
    5. 确定报文的变化因子。
    6. 确定报文变化的是MAC地址、IP地址还是MPLS Label等。
    7. 确定报文的转发类型。对于除CE6870EI和CE6875EI外的CE9800&8800&7800&6800&5800系列交换机,由于已知单播和非已知单播的HASH方式可以分别配置,需要先确认报文是已知单播还是非已知单播。如果是已知单播报文,请执行步骤3.a。如果是未知单播、组播或广播报文,请执行步骤3.b。对于CE6870EI、CE6875EI和CE12800系列交换机,已知单播和非已知单播采用相同的负载分担方式,可跳过该步骤,执行步骤3.a。
  3. 确定负载分担方式。查看已知单播的HASH方式。执行命令行display eth-trunk trunk-id查看已知单播的HASH方式。如果Hash Arithmetic字段是profile X(其中X表示负载分担模板名称),请执行命令行display load-balance profile [ profile-name ],查看模板中的负载分担方式。如果Hash Arithmetic字段不是profile X,是dst-ip、src-ip或src-dst-ip等,则该字段表示当前的负载分担方式。查看非已知单播的HASH方式。在设备上执行命令行display current-configuration | include load-balance unknown-unicast,查看未知单播的负载分担方式。如果返回结果为空,则使用的是模板的负载分担方式。如果存在回显,则是基于报文的目的MAC地址和源MAC地址对未知单播进行负载分担。
  4. 检查报文特征是否与负载分担方式匹配。例如,转发报文是目的MAC地址变化的报文而设置的负载分担方式是基于目的IP地址的,这时需要修改负载分担方式为基于目的MAC地址。如果不匹配,请配置为与报文变化因子匹配的负载分担方式。如果一致,请执行步骤5。
  5. 检查hash-mode取值是否为推荐值。在设备上执行命令行display load-balance profile [ profile-name ],查看负载分担模板的负载分担方式。如果没有配置为推荐值,请在Load-balance-profile视图下执行命令行eth-trunk hash-mode hash-mode-id,配置为设备上提示信息的推荐值。如果hash-mode已配置为推荐取值,请执行请步骤6。
  6. 检查是否存在多级hash。
  7. 在设备上执行命令行display ip routing-table,检查是否存在ECMP且ECMP的出端口为Eth-Trunk的场景。
  8. 如果存在该场景,请在Load-balance-profile视图下执行命令行eth-trunk universal-id universal-id,调整负载分担HASH算法计算结果的偏移量。
  9. 如果不存在该场景,请执行步骤7。
  10. 检查Eth-Trunk的活动成员接口数量是否为2的N次方。
  11. 通过命令行display eth-trunk trunk-id,查看活动的成员接口数量是否为2的N次方。
  12. 如果不是2的N次方,请调整活动成员接口数量后继续查看负载分担情况。
  13. 如果是2的N次方,请执行步骤8。
  14. 请收集如下信息,并联系技术支持人员。上述步骤的执行结果。设备的配置文件和日志信息。

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表