全国直销电话:4006-854-568
IT-technology
以人为本,众志成城,以“用户至上”.“服务上乘”为原则,
追求产品和服务高质量,努力实现与客户之间真诚有效的沟通,
不断地圆梦、奔跑与腾飞。
新闻动态   NEWS
【真实案例】Cisco交换机MSTP故障?年薪25W高级网工岗的面试可用案例,它来了! -北京赛维博信科技发展有限公司
来源:本人摘自网络,如有侵权请联系删除 | 作者:毛豆 | 发布时间: 2024-06-06 | 725 次浏览 | 分享到:
【背景介绍】

近期客户公司工厂数据中心的汇聚-接入层部分拟采用MSTP做环网实现业务流“负载分担”,为了节约成本,交换机利旧用了支持MSTP的Cisco交换机和不支持生成树的TP-LINK简单网管交换机,TP交换机纯VLAN透传相当于傻瓜设备了。但IT人员发现这两设备成环后风暴,没法收敛。拓扑规划如下:

规划说明:

  • 网络中所有的业务都在VLAN 201 202 203 204里跑,全千兆光纤互联;
  • 实例1保护VLAN201和203,根桥为右边思科2.76交换机;
  • 实例2保护VLAN202和204,根桥为左边思科2.75交换机;
  • 而从上图可以看到是做了2个环的(三角形和方形),TP交换机可以透明的透传设备;

现场测试只要成环就会风暴,说明MSTP收敛异常。非常怀疑Cisco老交换机故障了,但是思科国内找不到人啦!于是找我们(合作伙伴)看一下问题。

【基础分析】
第一步:预期破环收敛的拓扑
instance 1收敛后的拓扑预期如下:

注:为什么破环拓扑如此大家也可以思考下。AP口我就不标注了,大家知道在哪条链路上阻塞即可。
instance 2收敛后的拓扑预期:

注:为什么破环拓扑如此大家也可以思考下。AP口我就不标注了,大家知道在哪条链路上阻塞即可。
第二步:检查实际的端口角色和状态
其中TP交换机不用管,所以看Cisco交换机端口信息即可,现场发现telnet还能登录Cisco交换机,即使风暴了还能打印信息,只不过很卡但总好过没有,性能还不错。MSTP信息如下:
1【instance1中】
2 Cisco-192.168.2.1:
3 Interface Prio Cost     Role      Status  LAG
4 --------- ---- -------- --------- ------- ----
5 Gi1/0/27  0    20000    Desg      Fwd     N/A
6 Gi1/0/28  16   20000    Root      Fwd     N/A
7
8 Cisco-192.168.2.75:
9 Interface Prio Cost     Role      Status  LAG
10 --------- ---- -------- --------- ------- ----
11  Gi1/0/26  0    20000    Root      Fwd     N/A
12 Gi1/0/27  16   20000    Desg      Fwd     N/A
13 Gi1/0/28  32   20000    Desg      Fwd     N/A
14
15 Cisco-192.168.2.76:
16 Interface Prio Cost     Role      Status  LAG
17  --------- ---- -------- --------- ------- ----
18 Gi1/0/26  128  20000    Desg      Fwd     N/A
19 Gi1/0/27  32   20000    Desg      Fwd     N/A
20 Gi1/0/28  16   20000    Desg      Fwd     N/A
21
22 【instance2中】
23 Cisco-192.168.2.1:
24 Interface Prio Cost     Role      Status  LAG
25 --------- ---- -------- --------- ------- ----
26 Gi1/0/27  16   20000    Root      Fwd     N/A
27 Gi1/0/28  0    20000    Desg      Fwd     N/A
28
29 Cisco-192.168.2.75:
30 Interface Prio Cost     Role      Status  LAG
31 --------- ---- -------- --------- ------- ----
32 Gi1/0/26  16   20000    Desg      Fwd     N/A
33 Gi1/0/27  0    20000    Desg      Fwd     N/A
34 Gi1/0/28  0    20000    Desg      Fwd     N/A
35
36 Cisco-192.168.2.76:
37 Interface Prio Cost     Role      Status  LAG
38 --------- ---- -------- --------- ------- ----
39 Gi1/0/26  16   20000    Root      Fwd     N/A
40
Gi1/0/27  0    20000    Desg      Fwd     N/A
41 Gi1/0/28  128  20000    Desg      Fwd     N/A
这只是一次打印,多次打印信息发现3台思科交换机的互联口MSTP角色和状态频繁震荡,总之就是没有选出AP口。互联口角色在DP和RP来回切且最终处于forwarding状态,从而导致业务数据环路且消耗交换机性能。
由于现场排查条件有限,对于这种震荡选举及未收敛的现象,我们只能基于经验猜测:经过TP-LINK交换的非直连的Cisco交换机之间没有受到彼此的BPDU。猜想如下:

似乎有可能,但是TP-LINK不支持STP理论上会将BPDU做广播透传才对,但为什么不转发呢?于是进一步排查。
第三步:进一步检查配置
于是我找了一台TP-LINK交换机查看:

web页面配置如下:
看了下TP-LINK交换机端口默认只有hybird类型,我们就看互联口即可,大致意思是:

  • 9口:PVID=1,仅划入VLAN201、202,出口规则tag
  • 10口:PVID=1,仅划入VLAN201、202,出口规则tag

看到此项配置基本定位了不转发BPDU的原因了。这个配置下BPDU确实不会被中间TP-LINK交换机转发。
看到这里我建议大家先自己思考原因!!想不通了再往下看!!要独立思考。




【原因分析】
▶ 小结的拓扑和规划如下
定位原因:Cisco交换机 2.75和2.76的27和28口发出的BPDU被TP打上缺省tag=1后,由于TP交换互联口没有划入VLAN1所以没有转发。
▶ 深入思考
这里我想说一下,在此类MSTP场景中,中间的网管交换配置仅透传所需要的业务VLAN201 202、而不透传VLAN1等等是很多人选择的基本配置,对于带tag的数据来说没有问题,但是注意:BPDU是不带tag的!
但可能有人有疑问了,交换机MSTP中的instance绑定了VLAN,如果MSTP BPDU不带tag在不同VLAN下交互又是怎么识别的呢?往下看。
▶ MSTP BPDU报文详解
我们看下交换机的MSTP BPDU报文通过什么去识别彼此的instance与VLAN的映射关系呢?见:
来源:华为官方《报文格式大全》
这个MD5加密后的字段放在报文位置如下:
所以看到这里大家应该明白了吧,对于不支持STP的TP-LINK交换机来说,BPDU就是一个普通的组播包而已,按照配置的VLAN规则走。

【解决方案】
知道怎么回事解决就很简单了,保证无untag的BPDU报文透传就可以,本案例修改配置如下:
互联口9 10的PVID默认1不变,划入VLAN1出口规则untag就行。问题圆满解决~

【结语】
对于中高级别的网络工程师,MSTP这种高可靠性的技术可谓是热门考点,面试官经常会让你介绍类似MSTP项目案例,包括拓扑设计、疑难问题的排障分析等等。通过结合本案例,可充分体现个人的网络拓扑设计能力、MSTP技术掌握、网络排障能力以及报文分析能力,可用到你的自我介绍项目中,讲好了是加分项。


 

服务热线

1391-024-6332