避免具有基础802.3ad网络的以太网环系统中的环路的方法、装置和通信系统 本发明涉及在网络中运行的方法,并且涉及关联装置以及涉及包括所述装置的通信系统。
在例如EP 1062787 B1中公开了以太网环保护(ERP)机制和协议。另外,存在另一种环保护机制,称作以太网自动保护交换(EAPS),如例如IETF RRC 3619中所述的一样。
这类环保护机制包括协调环保护活动的环主控(ring master)RM(又称作冗余度管理器)。
这个意义上的保护具体表示避免了物理以太网中的链路层环路。配备环主控以防止环形成这类以太网环路(Ethernet loops)。
当环主控收到关于环是健康的、即所有环节点(网络元件)和链路(段或弧)是可操作的通知(例如经由环主控通过其两个端口所发送的测试分组)时,环主控通过在其环端口之一(环主控的辅助接口)阻塞业务接收和传送来断开链路层环路。
所有业务均在那个辅助端口被阻塞,但除了以太网环保护控制业务、例如测试分组之外。优选地,这种控制业务经由控制虚拟LAN(VLAN)发送。
从链路层的角度来看,在环主控的辅助端口阻塞业务的操作将环的拓扑结构变换成节点(网络元件)链。这在典型的第2层(L2)网络中是必要的(又参见文献IEEE 802.1,以便进行进一步说明)。环主控阻塞其辅助端口从而产生网络元件链的拓扑结构的操作被认为是以太网环保护机制的正常操作状态。
图1示出这种ERP结构。环包括网络元件或节点101至106,其中节点101是具有主要端口P和辅助端口S的环主控RM(又称作冗余度管理器)。如前面所述,在正常操作中,环主控阻塞其辅助端口S,从而引起节点101至106构建用于用户业务的链拓扑结构。
链路或端口故障:
当故障出现于环、例如环段的链路故障时,环主控开启其辅助端口S,由此重建所有环节点之间的通信。
如果故障出现在其端口之一,则故障可由环主控本身直接检测。备选地,可由环的另一个网络元件来通知环主控关于在网络元件的端口之一检测到的故障。在这种情况下,受影响的网络元件向环主控发送链路不运行(Link Down)消息。环主控随后开启其辅助端口S(参见图2)。
故障恢复:
当环的网络元件检测到故障恢复时,它向环主控发送指明链路或端口再次是可操作的通知。这可通过网络元件向环主控发送链路运行(Link Up)消息来实现。网络元件将切换到临时阻塞状态(pre-forwarding state),从而阻塞除了测试分组之外的所有业务(经由VLAN所传送的健康检查消息)。在这种临时阻塞状态中,网络元件等待来自环主控的消息,以便再次切换到正常操作(或转发状态)。
环主控再次阻塞辅助端口S,并且向网络元件发送消息,以便回到正常操作。环主控允许网络元件仅在环主控阻塞其辅助端口S之后才从其临时阻塞状态转移到正常操作(转发状态)。这避免链路层环路的配置。
优选地,环主控通过经由其两个环接口、即经由其主要端口P和其辅助端口S频繁发送健康检查分组,来评估整个环的操作状态。这些健康检查分组(又称作测试分组)可经由控制VLAN传送。如果环是可操作的,则环主控经由相应的其它接口来接收所发送的其测试分组。如果没有接收到测试分组,则环可能断开,并且应当发起保护恢复动作。
链路汇聚:
以太网网络中的一个基本元件是链路汇聚(LAG)。例如在文档IEEE802.3ad中定义了LAG。
在IEEE 802.3ad中定义与CSMA/CD MAC配合使用的可选链路汇聚子层。链路汇聚允许一个或多个链路汇聚在一起以形成链路汇聚组,使得MAC客户端可将链路汇聚组看作好像是单个链路那样。为此,它指明建立由工作在相同数据速率的全双工点到点链路的N个并行实例组成的DTE到DTE逻辑链路。
链路汇聚包括MAC客户端与MAC之间的可选子层(或者可选的MAC控制子层)。
有可能对于系统中的一些端口来实现可选链路汇聚子层,而对于其它端口则不实现该子层;即,不需要使系统中的所有端口都遇到链路汇聚。
由于以太网链路带宽通常增大倍数10(例如10Mbps、100Mbps、1Gbps等),所以LAG定义如何将全部具有相同速率的若干(n)个以太网链路汇聚成带宽总计为下式所示的较大链路:
n×{单链路速率}
(例如,8个100Mbps的链路产生800Mbps的LAG)。
LAG的一个重要方面是其保护:如果组成LAG的物理链路之一出故障,则业务仍然可通过LAG的其余链路来传送,因而维持通过LAG的业务。
在根据IEEE 802.3的以太网链路汇聚(LAG)中,将多个以太网物理接口组合成一个单逻辑接口。对于以太网客户端层,仅提供一个“逻辑”接口。这种机制用于例如增加两个节点之间的带宽,或者允许若干物理链路之间的负荷共享。链路汇聚仅当所有物理链路出故障时才出故障。只要存在可操作的至少一个链路,则传送或接收的业务可重定向为通过属于同一个链路汇聚的仍然可操作的物理链路来传送或接收。这种重定向操作可采用一秒钟来完成。
当对于链路汇聚应用以太网环保护并且一个物理链路出故障时,如前面所述,又从以太网环保护的角度来看,链路汇聚仍然是可操作的。但是,如果选择出故障的物理链路来传送ERP测试分组,则这些分组将会丢失,环主控将假定环不是可操作的,并且将发起保护措施,由此开启其先前阻塞的(辅助)环端口。这种动作将立即产生环路,从而危害环网中地所有通信。
待解决的目标是克服前面所述的缺点,并且提供一种能够处理环网和链路汇聚、由此避免在环网拓扑结构中产生(临时)环路的方式。
这个问题根据独立权利要求的特征得到解决。其它实施例产生于从属权利要求。
为了克服这个问题,提供一种可在网络或网络组件、具体来说在环网的环主控中运行的方法。网络包括经由环连接的多个网络元件(又称作节点),其中网络元件之一是包括主要端口和辅助端口的环主控。该方法包括以下步骤:
-由环主控检测到故障;
-环主控检查第二消息,并且根据第二消息的内容来开启辅助端口。
当环主控检查和/或特别是等待第二消息时,可检测是否可开启环主控的辅助端口而没有在环网中产生环路。
在一个实施例中,如果第二消息指明链路汇聚中没有存在断开链路,则环主控开启其辅助端口。
因此,如果链路汇聚中不存在断开链路,则环主控可立即开启其辅助端口,以便保持整个环网的业务流。
第二消息可以是链路汇聚的PhyDown消息(指明物理层被破坏(broken-down))。
另一个实施例是,链路汇聚覆盖网络的至少一段。
根据另一个实施例,链路汇聚包括并行的至少两个链路,其中在链路汇聚的一个链路出故障时,其余的至少一个链路传送预计经由出故障链路传送的业务。
在又一个实施例中,如果至少一个第一消息没有到达环主控的主要端口或辅助端口,则由环主控检测到故障。
在另一个实施例中,至少一个第一消息是测试消息(又称作健康检查消息)。
在另一个实施例中,至少一个第一消息由环主控发送。
因此,环主控可经由其端口的至少一个发送测试消息,而在某个延迟(信号通过环网传送的时间)之后在相应的另一个端口接收测试消息。因此,如果测试消息在预定时间段内没有到达,则环主控可通知出故障。
但是,在下一个实施例中,故障对应于至少一个第一消息、具体对应于至少一个测试消息的丢失。
因此,如果一个或者预定数量的测试分组在某个时间之内没有到达环主控,则环主控假定在这种情况下对应于测试分组的丢失(即,至少一个第一消息的丢失)的故障。
一个实施例是,至少一个第一消息由环主控经由其主要端口以及经由其辅助端口来发送。
在另一个实施例中,至少一个第一消息经由控制虚拟局域网(控制VLAN)来发送。
在另一个实施例中,该方法包括以下步骤:
-如果第二消息指明链路汇聚中存在断开链路,则环主控等待预定时间段;
-如果故障在预定时间段之后继续存在,则环主控开启其辅助端口。
因此,第二消息指明链路汇聚已经丢失至少一个链路。但是,这个特定链路汇聚中可存在可能仍然能够传送业务的剩余的链路。在仍然活动的链路能够传送出故障链路的业务之前,链路汇聚通常需要一些时间。在这样的一段时间之后,业务将再次正常流动。在这种情况下,使环主控开启其辅助端口会是致命的,这是因为,由于链路汇聚的恢复,这会导致环网中的环路。
但是,如果链路汇聚在仍然活动的链路之间重新分布业务通常所需的时间段结束但仍然没有在环主控的端口接收到至少一个第一消息,则这是关于整个链路汇聚(而不仅是链路汇聚中的单个链路)可能因严重链路故障而不允许的极有力指示。在这种情况下,环主控可发起保护,由此开启其辅助端口。
如果经过链路汇聚进行重新配置的时间并且在环主控的端口(再次)接收到至少一个第一测试消息,则环主控不开启其辅助端口。在这种情况下,等待那个预定时间段避免了会导致环网中的环路的环主控的辅助端口的轻率开启。
前面所述的问题还通过包括处理器单元的装置来解决,处理器单元设置和/或配备成使得本文所述的方法在所述处理器上是可执行的。
在一个实施例中,所述装置是通信装置,具体来说是网络元件或环主控。
另外,以上所述的问题通过包括本文所述的装置的通信系统来解决。
附图中示出和说明本发明的实施例:
图3示出包括网络元件的环网以及连接环网的两个网络元件的链路汇聚;
图4示出说明环主控执行关于是否可发起包括链路汇聚的环网中的环保护的检查的步骤的流程图。
图3示出包括网络元件(或节点)301至304的环网,其中节点301是这个环网的环主控。环主控301包括主要端口P和辅助端口S。在正常操作中,阻塞环主控301的辅助端口S。
网络元件303和网络元件304经由包括多个链路的链路汇聚308来连接。在链路汇聚308的故障307的情况下,环主控301必须判定是整个链路汇聚308崩溃还是仅链路汇聚中的单个链路有缺陷,并且因而链路汇聚308将在预定时间段之后恢复。在后一种情况下,为了避免环网中的环路,环主控301不应当发起链路保护,即,它不应当开启其辅助端口S。
环主控301经由其主要端口P以及经由其辅助端口S来发送测试消息(又称作健康检查消息)。这类测试消息优选地经由控制VLAN来发送。通过在其相应端口接收测试消息,环主控知道环的健康。如果测试消息丢失,则可能已经发生链路故障。
如果在环主控301的端口不再接收到测试消息并且如果没有接收到链路不运行消息,则环网内的网络元件的物理接口可能是可操作的。但是,在环网内的不同OSI层可能存在问题,例如可能已经发生使用链路汇聚的路径中的物理链路故障。
如果链路汇聚中的单个链路崩溃,则这种故障不应当通过以太网环保护机制来纠正。这种保护仅应当在链路汇聚中的所有链路有缺陷时才提供。
如果并非链路汇聚的所有链路出故障,则业务可通过这个链路汇聚的仍然可操作的物理链路进行重定向。这种重定向操作采用某一时间、如一秒钟来完成。
如果测试消息经由链路汇聚的变为有缺陷的特定链路来传送,则环主控301不会接收到这些测试消息,直到链路汇聚机制完成重定向为止。为了不开启其辅助端口S,环主控301必须收到关于存在链路汇聚在预定时间段内恢复故障的机会的通知。
图3中,网络元件303和304各具有配置有链路汇聚308的端口。如果网络元件303或304其中之一识别链路汇聚处的故障,则它经由其相对接口/端口向环主控301发送PhyDown消息。
由于丢失的测试消息,环主控301可确定环网是否健康。环主控301按照如下所述采取动作:
a)环网不健康并且接收到PhyDown消息:存在可由链路汇聚308本身来保护的故障。环主控301临时抑制保护动作。
b)环网不健康并且没有接收到PhyDown消息:链路汇聚308没有故障或者链路汇聚308中没有故障,环主控应当发起保护动作,即开启其辅助端口。
c)环网是健康的并且接收到PhyDown消息:存在由链路汇聚308进行保护的故障,环主控308不需要保护环网。
图4示出说明各种状态以及取决于从环网中的故障产生的某些消息的必要动作的流程图。
在步骤401,环主控因测试消息的丢失而可检测到环中的故障,并且转到步骤402,由此检查是否接收到PhyDown消息。如果没有接收到PhyDown消息,则链路的故障无法由链路汇聚来恢复。因此,环主控必须保护环,由此开启其辅助端口(步骤405)。
如果环主控接收到PhyDown消息,它转移到步骤403,等待(链路汇聚在其仍然可操作的链路之间分布业务所需的)预定时间x。在这个时间x之后,环主控检查测试消息是否(仍然)丢失。如果情况是这样,则它转移到步骤405,由此发起环的保护,并且开启环主控的辅助端口。
如果测试消息没有丢失,则链路汇聚已经恢复,并且不需要保护环。因此,它转移到步骤401。
以此提供的方式的优点:
这种解决方案的一个优点在于,环主控确定链路故障是否涉及链路汇聚中的单个链路,因而可避免由此产生环网中环路的立即发起环的保护。
环主控必须等待的时间段(参见图4的步骤403)应当足够长,以便确保链路汇聚中的业务可在可操作链路之间重新分布,并且可在环管理器的端口处接收测试消息。