链路故障处理方法及装置 【技术领域】
本发明涉及通信领域, 具体而言, 涉及一种链路故障处理方法及装置。背景技术 自动交换光网络 (ASON, Automatic Switched Optical Network) 是在传统光传送 网的基础上发展出来的一种新型技术。ASON 网络在不需要人为管理和控制的条件下, 可以 依据自身所配置的一系列路由、 信令、 自动发现等协议机制的运作, 按用户的请求来建立符 合用户需求的光信道。 ASON 的研究重点是业务传输, 自动交换控制和网络管理三个部分, 分 别由传送平面 Transport Plane, 控制平面 Control Plane, 管理平面 Management Plane 来 进行功能实现。
ASON 网络的保护和恢复要求在网络发生故障时仍能继续正常运行的能力。 保护机 制可分为两种类型, 基于传送平面的保护和基于控制平面的保护。基于传送平面的保护方 面, ASON 支持同步数字体系 (SDH, Synchronous Digital Hierarchy) 的网络保护方式, 如 复用段共享保护环 (MS-SPRing, 主要有二纤与四纤两种形式的保护环 ) ; 基于控制平面的 保护方面, ASON 支持端到端 ( 通道 ) 保护, 即从源节点到目的节点的整条连接保护, 当承载 业务的某条连接上存在故障时, 业务能触发通道故障检测, 使业务能恢复, 同时还可以采取 预置路由的方式提高恢复的速度。
实际的传送网在传送业务时, 经常会发生一些不可预测的异常, 如传送节点网元 掉电, 连接光纤断, 业务光板故障, 交叉板故障, 建业务 SDH 时隙资源不足, 承载业务的连接 通道存在告警 ( 外部干扰或内部产生 ), 此时都会对业务创建和正常运行产生影响。 为了不 影响业务, ASON 采取的方法是对连接产生的告警进行故障检测, 根据连接的层别, 可分为链 路层故障检测与通道层故障检测。
链路层故障检测需要结合连接本身的路由和当前网络中存在实际的链路情况来 进行, 在具体的实现中, 往往会将网络中的链路情况分成二种, 一种是环保护链路 ( 二纤复 用段共享保护环或四纤复用段共享保护环 ), 另一种普通链路 ( 包括无保护链路, 1+1 复用 段保护链路, 1 ∶ 1 复用段保护链路以及 1 ∶ N 复用段保护链路 ), 判断连接是否出现故障 的标准就是连接的逐跳路由是否在环或普通链路失效, 如果存在失效情况存在, 就触发业 务进行恢复。
通道层故障检测常以 “链路管理协议” (LMP, Links Management Protocol) 作为基 础, 在具体实现时, 往往针对单个方向进行的, 如果是双向业务, 则需要在路径 PATH 方向与 逆向 RESV 方向两个方向都进行通道检测, PAHT 方向由源网元发起检测, RESV 方向由目的网 元发起检测, 当检测到连接中某一段通道有故障时, 出现故障的网元会向源网元节点发送 定位结果, 所有的业务恢复或回复操作由源网元节点进行控制。PATH 方向是指在建立连接 过程中, 首节点向尾节点发起信令的方向, 反之为 RESV 方向。
目前, 链路层故障检测的优先级高于通道故障检测的优先级, 因此, 通常情况不会 启动通道检测, 但是在链路层故障与通道故障同时存在的情况, 可能只消除了其中一种故
障而不是全部消除, 进而导致后续业务误回复。
针对相关技术中在链路层故障与通道故障同时存在的情况, 可能只消除了其中一 种故障而不是全部消除, 进而导致后续业务误回复的问题, 目前尚未提出有效的解决方案。 发明内容 本发明的主要目的在于提供一种链路故障处理方法及装置, 以至少解决上述在链 路层故障与通道故障同时存在的情况, 可能只消除了其中一种故障而不是全部消除, 进而 导致后续业务误回复的问题。
根据本发明的一个方面, 提供了一种链路故障处理方法, 包括 : 当网络链路连接上 同时存在链路层故障和通道故障时, 确定所述链路层故障和所述通道故障发生的次序 ; 根 据所述次序启动链路层故障检测和 / 或通道故障检测。
较优的, 所述根据所述次序启动链路层检测和 / 或通道故障检测, 包括 : 当所述链 路连接上先出现链路层故障, 然后出现通道故障时, 启动所述链路层故障检测, 对所述链路 层故障进行修复 ; 以及当所述链路层故障被修复时, 上报所述链路连接所述链路层故障消 失。
较优的, 所述链路连接上出现所述链路层故障之后, 包括 : 当所述链路连接上承载 的业务具有恢复属性时, 恢复所述业务 ; 以及当所述链路层故障被修复、 且所述业务具有回 复属性时, 利用定时器 T1 启动通道故障检测, 若通道故障被修复, 上报所述链路连接所述 通道故障消失, 通知所述业务回复。
较优的, 上报所述链路连接所述通道故障消失之后, 包括 : 上报所述链路连接所述 业务的故障消失。
较优的, 所述根据所述次序启动链路层检测和 / 或通道故障检测, 包括 : 当所述链 路连接上先出现通道故障, 然后出现链路层故障时, 标识所述链路连接为 : 即存在通道故 障, 又存在链路层故障 ; 启动所述链路层故障检测对所述链路层故障进行修复, 和 / 或, 启 动所述通道故障检测对所述通道故障进行修复 ; 根据修复结果上报所述链路连接所述链路 层故障和 / 或所述通道故障消失。
较优的, 所述链路连接上出现所述通道故障之后, 包括 : 当所述链路连接上承载的 业务具有恢复属性时, 恢复所述业务 ; 以及当所述链路层故障被修复、 且所述业务具有回复 属性时, 利用定时器 T2 启动通道故障检测, 若通道故障被修复, 上报所述链路连接所述通 道故障消失, 通知所述业务回复 ; 当所述通道故障被修复、 且所述业务具有回复属性时, 通 知所述业务回复。
较优的, 所述根据修复结果上报所述链路连接所述链路层故障和 / 或所述通道故 障消失, 包括 : 所述链路层故障和所述通道故障均消失时, 上报所述链路连接所述业务的故 障消失。
根据本发明的另一方面, 提供了一种链路故障处理装置, 包括 : 确定单元, 用于当 网络链路连接上同时存在链路层故障和通道故障时, 确定所述链路层故障和所述通道故障 发生的次序 ; 启动单元, 用于根据所述次序启动链路层故障检测和 / 或通道故障检测。
较优的, 所述启动单元包括 : 第一修复子单元, 用于当所述链路连接上先出现链路 层故障, 然后出现通道故障时, 启动所述链路层故障检测, 对所述链路层故障进行修复 ; 第
一上报子单元, 用于当所述链路层故障被修复时, 上报所述链路连接所述链路层故障消失。
较优的, 所述启动单元还包括 : 第一恢复子单元, 用于当所述链路连接上承载的业 务具有恢复属性时, 恢复所述业务 ; 第一启动子单元, 用于当所述链路层故障被修复、 且所 述业务具有回复属性时, 利用定时器 T1 启动通道故障检测, 若通道故障被修复, 上报所述 链路连接所述通道故障消失, 通知所述业务回复。
较优的, 所述第一上报子单元进一步用于在上报所述链路连接所述通道故障消失 之后, 上报所述链路连接所述业务的故障消失。
较优的, 所述启动单元包括 : 标识子单元, 用于当所述链路连接上先出现通道故 障, 然后出现链路层故障时, 标识所述链路连接为 : 即存在通道故障, 又存在链路层故障 ; 第二修复子单元, 用于启动所述链路层故障检测对所述链路层故障进行修复, 和 / 或, 启动 所述通道故障检测对所述通道故障进行修复 ; 第二上报子单元, 用于根据修复结果上报所 述链路连接所述链路层故障和 / 或所述通道故障消失。
较优的, 所述启动单元还包括 : 第二恢复子单元, 用于当所述链路连接上承载的业 务具有恢复属性时, 恢复所述业务 ; 第二启动子单元, 用于当所述链路层故障被修复、 且所 述业务具有回复属性时, 利用定时器 T2 启动通道故障检测, 若通道故障被修复, 上报所述 链路连接所述通道故障消失, 通知所述业务回复 ; 通知单元, 用于当所述通道故障被修复、 且所述业务具有回复属性时, 通知所述业务回复。
较优的, 所述第二上报单子元进一步用于所述链路层故障和所述通道故障均消失 时, 上报所述链路连接所述业务的故障消失。
在本发明实施例中, 当网络链路连接上同时存在链路层故障和通道故障时, 确定 链路层故障和通道故障发生的次序, 并根据确定的次序启动链路层故障检测和 / 或通道故 障检测, 在链路层故障与通道故障同时存在的情况, 可以确认故障消除, 避免后续业务误回 复, 能有效的缩短研发时间及降低工程实施的成本。 附图说明
此处所说明的附图用来提供对本发明的进一步理解, 构成本申请的一部分, 本发 明的示意性实施例及其说明用于解释本发明, 并不构成对本发明的不当限定。在附图中 :
图 1 是根据本发明实施例的链路故障处理方法的处理流程图 ;
图 2 是根据本发明实施例的实施例一的场景示意图 ;
图 3 是根据本发明实施例的实施例一的处理流程图 ;
图 4 是根据本发明实施例的实施例二的场景示意图 ;
图 5 是根据本发明实施例的实施例二的处理流程图 ;
图 6 是根据本发明实施例的实施例三的场景示意图 ;
图 7 是根据本发明实施例的实施例三的处理流程图 ;
图 8 是根据本发明实施例的链路故障处理装置的结构示意图 ;
图 9 是根据本发明实施例的启动单元的第一种结构示意图 ;
图 10 是根据本发明实施例的启动单元的第二种结构示意图 ;
图 11 是根据本发明实施例的启动单元的第三种结构示意图 ;
图 12 是根据本发明实施例的启动单元的第四种结构示意图。具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是, 在不冲突的 情况下, 本申请中的实施例及实施例中的特征可以相互组合。
相关技术中提到, 目前, 链路层故障检测的优先级高于通道故障检测的优先级, 因 此, 通常情况不会启动通道检测, 但是在链路层故障与通道故障同时存在的情况, 可能只消 除了其中一种故障而不是全部消除, 进而导致后续业务误回复。 为解决上述技术问题, 本发 明实施例提供了一种链路故障处理方法, 处理流程如图 1 所示, 包括 :
步骤 102、 当网络链路连接上同时存在链路层故障和通道故障时, 确定链路层故障 和通道故障发生的次序 ;
步骤 104、 根据次序启动链路层故障检测和 / 或通道故障检测。
在本发明实施例中, 当网络链路连接上同时存在链路层故障和通道故障时, 确定 链路层故障和通道故障发生的次序, 并根据确定的次序启动链路层故障检测和 / 或通道故 障检测, 在链路层故障与通道故障同时存在的情况, 可以确认故障消除, 避免后续业务误回 复, 能有效的缩短研发时间及降低工程实施的成本。
实施时, 如图 1 所示流程, 步骤 104 在实施时, 根据次序启动链路层检测和 / 或通 道故障检测, 包括两种情况, 一种是链路连接上先出现链路层故障, 然后出现通道故障, 另 外一种情况是链路连接上先出现通道故障, 然后出现链路层故障, 现分别进行分析。 当链路连接上先出现链路层故障, 然后出现通道故障时, 启动链路层故障检测, 对 链路层故障进行修复 ; 当链路层故障被修复时, 上报链路连接链路层故障消失。
实施时, 当链路连接上承载的业务具有恢复属性时, 恢复业务 ; 以及, 当链路层故 障被修复、 且业务具有回复属性时, 利用定时器 T1 启动通道故障检测, 若通道故障被修复, 上报链路连接通道故障消失, 通知业务回复, 其中, 定时器 T1 的时间可以设置为任意时间, 根据具体情况而定, 例如, 可以设置为 0, 也可以设置 5 秒, 等等。
在本发明实施例中, 若链路层故障消失后, 启动了通道故障检测, 且通道故障消失 后, 可以上报链路连接业务的故障消失, 若只有链路层故障消失或只有通道故障消失, 仅仅 是消除链路层故障或通道故障, 并不能上报业务故障消失。
在另一种情况, 当链路连接上先出现通道故障, 然后出现链路层故障时, 标识链路 连接为 : 即存在通道故障, 又存在链路层故障 ; 启动链路层故障检测对链路层故障进行修 复, 和 / 或, 启动通道故障检测对通道故障进行修复 ; 根据修复结果上报链路连接链路层故 障和 / 或通道故障消失。
实施时, 链路连接上出现通道故障之后, 当链路连接上承载的业务具有恢复属性 时, 恢复业务 ; 以及, 当链路层故障被修复、 且业务具有回复属性时, 利用定时器 T2 启动通 道故障检测, 若通道故障被修复, 上报链路连接通道故障消失, 通知业务回复, 其中, 定时器 T2 的时间可以设置为任意时间, 根据具体情况而定, 例如, 可以设置为 0, 也可以设置 5 秒, 等等。此处的定时器 T2 仅仅用于与上文的定时器 T1 区分, 描述时, 也可以用第一定时器、 第二定时器或定时器 A、 定时器 B 进行区分。 当通道故障被修复、 且业务具有回复属性时, 通 知业务回复。
在本发明实施例中, 若链路层故障消失后, 启动了通道故障检测, 且通道故障消失 后, 可以上报链路连接业务的故障消失, 若只有链路层故障消失或只有通道故障消失, 仅仅
是消除链路层故障或通道故障, 并不能上报业务故障消失。
本发明实施例提供了一种在 ASON 网络中当连接同时存在链路层故障与通道故障 时, 连接进行协调处理故障的方法, 场景处理机制如下 :
( 说明 : 以下为了表述方便, 均已连接的 PATH 方向为例, 此外, 还需要对 “故障” 与 “告警” 两个概念需要进行提示, 有告警不一定会产生故障, 只有当通过故障检测机制确认 产生的告警会导致故障后, 才能确认连接有故障, 如当一个告警为段外告警扰动时, 对于检 测机制来说, 不一定会认为会产生连接故障。)
一、 先链路层故障, 后通道故障。
当连接先收到链路层故障, 然后又收到通道故障时, 高优先级的链路层故障检测 通常会抑制通道故障检测, 即当先出现链路层故障时, 不会启动通道故障检测。
当检测到有链路层故障时, 如果业务具有恢复属性, 此时业务应恢复。
在处理故障消失时, 链路层故障只能通过链路层故障消失清除, 通道故障也只能 通过通道故障消失清除, 只有收到这两种故障消失, 才能表示业务故障消失。
当只收到链路层故障消失时, 由于没有触发通道检测, 通道故障可能仍然存在, 对 于有回复属性的业务, 可能会造成误回复, 在具体实现过程中, 可使用定时器 T1, 当定时器 超时后, 再进行通道故障检测来决定通道故障是否存在。 二、 先通道故障, 后链路层故障。
当连接先收到通道故障, 然后又收到链路层故障, 连接需要明确标示 “即存在通道 故障, 又存在链路层故障” 。如果业务具有恢复属性, 此时业务应恢复。
如果此时只收到了连接的链路层故障消失或通道故障消失, 连接不能上报故障消 失, 仅仅清除本地对应的链路层故障状态或通道故障状态。
如果后续又收到了此连接的通道故障消失或链路层故障消失, 连接需要上报通道 故障消失或链路层故障消失。
业务收到连接的故障消失, 分二种情况处理 : 对于通道故障消失, 如果业务具有回 复属性, 则不需要启动回复等待定时器, 直接回复即可 ; 对于链路层故障消失, 如果业务具 有回复属性, 需要启动回复等待定时器 T2, 当定时器 T2 超时后, 如果不存在链路层故障或 通道故障, 则进行回复操作。
本发明实施例着重点在于协调链路层故障与通道层故障的方法, 对于链路层故障 检测与通道层故障检测的方法只作概括性说明, 因为在业界, 两种检测机制都有很充分的 实现, 但对于两种的机制有效的协调处理还处于探索阶段, 使用者能有效的缩短研发时间 及降低工程实施的成本。
为将本发明描述地更清楚更详细, 现以具体实施例进行说明, 在后续实施例中, 连 接即指前文的链路连接。
实施例一 : 先产生链路层故障, 后产生通道层告警场景, 参见图 2, 处理流程如图 3 所示 :
步骤 302、 当某二个网元之间产生链路层告警, 如网元 A 与网元 B 之间, 进行链路层 故障检测 ;
步骤 304、 检测已完成并上报链路层故障后, 如果出现通道层告警产生, 则不会进 行通道故障检测 ;
步骤 306、 链路层告警消失, 链路层故障检测会通知业务链路层故障消失 ; 由于没 有触发通道检测, 通道故障可能仍然存在, 对于有回复属性的业务, 可能会造成误回复 ;
步骤 308、 启动定时器, 待定时器超时后, 进行通道故障检测 ;
步骤 310、 向业务上报通道故障产生 ; 如果业务具有恢复属性, 则进行业务恢复。
实施例二 : 先产生通道故障, 后产生链路层告警场景, 参见图 4, 处理流程如图 5 所 示:
步骤 502、 连接收到通道告警, 进行通道告警检测, 确认存在通道故障 ;
步骤 504、 如果然后又收到了链路层故障, 此时需要将该连接标示 “既存在通道故 障, 又存在链路层故障” , 但在连接向承载的业务上报时, 需要判断通道层故障上报状态, 如 果已上报, 则不需要上报, 因为对有恢复的业务来说, 通道故障的上报已触发了业务的恢 复;
步骤 506、 如果连接收到链路层故障消失或通道故障消失, 连接不能向承载的业务 上报故障消失, 仅仅清除本地对应的链路层故障状态或通道故障状态即可 ;
步骤 508、 如果后续又收到该连接的通道故障消失或链路层故障消失, 连接需要向 承载的业务上报通道故障消失。
实施例三 : 通道检测的过程中, 产生链路层告警场景, 参见图 6, 处理流程如图 7 所示: 步骤 702、 连接收到通道告警, 进行通道故障检测过程, 在检测过程中又收到了链 路层告警, 并产生了链路层故障, 此时上报链路层故障产生 ;
步骤 704、 当通道故障检测过程结束后, 如果产生了通道层故障则需要对此连接标 示 “既存在通道故障, 又存在链路层故障” ;
步骤 706、 如果连接收到链路层故障消失或通道故障消失, 连接不能向承载的业务 上报故障消失, 仅仅清除本地对应的链路层故障状态或通道故障状态即可 ;
步骤 708、 如果后续又收到该连接的通道故障消失或链路层故障消失, 连接需要向 承载的业务上报通道故障消失。
基于同一发明构思, 本发明实施例还提供了一种链路故障处理装置, 其结构示意 图如图 8 所示, 包括 :
确定单元 801, 用于当网络链路连接上同时存在链路层故障和通道故障时, 确定链 路层故障和通道故障发生的次序 ;
启动单元 802, 用于根据次序启动链路层故障检测和 / 或通道故障检测。
在一个实施例中, 如图 9 所示, 启动单元 802 可以包括 :
第一修复子单元 901, 用于当链路连接上先出现链路层故障, 然后出现通道故障 时, 启动链路层故障检测, 对链路层故障进行修复 ;
第一上报子单元 902, 用于当链路层故障被修复时, 上报链路连接链路层故障消 失。
在一个实施例中, 如图 10 所示, 启动单元 802 可以包括 :
第一恢复子单元 1001, 用于当链路连接上承载的业务具有恢复属性时, 恢复业 务;
第一启动子单元 1002, 用于当链路层故障被修复、 且业务具有回复属性时, 利用定
时器 T1 启动通道故障检测, 若通道故障被修复, 上报链路连接通道故障消失, 通知业务回 复。
在一个实施例中, 第一上报子单元 902 进一步用于在上报链路连接通道故障消失 之后, 上报链路连接业务的故障消失。
在一个实施例中, 如图 11 所示, 启动单元 802 包括 :
标识子单元 1101, 用于当链路连接上先出现通道故障, 然后出现链路层故障时, 标 所链路连接为 : 即存在通道故障, 又存在链路层故障 ;
第二修复子单元 1102, 用于启动链路层故障检测对链路层故障进行修复, 和 / 或, 启动通道故障检测对通道故障进行修复 ;
第二上报子单元 1103, 用于根据修复结果上报链路连接链路层故障和 / 或通道故 障消失。
在一个实施例中, 如图 12 所示, 启动单元 802 还可以包括 :
第二恢复子单元 1201, 用于当链路连接上承载的业务具有恢复属性时, 恢复业 务;
第二启动子单元 1202, 用于当链路层故障被修复、 且业务具有回复属性时, 利用定 时器 T2 启动通道故障检测, 若通道故障被修复, 上报链路连接通道故障消失, 通知业务回 复;
通知单元 1203, 用于当通道故障被修复、 且业务具有回复属性时, 通知业务回复。
在一个实施例中, 第二上报单元 1103 可以进一步用于链路层故障和通道故障均 消失时, 上报链路连接业务的故障消失。
从以上的描述中, 可以看出, 本发明实现了如下技术效果 :
在本发明实施例中, 当网络链路连接上同时存在链路层故障和通道故障时, 确定 链路层故障和通道故障发生的次序, 并根据确定的次序启动链路层故障检测和 / 或通道故 障检测, 在链路层故障与通道故障同时存在的情况, 可以确认故障消除, 避免后续业务误回 复, 能有效的缩短研发时间及降低工程实施的成本。
显然, 本领域的技术人员应该明白, 上述的本发明的各模块或各步骤可以用通用 的计算装置来实现, 它们可以集中在单个的计算装置上, 或者分布在多个计算装置所组成 的网络上, 可选地, 它们可以用计算装置可执行的程序代码来实现, 从而, 可以将它们存储 在存储装置中由计算装置来执行, 并且在某些情况下, 可以以不同于此处的顺序执行所示 出或描述的步骤, 或者将它们分别制作成各个集成电路模块, 或者将它们中的多个模块或 步骤制作成单个集成电路模块来实现。 这样, 本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已, 并不用于限制本发明, 对于本领域的技 术人员来说, 本发明可以有各种更改和变化。 凡在本发明的精神和原则之内, 所作的任何修 改、 等同替换、 改进等, 均应包含在本发明的保护范围之内。