一种设备管理方法、装置和主控板 【技术领域】
本发明涉及通信技术领域,特别是涉及一种设备管理方法、装置和主控板。
背景技术
随着internet网络的不断发展壮大,网络通信产品广泛应用于各行各业之中,由于设备的使用率及普及率越来越高,对网络稳定性的需求也越来越高,因此,提高设备的可靠性就成为必然目标。而在internet网络中,当设备出现故障时,则需要更换该出现故障的设备,从而造成网络中断,并给用户造成很大损失。
因此,实现对设备的备份,使得业务不中断迁移等功能就显得尤为重要,例如,ISSU(In‑Service Software Update,运行中软件升级)特性就实现了升级版本时的业务不中断功能。
具体的,在设备出现故障时,如果不是整机瘫痪的情况,则可以不必进行整机的替换以及设备的复位,例如,插入接口板的某个槽位出现故障时,则可以不必对该槽位对应的设备进行整机的替换和设备的复位。如图1所示的设备简要结构示意图,当槽位2(slot2)出现故障时,只需要将槽位2的接口板插到好的槽位上即可,而不需要对该设备进行整机替换。
现有技术中,当设备在运行时,接口板是通过背板与主控板连通且通过IPC(Inter Process Communication,进程间通信)进行通信的,如图2所示的一种主控板、接口板和背板之间的结构示意图。
在图2中,当某块接口板的插槽发生故障时,将导致接口板与背板之间不通,从而使得接口板不能正常上电。例如,图2中的接口板1所在槽位的插槽损坏时,接口板1所承载的所有业务将会中断,从而影响该设备的正常使用。
而为了保证接口板1业务的正常进行,现有技术中可以采用如下的处理方式进行解决。
第一,采取更换设备机框的方式。
第二,取得设备上的配置文件,并更改配置文件后,进行整框重启换配置。例如,将接口板1插入到新的槽位后,需要将该新槽位的配置信息上报给设备,并进行整框重启换配置。
第三,取得设备上的配置文件,并更改配置文件后,加载新配置到设备上后,进行整机的配置回滚更换配置。
但是,在采用上述方式对接口板插槽故障进行相应处理时,解决问题时付出的代价较大。即在进行更换设备机框、进行整框重启换配置、或者,进行整机的配置回滚更换配置时,均需要进行整机的操作,造成整机业务会中断,影响用户的流量转发,并造成业务中断,从而给用户造成很大损失。
【发明内容】
本发明提供一种设备管理方法、装置和主控板,以在避免整机操作的前提下恢复正常业务,保证网络的稳定。
为了达到上述目的,本发明提出了一种设备管理方法,应用于至少包括接口板和主控板的设备中,所述设备中还包括多个用于插入接口板的槽位,如果所述接口板对应的第一槽位出现故障时,将所述接口板插入到没有出现故障的第二槽位中,在将所述接口板插入到所述第二槽位时,所述方法包括以下步骤:
所述主控板接收所述接口板向所述主控板发送的注册消息,其中,所述注册消息中携带了所述第二槽位的标识信息;
所述主控板获知接口板从出现故障的所述第一槽位插入到没有出现故障的所述第二槽位,将所述第二槽位的标识信息虚拟成所述第一槽位的标识信息;并根据所述第一槽位的标识信息查找所述第一槽位的配置信息;
所述主控板将所述第一槽位的配置信息发送给所述接口板。
所述第一槽位的标识信息包括所述第一槽位的索引号;所述第二槽位的标识信息包括所述第二槽位的索引号;
所述主控板将所述第二槽位的标识信息虚拟成所述第一槽位的标识信息,具体包括:
所述主控板通过命令行transfer第二槽位to第一槽位将所述第二槽位的索引号虚拟成所述第一槽位的索引号。
所述主控板将所述第一槽位的配置信息发送给所述接口板,之后还包括:
所述接口板接收所述第一槽位的配置信息,并根据所述第一槽位的配置信息处理业务。
所述第一槽位的配置信息至少包括以下信息中的一种或任意几种:
所述第一槽位的芯片类型;
所述第一槽位的芯片号;
所述第一槽位的槽位号;
所述第一槽位的用户端口号;
所述第一槽位的IP地址;
所述第一槽位所使用的协议类型。
一种设备管理装置,至少包括接口板和主控板,所述装置中还包括多个用于插入接口板的槽位,如果所述接口板对应的第一槽位出现故障时,将所述接口板插入到没有出现故障的第二槽位中,在将所述接口板插入到所述第二槽位时,
所述接口板,用于向所述主控板发送注册消息,获知接口板从出现故障的所述第一槽位插入到没有出现故障的所述第二槽位,其中,所述注册消息中携带了所述第二槽位的标识信息;
所述主控板,用于接收所述注册消息,将所述第二槽位的标识信息虚拟成所述第一槽位的标识信息;并根据所述第一槽位的标识信息查找所述第一槽位的配置信息;以及将所述第一槽位的配置信息发送给所述接口板。
所述第一槽位的标识信息包括所述第一槽位的索引号;所述第二槽位的标识信息包括所述第二槽位的索引号;
所述主控板还用于,通过命令行transfer第二槽位to第一槽位将所述第二槽位的索引号虚拟成所述第一槽位的索引号。
所述接口板还用于,接收所述第一槽位的配置信息,并根据所述第一槽位的配置信息处理业务。
一种主控板,应用于至少包括接口板和主控板的设备中,所述设备中还包括多个用于插入接口板的槽位,如果所述接口板对应的第一槽位出现故障时,将所述接口板插入到没有出现故障的第二槽位中,在将所述接口板插入到所述第二槽位时,获知接口板从出现故障的所述第一槽位插入到没有出现故障的所述第二槽位,所述主控板包括:
收发模块,用于接收所述接口板向所述主控板发送的注册消息,其中,所述注册消息中携带了所述第二槽位的标识信息;并将第一槽位的配置信息发送给所述接口板;
处理模块,与所述收发模块连接,用于将所述第二槽位的标识信息虚拟成所述第一槽位的标识信息;并根据所述第一槽位的标识信息查找所述第一槽位的配置信息;由所述收发模块将所述第一槽位的配置信息发送给所述接口板。
所述第一槽位的标识信息包括所述第一槽位的索引号;所述第二槽位的标识信息包括所述第二槽位的索引号;
所述处理模块具体用于,通过命令行transfer第二槽位to第一槽位将所述第二槽位的索引号虚拟成所述第一槽位的索引号。
所述第一槽位的配置信息至少包括以下信息中的一种或任意几种:
所述第一槽位的芯片类型;
所述第一槽位的芯片号;
所述第一槽位的槽位号;
所述第一槽位的用户端口号;
所述第一槽位的IP地址;
所述第一槽位所使用的协议类型。
与现有技术相比,本发明具有以下优点:当设备某槽位出现故障时,能够在避免整机重启设备的前提下恢复正常业务,保证了网络的稳定性。而且通过虚拟槽位的方法,实现了新型的设备管理方式,并快速恢复故障槽位对应的接口板的业务。
【附图说明】
图1为现有技术中设备简要结构示意图;
图2为现有技术中一种主控板、接口板和背板之间的结构示意图;
图3为本发明提出的一种设备管理方法流程图;
图4为本发明一种应用场景下提出的一种设备管理方法流程图;
图5为现有技术中寻址过程示意图;
图6为本发明中寻址过程示意图;
图7为本发明中设备转发架构图示意图;
图8为本发明中主控板的结构示意图。
【具体实施方式】
本发明中,由于接口板对应的槽位(例如,第一槽位)出现故障,并将该接口板插入到新的槽位(例如,第二槽位)时,主控板通过将该接口板对应的第二槽位虚拟成出现故障的第一槽位,并根据该第一槽位的标识信息查询到该第一槽位的配置信息,并将该第一槽位的配置信息下发给该接口板,使得该接口板能够根据该第一槽位的配置信息处理相关的业务。从而能够在避免整机重启设备的前提下恢复正常业务,保证了网络的稳定性。
基于上述思想,本发明中提供一种设备管理方法,应用于至少包括接口板和主控板的设备中,所述设备中还包括多个用于插入接口板的槽位,如果所述接口板对应的第一槽位出现故障时,将所述接口板插入到没有出现故障的第二槽位中,如图3所示,在将所述接口板插入到所述第二槽位时,该方法包括以下步骤:
步骤301,所述主控板接收所述接口板向所述主控板发送的注册消息,其中,所述注册消息中携带了所述第二槽位的标识信息。其中,所述第二槽位的标识信息包括所述第二槽位的索引号。
步骤302,所述主控板将所述第二槽位的标识信息虚拟成所述第一槽位的标识信息;并根据所述第一槽位的标识信息查找所述第一槽位的配置信息。其中,所述第一槽位的标识信息包括所述第一槽位的索引号。
步骤303,所述主控板将所述第一槽位的配置信息发送给所述接口板。
为了更加清楚的说明本发明提供的技术方案,以下结合一种具体的应用场景,对本发明提供的技术方案进行详细阐述。本应用场景下,以接口板的初始槽位为槽位A(即第一槽位),当槽位A出现故障时,将接口板插入到槽位B(即第二槽位)为例进行说明。
基于上述情况,如图4所示,该设备管理方法进一步包括:
步骤401,当插入接口板的某槽位(例如,槽位A)出现故障时,将该接口板从故障槽位A拔出,并插入到没有出现故障的槽位(例如,槽位B)上,接口板进行启动操作。
在实际应用中,如果槽位A出现故障时,则能够获知该信息,并将该槽位A中的接口板插入到没有出现故障的槽位B。
步骤402,接口板向主控板发送注册消息。
具体的,当接口板插入到槽位B,并在槽位B上启动时,将获知自身在槽位B上并没有进行注册,此时,该接口板需要向主控板发起注册过程,即接口板向主控板发送注册消息。
由于接口板需要在槽位B上向主控板发送注册消息,则该注册消息中需要携带槽位B的标识信息。其中,该槽位B的标识信息可以根据实际需要进行选择,例如,该槽位B的标识信息可以为该槽位B的索引号。
步骤403,主控板根据该注册消息获取接口板对应的标识信息。其中,该标识信息为槽位B的标识信息,即为该槽位B的索引号。
步骤404,主控板将槽位B虚拟成槽位A。其中,当获知接口板从出现故障的槽位A插入到没有出现故障的槽位B时,该主控板需要将槽位B虚拟成槽位A。
具体的,在将槽位B虚拟成槽位A的过程中,主控板需要将槽位B的标识信息虚拟成槽位A的标识信息,即将槽位B的索引号虚拟成槽位A的索引号。
而在实际应用中,该主控板是通过命令行transfer B to A将槽位B的索引号虚拟成槽位A的索引号的。当然,在实际应用中,主控板还可以通过其他方式将槽位B的索引号虚拟成槽位A的索引号,本发明中不再详加赘述。
基于设备管理的实现机制过程中,接口板槽位和槽位号是一一对应的关系,本发明中提出了虚拟槽位号的方法,即将没有故障的槽位号(槽位B)虚拟成故障槽位号(槽位A),而主控板则认为故障槽位号(槽位A)已经恢复正常,从而不用通过整机重启的操作就能快速恢复原故障槽位的业务,且不会影响其他槽位单板的工作,不会造成整机业务中断。
需要注意的是,在现有技术中,接口板启动向主控板发起注册时,在向主控板发送注册消息之前,需要会先从逻辑(例如,硬件的存储介质)中读取该接口板的相关信息,例如,该接口板的类型、槽位号(由于此时该接口板插入在槽位B,则该槽位号为槽位B)等索引信息,并根据该索引信息进行寻址。
如图5所示的寻址过程,其中,寻址是指寻找数据以及其他信息地址的数据。通过寻址技术,先获取该槽位B接口板存储相关信息的索引,该索引指针指向的地址存储着该接口板的相关配置信息(即关于槽位B的配置信息)。
接口板向主控板发送注册消息时,需要将该索引携带在注册消息中,当主控板接收到该注册消息,则会根据该注册消息中的索引指针所指向的地址获取该接口板的配置信息(即关于槽位B的配置信息),并回应注册响应消息,该注册响应消息中携带该关于槽位B的配置信息。
例如,在图5中,槽位B的接口板向主控板注册时,接口板会先读逻辑以获取槽位B在主控板中的索引号,然后将该索引号携带在注册消息中发送给主控板,主控板根据接收到的索引号获取接口板的相关信息(即关于槽位B的配置信息),并发送给该接口板。
而本发明中,槽位B的接口板向主控板注册时,接口板会先读逻辑以获取槽位B在主控板中的索引号,然后将该索引号(槽位B的索引号)携带在注册消息中发送给主控板,而主控板侧由于配置了transfer B to A的命令行,则需要将槽位B的索引号虚拟成槽位A的索引号,即需要将slotB(槽位B)虚拟成slotA(槽位A)。
如图6所示的寻址过程,针对现有技术,主控板读取到的索引为5001(槽位B的索引号),即主控板需要根据索引5001查找对应的配置信息。而本发明中,主控板读取到的索引仍为5001(槽位B的索引号),而由于主控板侧配置了transfer B to A的命令行,此时,索引指针会发生偏移,主控板需要将5001偏移到3001(即将槽位B的索引号偏移到槽位A的索引号),并需要根据索引3001查找对应的配置信息。
步骤405,主控板查找对应的配置信息。本应用场景中,该配置信息为槽位A的配置信息。
具体的,当接收到该注册消息后,根据该注册消息中的索引号,以及相应的命令行,该主控板能够查找到对应的配置信息。本应用场景中,主控板需要根据索引为3001(针对槽位A的索引)去获取具体的数据时,获取到的都是槽位A的相关槽号信息,即该主控板能够查找到槽位A对应的配置信息。
需要说明的是,该槽位A对应的配置信息包括但不限于:该槽位A的芯片类型;该槽位A的芯片号;该槽位A的槽位号(即槽位A);该槽位A的用户端口号;该槽位A的IP地址;该槽位A所使用的协议类型(例如,路由协议等)。
步骤406,主控板将槽位A的配置信息发送给该接口板。其中,该主控板可以通过注册响应消息将该槽位A的配置信息发送给该接口板。
步骤407,接口板根据该槽位A的配置信息处理业务。即在插入到槽位B上时,该接口板根据该槽位A的配置信息处理业务。
具体的,当接收到该槽位A的配置信息后,则说明该接口板注册成功并成功启动,此时,该接口板需要根据该槽位A的配置信息运行相关业务及流量的转发。
如图7的一种设备转发架构图示意图,在图7中,设备硬件架构的核心包括FA(Fabric Adaptor,网络适配器)、PP(芯片)、PHY(物理端口)、Crossbar(交换网)等架构,而上述FA、PP、PHY、Crossbar等均是实现报文转发的关键,为接口板的组成部分。
其中,PP上处理的业务量大;FA介于Crossbar和PP之间,主要实现与PP交换信息,再将需要向其他单板转发的信息传给Crossbar进行转发;而Crossbar上有很多端口,来实现与FA相连;其中,该Crossbar上的多个端口即为接口板所使用的槽位。
在报文转发过程中,PHY接收到报文后,发送给PP进行一系列处理及封装,PP再将处理好的报文发送给FA,FA将报文发送给Crossbar,由Crossbar转发给其他单板。
本应用场景下,由于SlotA的槽位已损坏,无法与crossbar通信。则crossbar不会将业务转给slot A来处理,会将原slotA上的业务转给slot B进行处理。通过槽位虚拟化转换后,slot B继承了slotA上原有的业务,既恢复了业务,又不会造成业务处理冲突。
基于与上述方法同样的发明构思,本发明还提出了一种设备管理装置,至少包括接口板和主控板,所述装置中还包括多个用于插入接口板的槽位,如果所述接口板对应的第一槽位出现故障时,将所述接口板插入到没有出现故障的第二槽位中,将所述接口板插入到所述第二槽位时,
所述接口板,用于向所述主控板发送注册消息,其中,所述注册消息中携带了所述第二槽位的标识信息。
另外,在本发明中,当主控板向接口板发送第一槽位的配置信息时,所述接口板还用于接收所述第一槽位的配置信息,并根据所述第一槽位的配置信息处理业务。
所述主控板,用于接收所述注册消息,将所述第二槽位的标识信息虚拟成所述第一槽位的标识信息;并根据所述第一槽位的标识信息查找所述第一槽位的配置信息;以及将所述第一槽位的配置信息发送给所述接口板。
本发明中,所述第一槽位的标识信息包括所述第一槽位的索引号;所述第二槽位的标识信息包括所述第二槽位的索引号;所述主控板还用于,通过命令行transfer第二槽位to第一槽位将所述第二槽位的索引号虚拟成所述第一槽位的索引号。
基于与上述方法同样的发明构思,本发明还提出了一种主控板,应用于至少包括接口板和主控板的设备中,所述设备中还包括多个用于插入接口板的槽位,如果所述接口板对应的第一槽位出现故障时,将所述接口板插入到没有出现故障的第二槽位中,在将所述接口板插入到所述第二槽位时,如图8所示,所述主控板包括:
收发模块10,用于接收所述接口板向所述主控板发送的注册消息,其中,所述注册消息中携带了所述第二槽位的标识信息;并将第一槽位的配置信息发送给所述接口板。
处理模块20,与所述收发模块10连接,用于将所述第二槽位的标识信息虚拟成所述第一槽位的标识信息;并根据所述第一槽位的标识信息查找所述第一槽位的配置信息;由所述收发模块将所述第一槽位的配置信息发送给所述接口板。
本发明中,所述第一槽位的标识信息包括所述第一槽位的索引号;所述第二槽位的标识信息包括所述第二槽位的索引号;所述处理模块20具体用于,通过命令行transfer第二槽位to第一槽位将所述第二槽位的索引号虚拟成所述第一槽位的索引号。
需要说明的是,本发明中,所述第一槽位的配置信息至少包括以下信息中的一种或任意几种:所述第一槽位的芯片类型;所述第一槽位的芯片号;所述第一槽位的槽位号;所述第一槽位的用户端口号;所述第一槽位的IP地址;所述第一槽位所使用的协议类型。
其中,本发明装置的各个模块可以集成于一体,也可以分离部署。上述模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD‑ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明序号仅仅为了描述,不代表实施例的优劣。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。