管理集群中成员机的方法及交换机.pdf

上传人:a1 文档编号:1085859 上传时间:2018-03-30 格式:PDF 页数:17 大小:665.89KB
返回 下载 相关 举报
摘要
申请专利号:

CN200910164096.4

申请日:

2009.08.11

公开号:

CN101621417A

公开日:

2010.01.06

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效|||公开

IPC分类号:

H04L12/24; H04L12/56

主分类号:

H04L12/24

申请人:

中兴通讯股份有限公司

发明人:

张 叶

地址:

518057广东省深圳市南山区科技南路55号

优先权:

专利代理机构:

北京康信知识产权代理有限责任公司

代理人:

余 刚;吴孟秋

PDF下载: PDF下载
内容摘要

本发明公开了一种管理集群中成员机的方法及交换机,该方法包括:交换机接收命令机的请求加入报文并判断交换机本身是否是其他集群中的成员机;如果是其他集群中的成员机,交换机判断其本身在其他集群中的状态是第一状态up还是第二状态down;如果交换机在其他集群中的状态是down则向命令机发送请求恢复报文;如果未收到命令机的应答报文,交换机将本身转化成候选机。本发明只需要通过一系列的监控判断流程而不用登陆到成员机就能让成员机自身触发相应的操作来修改配置信息。

权利要求书

1.  一种管理集群中成员机的方法,其特征在于,包括:
交换机接收命令机的请求加入报文并判断所述交换机本身是否是其他集群中的成员机;
如果是其他集群中的成员机,所述交换机判断其本身在所述其他集群中的状态是第一状态up还是第二状态down;
如果所述交换机在所述其他集群中的状态是down则向所述命令机发送请求恢复报文;
如果未收到所述命令机的应答报文,所述交换机将本身转化成候选机。

2.
  根据权利要求1所述的方法,其特征在于,在所述交换机判断本身是否是其他集群中的成员机之后,所述方法还包括:
如果不是其他集群中的成员机,则所述交换机响应所述请求加入报文。

3.
  根据权利要求1所述的方法,其特征在于,在所述交换机判断其本身在所述其他集群中的状态是第一状态up还是第二状态down之后,所述方法还包括:
如果所述交换机在所述其他集群中的状态是up则向所述命令机返回拒绝加入报文。

4.
  根据权利要求1所述的方法,其特征在于,如果未收到所述命令机的应答报文,所述交换机将本身转化成候选机包括:
如果在预设的时间内未收到所述命令机的应答报文,所述交换机将本身转化成候选机。

5.
  根据权利要求4所述的方法,其特征在于,在所述交换机向所述命令机发送请求恢复报文之后,所述方法还包括:
如果在预设的时间内收到所述命令机的应答报文,所述交换机重新加入所述其他集群恢复up状态。

6.
  根据权利要求4所述的方法,其特征在于,所述交换机将本身转化成候选机包括:
所述交换机通过触发角色转化命令将本身转化成候选机。

7.
  根据权利要求1所述的方法,其特征在于,在所述交换机将本身转化成候选机之后,所述方法还包括:
所述交换机向所述命令机发送报文来通知所述命令机重新传送请求加入报文。

8.
  一种交换机,其特征在于,包括:
第一判断模块,用于判断所述交换机本身是否是其他集群中的成员机;
第二判断模块,用于判断所述交换机本身在所述其他集群中的状态是状态一up还是状态二down;
发送模块,用于向命令机发送请求恢复报文;
转化模块,用于将本身转化成候选机。

9.
  根据权利要求8所述的交换机,其特征在于,所述交换机还包括:
触发模块,用于在判断所述交换机本身在所述其他集群中的状态是状态二down之后触发定时器。

10.
  根据权利要求9所述的交换机,其特征在于,所述交换机还包括:
接收模块,用于接收所述命令机返回的应答报文;
第三判断模块,用于判断是否在预设的时间内接收所述命令机返回的应答报文。

说明书

管理集群中成员机的方法及交换机
技术领域
本发明涉及通信领域,具体而言,涉及一种管理集群中成员机的方法及交换机。
背景技术
随着以太网技术的迅猛发展,以太网交换机的应用越来越广泛,但是由于以太网交换机数量比较多(尤其是低端设备),给管理工作带来一定的难度,因此提出了集群管理的解决方法。在集群管理中,当候选交换机加入集群成为成员交换机后,不管其被管理状态是up还是down,都不允许再加入其他集群被其他命令机所管理了,表现为成员机在收到其他命令机的请求加入报文后,不管自身的状态为up还是down,都会给对方发送拒绝加入消息。这就引出了下面的问题:
图1是根据相关技术的集群管理中对down状态成员机的处理示意图。
当成员机与命令机的通讯出现故障,在经历了有效保留时间(holdtime)仍然没有恢复,就会将自身协议状态显示为down。此时的成员机会不断向命令机发送请求恢复报文以求重新加到集群中去,通讯一旦恢复,成员机收到命令机的应答报文就能重新加入该集群恢复up状态;如果两者间的通讯始终不能恢复,请求恢复报文会以一定的间隔时间不断发送,此时如果有其他集群的命令机想加它为成员是会遭到拒绝的,这台长期失去命令机管理的成员机就会被孤立,已经失去了它加入集群的意义,失去了命令机的管理和维护。
在这种情况下如果想要加入其他集群,就需要登陆到成员机上将成员机恢复为候选机(因为只有候选机才能被命令机加入集群成为成员机),在我司交换机上操作步骤如下:首先将该down状态的成员机强制配置为独立机(即删除了集群的相关IP、集群名称、命令机信息等配置),相当于一次在命令机上删除成员的操作;其次再将独立机手动配置为候选机。
上述的操作步骤存在如下的不足之处:首先,这些配置命令都是要登陆到成员机上才能操作的,而在庞大的网络中要找到这台交换机也不是很容易的,如果是集群中的命令机发生瘫痪,它下挂的所有成员机都将失去管理,需要一台一台的去修改配置,那将是一件浩大的工程;其次,通过人为配置来修改交换机在集群中的角色也是不妥善的做法,因为该如何配置都是要根据网络拓扑的变化和实际的应用场景来的,如果成员机状态不是down,又或者没有其他命令机的请求加入报文,我们也不必去改变成员机的角色。
针对相关技术中某些down状态的成员机在它所属的集群中不能被命令机所管理,又不允许被其他集群来加入,使得交换机被孤立,不能被集群命令机所管理维护的问题,目前尚未提出有效的解决方案。
发明内容
针对某些down状态的成员机在它所属的集群中不能被命令机所管理,又不允许被其他集群来加入,使得交换机被孤立,不能被集群命令机所管理维护的问题而提出本发明,为此,本发明的主要目的在于提供一种管理集群中成员机的方法及交换机,以解决上述问题。
为了实现上述目的,根据本发明的一个方面,提供了一种管理集群中成员机的方法。
根据本发明的管理集群中成员机的方法包括:交换机接收命令机的请求加入报文并判断交换机本身是否是其他集群中的成员机;如果是其他集群中的成员机,交换机判断其本身在其他集群中的状态是第一状态up还是第二状态down;如果交换机在其他集群中的状态是down则向命令机发送请求恢复报文;如果未收到命令机的应答报文,交换机将本身转化成候选机.
优选地,在交换机判断本身是否是其他集群中的成员机之后,该方法还包括:如果不是其他集群中的成员机,则交换机响应请求加入报文。
优选地,在交换机判断其本身在其他集群中的状态是第一状态up还是第二状态down之后,该方法还包括:如果交换机在其他集群中的状态是up则向命令机返回拒绝加入报文。
优选地,如果未收到命令机的应答报文,交换机将本身转化成候选机包括:如果在预设的时间内未收到命令机的应答报文,交换机将本身转化成候选机。
优选地,在交换机向命令机发送请求恢复报文之后,该方法还包括:如果在预设的时间内收到命令机的应答报文,交换机重新加入其他集群恢复up状态。
优选地,交换机将本身转化成候选机包括:交换机通过触发角色转化命令将本身转化成候选机。
优选地,在交换机将本身转化成候选机之后,该方法还包括:交换机向命令机发送报文来通知命令机重新传送请求加入报文。
为了实现上述目的,根据本发明的另一方面,提供了一种交换机。
该交换机包括:第一判断模块,用于判断交换机本身是否是其他集群中的成员机;第二判断模块,用于判断交换机本身在其他集群中的状态是状态一up还是状态二down;发送模块,用于向命令机发送请求恢复报文;转化模块,用于将本身转化成候选机。
优选地,该交换机还包括:触发模块,用于在判断交换机本身在其他集群中的状态是状态二down之后触发定时器。
优选地,该交换机还包括:接收模块,用于接收命令机返回的应答报文。第三判断模块,用于判断是否在预设的时间内接收命令机返回的应答报文。
通过本发明,采用交换机接收命令机的请求加入报文并判断交换机本身是否是其他集群中的成员机;如果是其他集群中的成员机,交换机判断其本身在其他集群中的状态是第一状态up还是第二状态down;如果交换机在其他集群中的状态是down则向命令机发送请求恢复报文;如果未收到命令机的应答报文,交换机将本身转化成候选机,解决了某些down状态的成员机在它所属的集群中不能被命令机所管理,又不允许被其他集群来加入,使得交换机被孤立,不能被集群命令机所管理维护的问题,进而达到了只需要通过一系列的监控判断流程而不用登陆到成员机就能让成员机自身触发相应的操作来修改配置信息的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据相关技术的集群管理中对down状态成员机的处理示意图;
图2是根据本发明实施例的管理集群中成员机的方法的流程图;
图3是根据本发明实施例的使集群中Down状态的成员机转化为候选机的优选流程图;
图4是根据本发明实施例的优选的交换机的示意图。
具体实施方式
功能既述
考虑到某些down状态的成员机在它所属的集群中不能被命令机所管理,又不允许被其他集群来加入,使得交换机被孤立,不能被集群命令机所管理维护,本发明实施例提供了一种管理集群中成员机的方法及交换机,该方法包括:交换机接收命令机的请求加入报文并判断交换机本身是否是其他集群中的成员机;如果是其他集群中的成员机,交换机判断其本身在其他集群中的状态是第一状态up还是第二状态down;如果交换机在其他集群中的状态是down则向命令机发送请求恢复报文;如果未收到命令机的应答报文,交换机将本身转化成候选机。
优选地,设备在收到命令机的请求加入报文后,先记录下命令机的媒体接入控制(Media Access Control,简称为MAC)地址,通过MAC地址再来判断自己是否已经是其它集群中的成员机,如果是的话再判断该成员机在集群中的状态是up还是down的,如果是up的话就直接返回拒绝加入报文即可,如果是down的话就触发一个定时器(该定时器可以设置为10分钟:防止命令机由于断电重启等情况导致的不可达),在定时器时间内继续向原命令机发送请求恢复报文,如果在定时器超时后仍未收到原命令机的应答报文的话(即远端命令机不可达),成员机就会触发角色变化将自己转化成候选机,清除之前关于集群的相关配置,然后向先前发送请求加入报文的命令机发送flush报文:通知它重传请求加入报文。为防止flush报文丢失,可设置发送次数为3,间隔为8s(参照集群中命令机与成员机握手报文的发送间隔时间)。命令机在收到这样的flush报文后再重传先前的请求加入报文,接下来就是集群的正常加入过程了。这样就可以在不登陆成员机修改配置的情况下对设备重新管理起来。
但是如果down成员机并未收到其他命令机加入报文的话就不需要有任何操作,继续发送请求恢复报文直到通讯恢复为止。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
方法实施例
根据本发明的实施例,提供了一种管理集群中成员机的方法及交换机。
图2是根据本发明实施例的管理集群中成员机的方法的流程图。
如图2所示,该方法包括如下的步骤S202至步骤S208:
步骤S202,交换机接收命令机的请求加入报文并判断交换机本身是否是其他集群中的成员机;
步骤S204,如果是其他集群中的成员机,交换机判断其本身在其他集群中的状态是第一状态up还是第二状态down;
步骤S206,如果交换机在其他集群中的状态是down则向命令机发送请求恢复报文;
步骤S208,如果未收到命令机的应答报文,交换机将本身转化成候选机。
下面将结合实例对本发明实施例的实现过程进行详细描述。
图3是根据本发明实施例的使集群中Down状态的成员机转化为候选机的优选流程图。
如图3所示,本发明使集群中down状态的成员机转化为候选机技术方案流程部分的处理步骤如下:
步骤1:设备接收到命令机的请求加入报文。
步骤2:判断设备是否已经是其他集群中的成员机,如果是转入步骤3来判断该成员机在集群中的状态是up还是down,否则转入步骤5,进入正常的集群管理模块处理流程。
步骤3:判断该成员机在集群中的状态是up还是down,如果是up转入步骤5,进入正常的集群管理模块处理流程;如果是down转入步骤4。
步骤4:如果成员机是down的话就触发一个定时器,在该定时器时间内继续向原命令机发送请求恢复报文,如果在定时器超时之前就能收到原命令机的应答报文,则转入步骤5,进入正常的集群管理模块处理流程;否则转入步骤6。
步骤5:进入正常的集群管理模块处理流程,如果成员机是up的话就直接返回拒绝加入报文,交由集群管理模块处理,如果在定时器超时之前就能收到原命令机的应答报文,成员机就能重新加入该集群恢复up状态,进入up状态的处理流程。
步骤6:表明原命令机已不可达,触发角色转化命令,将自身转化为候选机,向新的命令机发送flush报文通知它重传之前的请求加入报文。优选地,如果在定时器超时后仍未收到原命令机的应答报文的话,成员机自身就会触发角色转化命令,进入down模式下的处理流程:首先像收到命令机的删除成员操作一样将自身恢复成候选机,然后向先前发送请求加入报文的命令机发送flush报文通知它重传先前的请求加入报文。
从以上的描述中,可以看出,本发明实现了如下技术效果:采用本发明使集群中down状态的成员机转化为候选机的方法,与现有的登陆成员机上修改配置信息相比:其一,节省了处理时间,提高了工作效率,不用登陆到成员机所在机架通过修改配置来实现了,本发明只需要通过一系列的监控判断流程就能让成员机自身触发相应的操作来达到目的。其二,对不同的环境能能灵活处理,只有满足了某些条件的成员机才需要触发命令使其转化为候选机,其他任何情况都不能随意修改交换机的角色。
装置实施例
根据本发明的实施例,提供了一种交换机。
图4是根据本发明实施例的优选的交换机的示意图。
如图4所示,该交换机400包括:第一判断模块402、第二判断模块404、发送模块406和转化模块408。
具体地,第一判断模块402,用于判断交换机本身是否是其他集群中的成员机;第二判断模块404,用于判断交换机本身在其他集群中的状态是状态一up还是状态二down;发送模块406,用于向命令机发送请求恢复报文;转化模块408,用于将本身转化成候选机。
优选地,交换机400还包括:触发模块410,用于在判断交换机本身在其他集群中的状态是状态二down之后触发定时器。
优选地,交换机400还包括:接收模块412,用于接收命令机返回的应答报文。
优选地,交换机400还包括:第三判断模块414,用于判断是否在预设的时间内接收命令机返回的应答报文。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

管理集群中成员机的方法及交换机.pdf_第1页
第1页 / 共17页
管理集群中成员机的方法及交换机.pdf_第2页
第2页 / 共17页
管理集群中成员机的方法及交换机.pdf_第3页
第3页 / 共17页
点击查看更多>>
资源描述

《管理集群中成员机的方法及交换机.pdf》由会员分享,可在线阅读,更多相关《管理集群中成员机的方法及交换机.pdf(17页珍藏版)》请在专利查询网上搜索。

本发明公开了一种管理集群中成员机的方法及交换机,该方法包括:交换机接收命令机的请求加入报文并判断交换机本身是否是其他集群中的成员机;如果是其他集群中的成员机,交换机判断其本身在其他集群中的状态是第一状态up还是第二状态down;如果交换机在其他集群中的状态是down则向命令机发送请求恢复报文;如果未收到命令机的应答报文,交换机将本身转化成候选机。本发明只需要通过一系列的监控判断流程而不用登陆到成员。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1