《基于TUXEDO中间件的通讯调度方法、装置及系统.pdf》由会员分享,可在线阅读,更多相关《基于TUXEDO中间件的通讯调度方法、装置及系统.pdf(14页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104090824A43申请公布日20141008CN104090824A21申请号201410252234522申请日20140609G06F9/5020060171申请人中国建设银行股份有限公司地址100032北京市西城区金融大街25号72发明人徐渊林唐成山杨芬黄文宝雷鸣李世宁王东付磊74专利代理机构广州三环专利代理有限公司44202代理人温旭郝传鑫54发明名称基于TUXEDO中间件的通讯调度方法、装置及系统57摘要本发明实施例公开了一种基于TUXEDO中间件的通讯调度方法、装置及系统,其中,所述方法包括根据生产主机的TUXEDO域配置,周期性地探测所述生产主机的工作状态。
2、,并将探测结果记录在探测日志中;周期性地轮询所述探测日志,根据所述探测日志中的探测结果判断是否存在异常;如果存在异常,则隔离异常生产主机,并启动应急主机的TUXEDO域配置使所述应急主机接管所述异常生产主机进行业务处理。采用本发明实施例所提供的方法、装置和系统,实现了异常生产主机自动隔离和应急主机自动接管,确保了TUXEDO中间件和基于TUXEDO中间件的应用系统的高可用和高可靠性。51INTCL权利要求书2页说明书6页附图5页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书6页附图5页10申请公布号CN104090824ACN104090824A1/2页21一种基于TUX。
3、EDO中间件的通讯调度方法,其特征在于,所述方法包括根据生产主机的TUXEDO域配置,周期性地探测所述生产主机的工作状态,并将探测结果记录在探测日志中;周期性地轮询所述探测日志,根据所述探测日志中的探测结果判断是否存在异常;如果存在异常,则隔离异常生产主机,并启动应急主机的TUXEDO域配置使所述应急主机接管所述异常生产主机进行业务处理。2如权利要求1所述的方法,其特征在于,周期性地探测所述生产主机的工作状态包括周期性地PING所述生产主机以探测所述生产主机是否可连通;和/或,按照绿灯交易配置向所述生产主机发送绿灯交易以探测是否能完成绿灯交易。3如权利要求1所述的方法,其特征在于,隔离所述异常。
4、生产主机包括清理所述异常生产主机的内存或通讯进程,或禁用所述异常生产主机的网络端口。4如权利要求13中任一项所述的方法,其特征在于,在所述应急主机与所述异常生产主机二者的IP地址不同的条件下,二者的TUXEDO域配置相同;和/或当所述生产主机为多个时,在所述应急主机与各生产主机的IP地址均不同的条件下,所述应急主机配置有分别与各生产主机相同的TUXEDO域配置。5如权利要求1所述的方法,其特征在于,在探测所述生产主机的工作状态之前,所述方法还包括读取配置文件,其中,所述配置文件配置了所述生产主机的TUXEDO域配置,或,所述配置文件配置了所述生产主机的TUXEDO域配置、用于绿灯交易的绿灯交易。
5、配置、用于PING所述生产主机的PING策略、和用于所述应急主机接管所述异常生产主机的干预策略。6一种基于TUXEDO中间件的通讯调度装置,其特征在于,所述装置包括探测器,用于根据生产主机的TUXEDO域配置周期性地探测所述生产主机的工作状态,并将探测结果记录在探测日志中;干预器,用于周期性地轮询所述探测日志,根据所述探测日志中的探测结果判断是否存在异常,以及在判断存在异常时,隔离异常生产主机,并启动应急主机的TUXEDO域配置使所述应急主机接管所述异常生产主机进行业务处理。7如权利要求6所述的装置,其特征在于,所述探测器包括第一探测模块,用于周期性地PING所述生产主机以探测所述生产主机是否。
6、可连通;和/或第二探测模块,用于按照绿灯交易配置向所述生产主机发送绿灯交易以探测是否能完成绿灯交易。8如权利要求6所述的装置,其特征在于,所述干预器包括隔离模块,用于清理所述异常生产主机的内存或通讯进程,或禁用所述异常生产主机的网络端口,以隔离所述异常生产主机。9如权利要求68中任一项所述的装置,其特征在于,在所述应急主机与所述异常生产主机二者的IP地址不同的条件下,二者的TUXEDO域权利要求书CN104090824A2/2页3配置相同;和/或当所述生产主机为多个时,在所述应急主机与各生产主机的IP地址均不同的条件下,所述应急主机配置有分别与各生产主机相同的TUXEDO域配置。10如权利要求。
7、6所述的装置,其特征在于,所述装置还包括读取器,用于读取配置文件;所述配置文件配置了所述生产主机的TUXEDO域配置,或,所述配置文件配置了所述生产主机的TUXEDO域配置、用于绿灯交易的绿灯交易配置、用于PING所述生产主机的PING策略和用于所述应急主机接管所述异常生产主机的干预策略。11一种基于TUXEDO中间件的通讯调度系统,其特征在于,所述系统包括用于进行业务处理的生产主机;基于TUXEDO域连接方式与所述生产主机通讯的请求方系统;用于接管异常生产主机进行业务处理的应急主机;和如权利要求610中任一项所述的通讯调度装置。权利要求书CN104090824A1/6页4基于TUXEDO中间。
8、件的通讯调度方法、装置及系统技术领域0001本发明涉及基于TUXEDO中间件的通讯领域,更具体地,涉及一种基于TUXEDO中间件的通讯调度方法、装置及系统。背景技术0002集群多AP模式下的通讯调度一般通过通讯中间件来实现。TUXEDO实现了两种主要场景的通讯调度短连接场景的WSL方式和长连接场景的GWTDOMAIN方式。0003在WSL方式中,参照图1A,客户端通过TUXEDOAPIAPPLICATIONPROGRAMMINGINTERFACE,应用程序编程接口实现目标WSL的选择,所有APAPPLICATION,此处AP指的是应用机器的WSL监听地址端口集合必须事先配置在客户端环境WSNA。
9、DDR变量中,以作为API选择WSL的范围。API最常用的是通过轮询的方式来选择。0004在GWTDOMAIN方式中,参照图1B,客户端和多AP之间通过GWTDOMAIN事先建立长连接,客户端请求AP时由GWTDOMAIN负责报文的分发,客户端GWTDOMAIN进程会选择目标GWTDOMAIN,并由目标GWTDOMAIN转发报文给目标AP。GWTDOMAIN一般也是采用轮询或者最近最空闲的分发策略。0005在现有的采用TUXEDO中间件的通讯调度中,当主机发生掉电、异常停机或网卡故障中断等异常时,TUXEDO服务和应用容易HANG住,导致整个系统例如系统整体交易处理受到影响,系统高可用生效慢例。
10、如,整个系统交易需要10分钟才能恢复。概言之,在现有技术中,通讯中间件不能实现高可用,整个集群应用系统也无法实现高效、可靠和高可用。发明内容0006为解决上述技术问题,本发明提供了一种能实现通讯中间件和集群应用系统高可用的基于TUXEDO中间件的通讯调度方法、装置及系统。0007本发明实施例提供了一种基于TUXEDO中间件的通讯调度方法,所述方法包括0008根据生产主机的TUXEDO域配置,周期性地探测所述生产主机的工作状态,并将探测结果记录在探测日志中;0009周期性地轮询所述探测日志,根据所述探测日志中的探测结果判断是否存在异常;0010如果存在异常,则隔离异常生产主机,并启动应急主机的T。
11、UXEDO域配置使所述应急主机接管所述异常生产主机进行业务处理。0011本发明实施例还提供了一种基于TUXEDO中间件的通讯调度装置,所述装置包括0012探测器,用于根据生产主机的TUXEDO域配置周期性地探测所述生产主机的工作状态,并将探测结果记录在探测日志中;0013干预器,用于周期性地轮询所述探测日志,根据所述探测日志中的探测结果判断是否存在异常,以及在判断存在异常时,隔离异常生产主机,并启动应急主机的TUXEDO域说明书CN104090824A2/6页5配置使所述应急主机接管所述异常生产主机进行业务处理。0014相应地,本发明实施例还提供了一种基于TUXEDO中间件的通讯调度系统,该系。
12、统包括0015用于进行业务处理的生产主机;0016基于TUXEDO域连接方式与所述生产主机通讯的请求方系统;0017用于接管异常生产主机进行业务处理的应急主机;和0018前述通讯调度装置。0019实施本发明实施例所提供的基于TUXEDO中间件的通讯调度方法、装置和系统,能够在生产主机出现异常例如故障、掉电等时,实现异常生产主机自动隔离和应急主机自动接管,确保了TUXEDO中间件和基于TUXEDO中间件的应用系统的高可用和高可靠性。附图说明0020图1A是现有TUXEDO短连接场景的WSL方式的示意图;0021图1B是现有TUXEDO长连接场景的GWTDOMAIN方式的示意图;0022图2是根据。
13、本发明实施例的一种基于TUXEDO中间件的通讯调度方法的流程示意图;0023图3A是正常状态下请求方系统与生产主机通讯的示意图;0024图3B是异常状态下请求方系统与应急主机通讯的示意图;0025图4是根据本发明实施例的一种基于TUXEDO中间件的通讯调度方法的流程示意图;0026图5是根据本发明实施例的一种基于TUXEDO中间件的通讯调度装置的方块示意图;0027图6是根据本发明实施例的一种基于TUXEDO中间件的通讯调度装置的方块示意图;0028图7是根据本发明实施例的一种基于TUXEDO中间件的通讯调度方法的具体实现方式的框架图;0029图8是根据本发明实施例的一种基于TUXEDO中间件。
14、的通讯调度系统的方块示意图。具体实施方式0030下面将结合附图对本发明实施例中的技术方案进行清楚、完整的描述。0031首先,对本发明涉及或可能涉及的部分词汇进行解释0032综合前置INTEGRATEDCHANNELSYSTEMBUS,ICSB将9个部署在分行的总推分系统统一整合到“综合前置”系统,实现综合前置上收到总行数据中心的目标。0033TUXEDOTRANSACTIONFORUNIXHASBEENEXTENDEDFORDISTRIBUTEDOPERATION,被分布式操作扩展之后的UNIX事务系统,其介于客户机与服务器之间的夹层。TUXEDO突破了二层C/S结构的局限性,为构建大规模、高。
15、性能、分布式C/S应用程序提供了通信、事务、安全、容错等基础服务,它屏蔽了底层技术细节,使应用程序开发不必再从底层做起,以自身的复杂性换来了应用程序开发的简单。说明书CN104090824A3/6页60034图2是根据本发明实施例的一种基于TUXEDO中间件的通讯调度方法的流程示意图,参照图2,该方法包括0035200根据生产主机的TUXEDO域配置,周期性地探测所述生产主机的工作状态,并将探测结果记录在探测日志中。0036在本实施例中,并不限制生产主机的数目,例如,可以是1个,也可以是1个以上。0037本发明中提及的“生产主机”是指正常状态下应当进行业务处理的主机。示例性地,如图3A所示,在。
16、正常生产状态下,生产主机1和生产主机2例如,以负载均衡的方式与请求方系统渠道系统或柜面系统通讯。0038202周期性地轮询所述探测日志,根据所述探测日志中的探测结果判断是否存在异常。0039204如果存在异常,则隔离异常生产主机,并启动应急主机的TUXEDO域配置使所述应急主机接管所述异常生产主机进行业务处理。0040示例性地,如图3B所示,当根据日志判断生产主机2异常时,启动应急主机接管生产主机2。0041通过本实施例所提供的方法,实现了异常生产主机的自动隔离和应急主机的自动接管,确保了TUXEDO中间件和基于TUXEDO中间件的应用系统的高可用和高可靠性。0042图4是根据本发明实施例的一。
17、种基于TUXEDO中间件的通讯调度方法的流程示意图,参照图4,该方法包括0043400读取配置文件。该配置文件配置了生产主机的TUXEDO域配置。0044402根据生产主机的TUXEDO域配置,周期性地探测所述生产主机的工作状态,并将探测结果记录在探测日志中。0045可选的,402可通过以下方式实现0046方式一周期性地PING所述生产主机以探测所述生产主机是否可连通例如,探测渠道端与生产主机之间的通讯链路是否可连通。0047方式二按照绿灯交易配置向所述生产主机发送绿灯交易以探测是否能完成绿灯交易。绿灯交易指的是探测器与生产主机约定好通讯协议、报文协议、返回报文超时时间等,一般来说,探测器发起。
18、绿灯交易报文,在发起绿灯交易后,生产主机应在约定超时时间之内返回报文给探测器,探测器收到返回报文则视为绿灯交易成功而不关心返回的报文内容,超时未收到返回报文则视为绿灯交易失败。0048404周期性地轮询所述探测日志,根据所述探测日志中的探测结果判断是否存在异常。0049406如果存在异常,则隔离异常生产主机,并启动应急主机的TUXEDO域配置使所述应急主机接管所述异常生产主机进行业务处理。0050可选的,在406中,可通过清理所述异常生产主机的内存或通讯进程,或禁用所述异常生产主机的网络端口的方式来隔离异常生产主机。0051可选的,在本实施例的恶意中实现方式中,在应急主机上搭建的连接数例如与渠。
19、道端的连接数或与柜面端的连接数与在生产主机上搭建的连接数相同。0052可选的,在本实施例的一种实现方式中,应急主机与生产主机的IP在同网段但是IP地址不同,并且除了IP地址不同之外,二者的TUXEDO域配置相同。将应急主机的TUXEDO说明书CN104090824A4/6页7域配置编译生效,这样,当启动应急主机的TUXEDO域配置后,该应急主机即可像生产主机那样与请求方系统例如,渠道端或柜面端进行通讯,从而接管异常生产主机进行业务处理。0053可选的,在本实施例的一种实现方式中,生产主机可以为多个,此时应急主机除了与各生产主机的IP地址均不同之外,应急主机配置有分别与各生产主机相同的TUXED。
20、O域配置。当某一个生产主机异常时,启动与该异常生产主机对应的TUXEDO域配置即可接管相应的业务处理职能。0054需要说明的是,本实施例并不限制隔离异常生产主机和启动应急主机的先后顺序。0055可选的,在本实施例的一种实现方式中,400中读取的配置文件还可以配置有用于绿灯交易的绿灯交易配置,以便在402中采用所述方式二进行探测;和/或,配置有用于PING所述生产主机的PING策略,以便在402中采用所述方式一进行探测;和/或,配置有用于所述应急主机接管所述异常生产主机的干预策略,以便在406中隔离和接管异常生产主机。0056图5是根据本发明实施例的一种基于TUXEDO中间件的通讯调度装置的方块。
21、示意图,参照图5,通讯调度装置5包括探测器51和干预器52,下面分别进行说明。0057探测器51,用于根据生产主机的TUXEDO域配置周期性地探测所述生产主机的工作状态,并将探测结果记录在探测日志中。0058其中,可选的,应急主机与异常生产主机二者的IP地址不同,除此之外二者的TUXEDO域配置相同。0059其中,可选的,当生产主机为多个时,在应急主机与各生产主机的IP地址均不同,除此之外,应急主机配置有分别与各生产主机相同的TUXEDO域配置。0060干预器52,用于周期性地轮询所述探测日志,根据所述探测日志中的探测结果判断是否存在异常,以及在判断存在异常时,隔离异常生产主机,并启动应急主机。
22、的TUXEDO域配置使所述应急主机接管所述异常生产主机进行业务处理。0061通过本实施例所提供的通讯调度装置5,能够实现异常生产主机的自动隔离和应急主机的自动接管,确保了TUXEDO中间件和基于TUXEDO中间件的应用系统的高可用和高可靠性。0062图6是根据本发明实施例的一种基于TUXEDO中间件的通讯调度装置的方块示意图,参照图6,通讯调度装置6包括读取器60、探测器61和干预器62,下面分别进行说明。0063读取器60,用于读取配置文件。该配置文件配置有生产主机的TUXEDO域配置。0064探测器61,用于根据生产主机的TUXEDO域配置周期性地探测所述生产主机的工作状态,并将探测结果记。
23、录在探测日志中。0065可选的,在本实施例的一种实现方式中,探测器61包括0066第一探测模块611,用于周期性地PING所述生产主机以探测所述生产主机是否可连通;和/或0067第二探测模块612,用于按照绿灯交易配置向所述生产主机发送绿灯交易以探测是否能完成绿灯交易。0068干预器62,用于周期性地轮询所述探测日志,根据所述探测日志中的探测结果判说明书CN104090824A5/6页8断是否存在异常,以及在判断存在异常时,隔离异常生产主机,并启动应急主机的TUXEDO域配置使所述应急主机接管所述异常生产主机进行业务处理。0069可选的,在本实施例的一种实现方式中,干预器62包括0070隔离模。
24、块621,用于清理所述异常生产主机的内存或通讯进程,或禁用所述异常生产主机的网络端口,以隔离所述异常生产主机。0071可选的,在本实施例的一种实现方式中,读取器60读取的配置文件还可以选择性地配置有用于绿灯交易的绿灯交易配置、用于PING所述生产主机的PING策略和用于所述应急主机接管所述异常生产主机的干预策略。0072图7是根据本发明实施例的一种基于TUXEDO中间件的通讯调度方法的具体实现方式的框架图,下面具体进行说明。0073CONGTXT是配置文件,配置了生产主机的TUXEDO配置、绿灯交易配置以及探测及干预策略等。0074LOG记录整个框架的各种日志,包括探测结果、干预过程和干预结果。
25、等。0075MANAGERSH是整个框架的主控脚本,通过执行该脚本可以启动探测器DETECTSH、干预器INTERFERESH和读取器GETCONGSH。0076外部探测及干预工作流程如下首先通过GETCONGSH获得生产配置文件。然后启动探测器DETECTORSH,探测器定时采用PING或者发绿灯交易的方式探测生产主机的状态,并将探测结果记录在LOG里;启动干预器INTERFERESH,干预器会定时轮询探测日志LOG,如果探测结果返回异常,则按照干预策略由应急主机接管故障主机的所有域连接,即自动隔离故障主机,从而可以在最短的时间内自动恢复生产运行,做到应急自动化。0077图8是根据本发明实施。
26、例的一种基于TUXEDO中间件的通讯调度系统的方块示意图,参照图8,该系统包括0078用于进行业务处理的生产主机81、基于TUXEDO域连接方式与生产主机通讯的请求方系统82例如,柜面系统或渠道系统、用于接管异常生产主机进行业务处理的应急主机83,以及通讯调度装置84。其中,通讯调度装置84可以是图5所示通讯调度装置5或图6所示通讯调度装置6。0079本实施例所提供的基于TUXEDO中间件的通讯调度系统具有高可用性和高可靠性。0080下面对本发明所提供的基于TUXEDO中间件的通讯调度方法、装置和系统所适用的一种场景综合前置应用系统进行说明。0081根据TUXEDO域通讯的发展趋势,综合前置应。
27、用系统的接入渠道的通讯方式将逐步统一为TUXEDO域通讯方式,这是因为这种方式比较稳定成熟,适用于集群部署模式,可以方便快速的实现故障隔离。0082根据本发明实施例的一种综合前置应用系统,以TUXEDO域实例为单位进行了分组,分组结果如下0083CCBS连接CCBS南北中心网关,由于主机交易占综合前置交易量比重较大,且重要性最高,故为CCBS专设一组;0084TELLER接入综合前端,同样出于业务重要性考虑;0085HEADQUARTER接入接出其它总行级系统;说明书CN104090824A6/6页90086BRANCH接入接出其它分行部署的系统;0087SPECIAL接入接出服务质量较低的外。
28、围系统。0088以前只有一组TUXEDO域通讯参数时,某个具体系统的域通讯参数变更时,将影响所有的接入接出系统,导致域通讯参数变更频繁,影响所有接入接出综合前置应用系统的业务交易。而进行上述分组后,域通讯参数变更只涉及该系统所在分组,只影响该系统所在分组的系统业务交易,做到了很好的故障隔离。0089虽然TUXEDO域连接通讯是长连接,但如果渠道系统长时间没有交易,域通讯长连接就会被网络防火墙切断,又或者服务系统长时间无响应,渠道系统需要在给定时间内断开与服务系统的域连接,避免交易堵塞。为了实现该目的,就需要配置TUXEDO域连接通讯参数,TUXEDO81及以上版本需要配置DMKEEPALIVE。
29、60000和DMKEEPALIVEWAIT10000参数“DMKEEPALIVE”和“DMKEEPALIVEWAIT”是应用层配置对应的配置参数,其中,“DMKEEPALIVE”用来指定域网关在间隔多久没有收到网络包后向对方发送KEEPALIVE请求消息;DMKEEPALIVEWAIT用来指定域网关在发出KEEPALIVE请求消息后,等待对方应答的最长时间间隔,如果超出这个时间间隔还没收到应答,则认为域连接已经出现故障,关闭连接,释放相关资源,对于TUXEDO80及以下版本配置TCPKEEPALIVE”Y”配置这个参数使得所有的网络连接都将使用同样的KEEPALIVE时间间隔参数。综合前置系统。
30、可全部配置该参数,从而能够在上述CCBS网关系统一台AP宕机事件中成功避免交易堵塞。对于TUXEDO关键服务和关键进程如GWTDOMAIN等均配置自动重启机制,保证进程出现异常时可以自动重启。TUXEDO关键服务和关键程序的自动重启,配合本申请所提供的应急主机能够在生产主机异常时有效进行业务接管处理。0090通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘。
31、等,包括若干指令用以使得一台计算机设备可以是个人计算机,服务器,或者网络设备等执行本发明各个实施例或者实施例的某些部分所述的方法。0091以上所揭露的仅为本发明的优选实施例而已,当然不能以此来限定本发明的保护范围,因此依本发明权利要求的教导对上述实施例所作的等同变化,仍属于本发明权利要求所涵盖的范围内。说明书CN104090824A1/5页10图1A图1B说明书附图CN104090824A102/5页11图2图3A说明书附图CN104090824A113/5页12图3B图4说明书附图CN104090824A124/5页13图5图6说明书附图CN104090824A135/5页14图7图8说明书附图CN104090824A14。