《云端系统的主机监控及异常处理方法.pdf》由会员分享,可在线阅读,更多相关《云端系统的主机监控及异常处理方法.pdf(22页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103365755 A (43)申请公布日 2013.10.23 CN 103365755 A *CN103365755A* (21)申请号 201210084484.3 (22)申请日 2012.03.27 G06F 11/30(2006.01) G06F 11/07(2006.01) (71)申请人 台达电子工业股份有限公司 地址 中国台湾桃园县 (72)发明人 毛之成 黄文铭 许秉慧 (74)专利代理机构 隆天国际知识产权代理有限 公司 72003 代理人 张龙哺 冯志云 (54) 发明名称 云端系统的主机监控及异常处理方法 (57) 摘要 本发明公开了一种云端。
2、系统的主机监控及异 常处理方法, 于云端的各实体主机中分别具有一 常驻模块, 并由常驻模块来监控实体主机的健康 状况, 再提供给云端的一管理终端。 当管理终端察 觉有任一实体主机的运作异常时, 即发出一控制 指令至运作异常的实体主机所在的机柜, 并由机 柜来强制运作异常的实体主机退出机柜之外。如 此, 有利于管理人员至现场更换运作异常的实体 主机的便利性, 以节省实地寻找所需花费的时间。 (51)Int.Cl. 权利要求书 3 页 说明书 7 页 附图 11 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书3页 说明书7页 附图11页 (10)申请公布号 CN 103。
3、365755 A CN 103365755 A *CN103365755A* 1/3 页 2 1. 一种云端系统的主机监控及异常处理方法, 运用于至少一管理终端及多个实体主机 之上, 其中该多个实体主机分别设置于机房中的多个机柜之中, 该云端系统的主机监控及 异常处理方法包括 : a) 该管理终端取得指出至少一台该实体主机运作异常的异常信息 ; b) 该管理终端依据该异常信息产生一控制指令, 并传送该控制指令至该实体主机所在 的机柜 ; c) 该机柜接收该控制指令, 并依据该控制指令控制对应的该实体主机退出该机柜之 外。 2. 如权利要求 1 所述的云端系统的主机监控及异常处理方法, 其中该机。
4、柜内部具有一 控制模块, 并且该机柜中的各个插槽上分别设有用以卡固该实体主机的卡榫, 该步骤 c 还 包括 : c1) 该机柜通过该控制模块接收该控制指令 ; c2) 该控制模块依据该控制指令的内容, 控制该机柜的对应位置上的该卡榫移动, 以令 该对应位置中的该实体主机退出该机柜。 3.如权利要求1所述的云端系统的主机监控及异常处理方法, 其中还包括一步骤d : 该 机柜接收该控制指令, 并依据该控制指令于该机柜的对应位置发出一警示信号。 4. 如权利要求 3 所述的云端系统的主机监控及异常处理方法, 其中该机柜于各该实体 主机的配置位置上分别设置有发光元件, 该步骤 d 中通过该发光元件发出。
5、该警示信号。 5. 如权利要求 1 所述的云端系统的主机监控及异常处理方法, 其中该管理终端内具有 一监控应用程序接口, 并且该步骤 a 包括下列步骤 : a1) 该管理终端通过内部的该监控应用程序接口, 于网络上的一分享储存池中取得该 云端机房中的所有实体主机的至少一记录文件, 其中所述至少一记录文件分别记录所述实 体主机的运作状况 ; 及 a2) 该管理终端依据所述至少一记录文件进行计算, 以判断所述实体主机是否有运作 异常的现象。 6. 如权利要求 5 所述的云端系统的主机监控及异常处理方法, 其中各该实体主机内部 分别具有一常驻模块, 该步骤 a 之前还包括下列步骤 : a01) 各该。
6、实体主机通过内部的该常驻模块, 监控各该实体主机的各项数值信息 ; a02) 该常驻模块分别统计各项数值信息 ; a23) 该常驻模块依据统计结果制作该记录文件 ; 及 a14) 该常驻模块将该记录文件储存于网络上的该分享储存池中。 7. 如权利要求 6 所述的云端系统的主机监控及异常处理方法, 其中该记录文件分别统 计各该实体主机的中央处理器状态、 存储器状态、 硬盘状态、 网络状态、 温度状态、 电压状态 及风扇转速状态。 8.如权利要求6所述的云端系统的主机监控及异常处理方法, 其中该记录文件为.rrd 文件。 9. 如权利要求 5 所述的云端系统的主机监控及异常处理方法, 其中该步骤 。
7、a2 中, 该管 理终端判断该实体主机是否发生异常事件, 并判断该实体主机是否处于异常状态, 其中该 实体主机于持续发生异常事件达一预定时间后, 被视为处于异常状态。 权 利 要 求 书 CN 103365755 A 2 2/3 页 3 10. 如权利要求 9 所述的云端系统的主机监控及异常处理方法, 其中该管理终端于该 实体主机出现异常事件时产生一异常事件信息, 并于该实体主机处于异常状态时产生一异 常状态信息。 11. 如权利要求 1 所述的云端系统的主机监控及异常处理方法, 其中该管理终端更提 供一使用者界面, 该步骤 b 包括下列步骤 : b1) 该使用者界面接受外部的触发 ; 及 b。
8、2) 依据上述触发产生并传送该控制信号。 12. 如权利要求 11 所述的云端系统的主机监控及异常处理方法, 其中还包括一步骤 b3 : 通过该使用者界面显示一警示信息。 13. 如权利要求 1 所述的云端系统的主机监控及异常处理方法, 其中各该实体主机内 部分别具有一常驻模块, 该步骤 a 之前还包括下列步骤 : a11) 各该实体主机通过内部的该常驻模块, 监控各该实体主机的各项数值信息 ; a12) 该常驻模块依据所述多个数值信息与预设的一门限值进行计算 ; a13) 该常驻模块依据计算结果判断该实体主机是否出现运作异常的现象 ; a14) 若判断该实体主机运作异常, 该常驻模块产生该异。
9、常信息 ; 及 a15) 该常驻模块对外传送该异常信息。 14.如权利要求13所述的云端系统的主机监控及异常处理方法, 其中该步骤a13中, 判 断该实体主机是否发生异常事件, 并判断该实体主机是否处于异常状态, 其中该实体主机 于持续发生异常事件达一预定时间后, 被视为处于异常状态。 15. 如权利要求 14 所述的云端系统的主机监控及异常处理方法, 其中该步骤 a14 及该 步骤 a15 中, 于该实体主机有发生异常事件时, 产生一异常事件信息并对外传送, 并于该实 体主机处于异常状态时, 产生一异常状态信息并对外传送。 16.如权利要求13所述的云端系统的主机监控及异常处理方法, 其中该。
10、步骤a15中, 该 实体主机通过该常驻模块, 将该异常信息传送至该管理终端。 17. 如权利要求 16 所述的云端系统的主机监控及异常处理方法, 其中该管理终端内执 行有至少一信息队列, 各该实体主机分别传送该异常信息并排列于该信息队列。 18.如权利要求13所述的云端系统的主机监控及异常处理方法, 其中该步骤a15中, 该 实体主机通过该常驻模块, 将该异常信息传送至一数据库, 该步骤 a 中, 该管理终端连线至 该数据库中以取得该异常信息。 19. 一种云端系统的主机监控及异常处理方法, 运用于至少一管理终端及多个实体主 机之上, 其中该多个实体主机分别设置于机房中的多个机柜的中, 该多个。
11、实体主机内部分 别具有一常驻模块, 该云端系统的主机监控及异常处理方法包括 : a) 各该实体主机分别通过内部的该常驻模块, 监控各该实体主机的各项数值信息 ; b) 该常驻模块分别统计所述多个数值信息, 并依据统计结果制作一记录文件 ; c) 该常驻模块将该记录文件储存于网络上的一分享储存池中 ; d) 该管理终端通过内部的监控应用程序接口, 于该分享储存池中取得所有实体主机的 该记录文件 ; e) 该管理终端依据所述多个记录文件进行计算, 以判断所述多个实体主机是否有运作 异常的现象 ; 权 利 要 求 书 CN 103365755 A 3 3/3 页 4 f) 承步骤 e, 当所述多个实。
12、体主机的其中之一有运作异常的现象时, 该管理终端产生 一控制指令, 并传送至该运作异常的实体主机所在的机柜 ; 及 g) 该机柜接收该控制指令, 并依据该控制指令控制该运作异常的实体主机退出该机柜 之外。 20. 一种云端系统的主机监控及异常处理方法, 运用于至少一管理终端及多个实体主 机之上, 其中该多个实体主机分别设置于机房中的多个机柜的中, 该多个实体主机内部分 别具有一常驻模块, 该云端系统的主机监控及异常处理方法包括 : a) 各该实体主机分别通过内部的该常驻模块, 监控各该实体主机的各项数值信息 ; b) 该常驻模块依据所述多个数值信息与预设的一门限值进行计算, 并依据计算结果判 。
13、断该实体主机是否有运作异常的现象 ; c) 若该常驻模块判断该实体主机运作异常, 该常驻模块产生一异常信息 ; d) 该常驻模块对外传送该异常信息, 并排列于该管理终端中的一信息队列中 ; e) 该管理终端依据该信息队列中的该异常信息产生一控制指令, 并传送至该运作异常 的实体主机所在的机柜 ; 及 f) 该机柜接收该控制指令, 并依据该控制指令控制该运作异常的实体主机退出该机柜 之外。 权 利 要 求 书 CN 103365755 A 4 1/7 页 5 云端系统的主机监控及异常处理方法 技术领域 0001 本发明有关于云端机房中的实体主机, 尤其有关于可以监控实体主机的运作状 况, 并于运。
14、作异常时, 即时强制实体主机退出机柜的方法。 背景技术 0002 近来, 因半导体产业的迅速发展, 实令电脑的功能愈来愈强大, 并且, 伴随着网际 网络的发达, 由服务端的服务器来代替客户端电脑进行运算作业的云端概念已被视为电脑 领域未来发展的重点。 0003 如图 1 所示, 为先前技术的云端机房示意图。一般来说, 一个强大的云端计算中 心, 实包含了数以万计的实体主机 12, 再由这些实体主机 12 来为客户端提供各种运算服 务。虽然每一台实体主机 12 视客户端的需求而定, 皆用以执行不同的工作, 然而于云端机 房 1 中, 这些实体主机 12 通常具有一样的外观, 管理人员难以由这些实。
15、体主机 12 的外观, 直接辨识这些实体主机 12 分别扮演何种角色 ( 如运算服务器或储存服务器等 )。 0004 如上所述, 当云端机房 1 中其中一台实体主机 12 损坏而需要被更换时, 管理人员 要在为数可观的实体主机 12 中, 正确找到需要更换的实体主机 12, 实有困难。是以, 目前 市场上提供了一种云端机房 1 的管理系统, 于其中一实体主机 12 损坏时, 自动通知管理人 员该损坏的实体主机 12 位于哪一层楼的哪一间机房 1, 并且位于该机房 1 中哪一个机柜 11 中的哪一格的位置信息。由此, 管理人员可依据该位置信息, 至现场查找对应的位置, 以更 换该损坏的实体主机 。
16、12。 0005 然而如前文所述, 每一台实体主机 12 的外观皆大同小异, 若一间机房 1 中有数十 或数百个机柜11, 而每一个机柜11中又有数十或数百台实体主机12, 即使管理人员拥有上 述的位置信息, 仍难以快速的找到该损坏的实体主机 12 的实际位置。如此, 不但会造成管 理人员的困扰, 拉长更换实体主机 12 所需的工作时间, 还可能因管理人员的人为疏失而换 错实体主机 12, 进而造成无法挽回的错误。 0006 是以, 市场上实需一种新颖的技术, 于云端机房1中的实体主机12需要更换时, 不 但能提供正确位置信息给管理人员, 还能令需要更换的实体主机12直接于机柜11中退出, 以。
17、令管理人员到达机房 1 现场时, 能以极快的速度找到需要更换的实体主机 12, 并且不会 发生更换错误的疏失。 发明内容 0007 本发明的主要目的, 在于提供一种云端系统的主机监控及异常处理方法, 可令管 理人员通过管理终端来监控云端机房中多台实体主机的运作状况, 并于实体主机运作异常 时, 强制运作异常的实体主机由机柜中退出。 0008 本发明提供了一种云端系统的主机监控及异常处理方法, 运用于至少一管理终端 及多个实体主机之上, 其中该多个实体主机分别设置于机房中的多个机柜之中, 该云端系 统的主机监控及异常处理方法包括 : 说 明 书 CN 103365755 A 5 2/7 页 6 。
18、0009 a) 该管理终端取得指出至少一台该实体主机运作异常的异常信息 ; 0010 b) 该管理终端依据该异常信息产生一控制指令, 并传送该控制指令至该实体主机 所在的机柜 ; 0011 c) 该机柜接收该控制指令, 并依据该控制指令控制对应的该实体主机退出该机柜 之外。 0012 本发明还提供了一种云端系统的主机监控及异常处理方法, 运用于至少一管理终 端及多个实体主机之上, 其中该多个实体主机分别设置于机房中的多个机柜的中, 该多个 实体主机内部分别具有一常驻模块, 该云端系统的主机监控及异常处理方法包括 : 0013 a) 各该实体主机分别通过内部的该常驻模块, 监控各该实体主机的各项。
19、数值信 息 ; 0014 b) 该常驻模块分别统计所述多个数值信息, 并依据统计结果制作一记录文件 ; 0015 c) 该常驻模块将该记录文件储存于网络上的一分享储存池中 ; 0016 d) 该管理终端通过内部的监控应用程序接口, 于该分享储存池中取得所有实体主 机的该记录文件 ; 0017 e) 该管理终端依据所述多个记录文件进行计算, 以判断所述多个实体主机是否有 运作异常的现象 ; 0018 f) 承步骤 e, 当所述多个实体主机的其中之一有运作异常的现象时, 该管理终端 产生一控制指令, 并传送至该运作异常的实体主机所在的机柜 ; 及 0019 g) 该机柜接收该控制指令, 并依据该控。
20、制指令控制该运作异常的实体主机退出该 机柜之外。 0020 本发明还提供了一种云端系统的主机监控及异常处理方法, 运用于至少一管理终 端及多个实体主机之上, 其中该多个实体主机分别设置于机房中的多个机柜的中, 该多个 实体主机内部分别具有一常驻模块, 该云端系统的主机监控及异常处理方法包括 : 0021 a) 各该实体主机分别通过内部的该常驻模块, 监控各该实体主机的各项数值信 息 ; 0022 b) 该常驻模块依据所述多个数值信息与预设的一门限值进行计算, 并依据计算结 果判断该实体主机是否有运作异常的现象 ; 0023 c) 若该常驻模块判断该实体主机运作异常, 该常驻模块产生一异常信息 。
21、; 0024 d) 该常驻模块对外传送该异常信息, 并排列于该管理终端中的一信息队列中 ; 0025 e) 该管理终端依据该信息队列中的该异常信息产生一控制指令, 并传送至该运作 异常的实体主机所在的机柜 ; 及 0026 f) 该机柜接收该控制指令, 并依据该控制指令控制该运作异常的实体主机退出该 机柜之外。 0027 为达上述目的, 本发明于云端的各实体主机中分别具有一常驻模块, 并由常驻模 块来监控实体主机的健康状况, 并提供给云端的一管理终端。当管理终端察觉有任一实体 主机的运作异常时, 即发出一控制指令至运作异常的实体主机所在的机柜, 并由机柜来强 制运作异常的实体主机退出机柜之外。。
22、 0028 本发明对照先前技术所能达成的功效在于, 各实体主机中的常驻模块会持续监控 实体主机的各项数值信息, 进而可判断实体主机的运作状况是否异常。管理人员可于远端 说 明 书 CN 103365755 A 6 3/7 页 7 操控管理终端, 并由管理终端的使用者界面直接得知云端机房中的所有实体主机的运作状 况, 并且, 当实体主机的运作异常, 需要更换时, 可直接强制该运作异常的实体主机由机柜 中退出。如此一来, 当管理人员至云端机房中, 并欲更换实体主机时, 可因该运作异常的实 体主机已退出机柜, 而轻易的找到目标, 不会因为机房中的所有实体主机皆长得一模一样, 而有难以寻找, 甚至更换。
23、错误的困扰。 附图说明 0029 图 1 为先前技术的云端机房示意图。 0030 图 2 为本发明的一具体实施例的监控及控制流程图。 0031 图 3 为本发明的第一具体实施例的系统架构图。 0032 图 4 为本发明的第一具体实施例的系统方块图。 0033 图 5 为本发明的第一具体实施例的监控流程图。 0034 图 6 为本发明的第一具体实施例的强制退出流程图。 0035 图 7 为本发明的第二具体实施例的系统架构图。 0036 图 8 为本发明的第二具体实施例的系统方块图。 0037 图 9 为本发明的第二具体实施例的监控流程图。 0038 图 10 为本发明的第二具体实施例的强制退出流。
24、程图。 0039 图 11 为本发明的第三具体实施例的系统方块图。 0040 图 12A 为本发明的一具体实施例的实体主机退出机柜前示意图。 0041 图 12B 为本发明的一具体实施例的实体主机退出机柜后示意图。 0042 其中, 附图标记说明如下 : 0043 1 : 云端机房 0044 11、 21 : 机柜 0045 211 : 发光元件 0046 212 : 弹性元件 0047 213 : 卡榫 0048 214 : 线圈电路 0049 12、 22 : 实体主机 0050 221、 222 : 常驻模块 0051 223 : 卡挚部 0052 23 : 控制模块 0053 3 : 。
25、管理终端 0054 4 : 数据库 0055 31 : 监控应用程序接口 0056 32 : 使用者界面 0057 33 : 信息队列 0058 S10 S18 : 步骤 0059 S20 S26 : 步骤 0060 S30 S42 : 步骤 说 明 书 CN 103365755 A 7 4/7 页 8 0061 S50 S58 : 步骤 0062 S60 S68 : 步骤 0063 C1 : 控制指令 0064 F1 : 记录文件 0065 M1 : 异常信息 0066 P1 : 分享储存池 具体实施方式 0067 兹就本发明的一较佳实施例, 配合图式, 详细说明如后。 0068 本发明主要。
26、为一种云端系统的主机监控及异常处理方法, 运用于云端系统的一管 理终端 ( 如图 3 中所示的该管理终端 3) 及多个的实体主机 ( 如图 3 中所示的该实体主机 22) 之上。当云端系统中的其中一台该实体主机 22 需要被更换时, 该管理终端 3 可受外部 操控, 或由该管理终端 3 自动控制需要被更换的该实体主机 22 所在的机柜 ( 如图 3 中所示 的该机柜 21), 以强制需要被更换的该实体主机 22 退出该机柜 21。如此一来, 有利于管理 人员至现场查看时, 能快速且正确地找到需要被更换的该实体主机 22。 0069 首请参阅图 2, 为本发明的一具体实施例的监控及控制流程图。首。
27、先, 该管理终端 3 先取得指出该实体主机 22 运作异常的一异常信息 ( 如图 7 中的该异常信息 M1)( 步骤 S10), 其中该管理终端 3 可通过多种方式取得该异常信息, 将于下文中一一详述。 0070 接着, 该管理终端 3 依据该异常信息 M1 产生一控制指令 ( 如图 3 中所示的该控 制指令 C1), 并将该控制指令 C1 传送至该运作异常的实体主机 22 所在的该机柜 21( 步骤 S12)。该机柜 21 接收该控制指令 C1( 步骤 S14), 并且依据该控制指令 C1 的内容, 于对应 位置上发出一警示信号 ( 步骤 S16)。本实施例中, 该机柜 21 可于所述多个实。
28、体主机 22 的 配置位置上, 分别设置有至少一发光元件 ( 例如图 12A 中所示的发光二极管 211), 以于该 步骤 S16 中, 该机柜 21 可由对应位置上的该发光元件 211 来发出警示信号 ( 例如令 LED 发 亮 )。如此, 当管理人员至现场查看时, 可通过该发光元件 211 来迅速地找到需要更换的该 实体主机 22。 0071 最后, 该机柜 1 再依据该控制指令 C1 的内容, 强制对应位置上的该实体主机 22 退 出该机柜 21( 步骤 S18)。由此, 当管理人员至现场查看时, 可迅速发现已退出该机柜 21 的 该实体主机22, 进而进行更换动作。 本发明的主要目的,。
29、 在于令管理人员可迅速且正确的发 现需要更换的该实体主机22, 因此, 在该步骤S16及该步骤S18皆可达成上述目的的前提之 下, 该步骤 S16 及该步骤 S18 不必然同时存在, 不可加以限定。 0072 续请同时参阅图3、 图4及图5, 分别为本发明的第一具体实施例的系统架构图、 系 统方块图及监控流程图。 如上所述, 一个云端系统实可具有多个机房, 并且每个机房中皆具 有许多机柜 21, 为方便说明, 本实施例中仅以一个机柜 21 来举例说明, 并且该机柜 21 中配 置有多台实体主机 22, 但不加以限定。如图所示, 每一台该实体主机 22 中皆具有一常驻模 块221, 该常驻模块2。
30、21可以采用常驻程序的形式实现, 该常驻程序221为常态性执行, 并且 持续监控该实体主机 22 中的各项数值数据, 进而可分析该实体主机 22 的健康状况。 0073 如图 5 所示, 首先, 该常驻程序 221 监控该实体主机 22 的各项数值信息 ( 步骤 S20), 并且, 分别对所述多个数值信息加以统计 ( 步骤 S22)。进而, 该常驻程序 221 可依据 说 明 书 CN 103365755 A 8 5/7 页 9 统计结果, 制作一或多个记录文件 F1( 步骤 S24), 最后, 该机柜 21 中的所述多个实体主机 22, 分别通过内部的该常驻程序 221, 将所述多个记录文件。
31、 F1 上传并储存于网络上的一分 享储存池 P1 中 ( 步骤 S26)。 0074 如图 4 所示, 该常驻程序 221 主要是监控该实体主机 22 的各项数值信息, 例如 中央处理器、 存储器、 硬盘的使用状态, 以及网络的流量、 温度、 电压及风扇转速状态等, 但 不加以限定。并且更具体而言, 该常驻程序 221 系统计上述所述多个数值信息, 并加以制 成.rrd文件, 以利该管理终端3查看。 本实施例中, 该常驻程序221侧如将中央处理器的状 态制成cpu.rrd的文件、 将存储器的状态制成memory.rrd的文件、 将硬盘的状态制作disk. rrd 的文件、 将网络的流量制成 n。
32、etwork.rrd 的文件、 将温度的状态制成 temperature.rrd 的文件、 将电压的状态制成 voltage.rrd 的文件、 并将风扇转速状态制成 fanspped.rrd 的 文件。然而以上所述仅为本发明的具体实例, 不应以此为限。 0075 该管理终端 3 中主要具有一监控应用程序接口 (Application Programming Interface, API)31 及一使用者界面 32, 该管理终端 3 可通过该监控 API 31, 由该分享储存 池 P1 中取得所述多个记录文件 F1, 并且, 通过该使用者界面 32 来显示所述多个实体主机 22 的运作状况, 以。
33、利管理人员查看并加以分析。 0076 续请参阅图 6, 为本发明的第一具体实施例的强制退出流程图。首先, 该管理终端 3 通过内部的该监控 API 31, 自动于该分享储存池 P1 中取得所有该实体主机 22 的该记录 文件 F1( 步骤 S30), 接着, 依据所述多个记录文件 F1, 分析所述多个实体主机 22 的运作状 况 ( 步骤 S32)。该监控 API 31 分析所述多个实体主机 22 是否有运作异常的现象 ( 步骤 S34), 若所述多个实体主机 22 中没有任何一台运作异常, 则回到该步骤 S30, 重复由该分享 储存池P1中取得更新后的所述多个记录文件F1。 而若该监控API。
34、 31判断有任一台该实体 主机22的运作异常, 则通过该使用者界面32来显示一警示信息(步骤S36), 以令管理人员 知晓。 0077 本实施例中, 由该监控 API 31 依据该步骤 S34 的分析结果, 产生一异常事件信息 或一异常状态信息, 以通知管理人员。其中, 于该实体主机 22 发生异常事件, 例如 CPU 使用 率达 70、 网络流量每秒超过 10M 或温度超过 70 度时, 产生该异常事件信息 ; 并且, 该监控 API 31 于该实体主机 22 发生异常事件并持续一预定时间时, 判断该实体主机 22 处于异常 状态 ( 例如 CPU 使用率达 70且超过 5 分钟 ), 进而。
35、产生该异常状态信息。如此, 该管理终 端 3 可针对该异常事件信息及该异常状态信息, 分别发出不同的警示信息, 或是通知不同 的管理人员以进行处理。 0078 该步骤 S36 之后, 该管理终端 3 可通过该使用者界面 32 接受管理人员的外部触发 ( 步骤 S38), 再依据该触发来产生该控制信号 C1, 并传送该控制信号 C1 至该运作异常的实 体主机 22 所在的该机柜 21( 步骤 S40) ; 再者, 该管理终端 3 也可于该异常事件信息或该异 常状态信息产生后, 自动产生该控制指令 C1, 并且自动传送该控制指令 C1 至该运作异常的 实体主机 22 所在的机柜 21( 步骤 S4。
36、2), 不加以限定。如此, 在该步骤 S40 或 S42 的后, 该机 柜21即可依据该控制指令C1, 强制令该运作异常的实体主机22退出, 以利管理人员寻找并 进行更换。 0079 上述第一实施例中, 预设该常驻程序 221 的执行校能较差, 无法执行复杂的运 算, 是以, 该常驻程序 221 仅用以搜集并统计所述多个实体主机 22 中的信息, 并把分析判 说 明 书 CN 103365755 A 9 6/7 页 10 断的动作交由该管理终端 3 来执行。然而, 若该常驻程序 221 足以执行复杂的运算, 则也 可直接由该常驻程序 221 来分析该实体主机 22 的运作状况, 以减轻该管理终。
37、端 3 的负担 (Loading)。 0080 请同时参阅图7、 图8及图9, 分别为本发明的第二具体实施例的系统架构图、 系统 方块图及监控流程图。如图 8 所示, 本实施例中, 各该实体主机 22 内分别执行有运算能力 较强的一常驻程序 222, 并且, 该管理终端 3 中还具有一信息队列 33。 0081 如图 9 所示, 若要对该机柜 21 中的所述多个实体主机 22 进行监控, 首先, 需通过 该常驻程序 222 来监控该实体主机 22 中的各项数值信息 ( 步骤 S50), 例如上述中央处理 器、 存储器及硬盘的使用状态等。接着, 该常驻程序 222 依据所述多个数值信息, 与预设。
38、的 一门限值进行比对计算 ( 步骤 S52), 藉此, 依据计算结果判断该实体主机 22 是否有运作异 常的现象, 更具体而言, 判断该实体主机 22是否发生异常事件, 或是否处于异常状态(步骤 S54)。 若没有任何一台该实体主机22的运作异常, 则回到该步骤S50, 由该常驻程序222持 续监控该实体主机 22 的信息 ; 若判断其中一台该实体主机 22 的运作异常, 则该常驻程序 222 产生该异常信息 M1( 步骤 S56), 并且, 对外传送该异常信息 M1( 步骤 S58)。 0082 本实施例中, 该常驻程序 222 于该实体主机 22 发生异常事件时 ( 例如 CPU 使用率 。
39、超过 70 ), 产生该异常事件信息并对外传送, 并于该实体主机 22 处于异常状态时 ( 例如 CPU 使用率超过 70逾 5 分钟 ), 产生该异常状态信息并对外传送。其中, 该实体主机 22 于 发生异常事件并持续一预定时间时, 被该常驻程序 222 视为处于异常状态。 0083 如图8所示, 该管理终端3具有该信息队列33, 上述该步骤S58中, 该常驻程序222 将该异常信息 M1( 该异常事件信息或该异常状态信息 ) 传送至该管理终端 3, 由此, 排列于 该信息队列 33 中。如此一来, 该管理终端 3 可通过该使用者界面 32 来显示该警示信息, 以 通知相关的处理人员知晓。 。
40、0084 再者, 该云端网络中还可设置有一数据库 4, 该数据库 4 通过网络系统与所述多个 实体主机 22 及该管理终端 3 连线, 上述该步骤 S58 中, 该常驻程序 222 可将该异常信息 M1 传送并储存于该数据库 4 中。如此, 该管理终端 3 可定期连线至该数据库 4, 以存取该数据 库 4 中的该异常信息 M1。然而, 以上所述仅为本发明的较佳具体实例, 不应以此为限。 0085 续请参阅图 10, 为本发明的第二具体实施例的强制退出流程图。当所述多个实体 主机 22 的其中的一运作异常时, 该管理终端 3 先接收到该异常信息 M1( 步骤 S60), 更具体 而言, 该管理终。
41、端 3 可于该信息队列 33 中取得该异常信息 M1, 或连线至该数据库 4 以存取 该异常信息 M1, 但不加以限定。该管理终端 3 接收该异常信息 M1 后, 通过该使用者界面 32 显示该警示信息 ( 步骤 S62), 以通知管理人员知晓。 0086 本实施例中, 该管理终端3也可通过该使用者界面32来接受管理人员的外部触发 ( 步骤 S64), 并依据该触发来产生该控制信号 C1, 并传送该控制信号 C1 至该运作异常的实 体主机 22 所在的该机柜 21( 步骤 S66) ; 并且, 该管理终端 3 也可于接收该异常信息 M1 后, 自动产生该控制指令 C1, 并且自动传送该控制指令。
42、 C1 至该运作异常的实体主机 22 所在的 该机柜 21( 步骤 S68)。由此, 该机柜 21 可依据该控制指令 C1 的内容, 令该运作异常的实体 主机 22 退出该机柜 21。 0087 接续请参阅图 11, 为本发明的第三具体实施例的系统方块图。如图所示, 该机柜 21 内部具有一控制模块 23, 该机柜 21 通过该控制模块 23 接收该管理终端 3 发出的该控制 说 明 书 CN 103365755 A 10 7/7 页 11 指令C1, 由此, 该控制模块23依据该控制指令C1的内容, 令对应位置上的该实体主机22退 出该机柜 21 外。 0088 请同时参阅图 12A 及图 。
43、12B, 分别为本发明的一具体实施例的实体主机退出机柜 前示意图与实体主机退出机柜后示意图。如图所示, 该机柜 21 可于每一个插槽的后方分别 设置有弹性元件 212, 例如弹簧、 油压、 气压、 橡胶等构件, 并且, 于插槽前方设置可受该控制 模块23控制的卡榫213。 并且, 每一台该实体主机22系于机壳上设置有对应的卡挚部223, 当该实体主机 22 置入插槽中时, 该卡挚部 223 恰可与该卡榫 213 互相对应, 由此该机柜 21 可通过该卡榫 213 将该实体主机 22 卡固于该插槽中。 0089 于前文所述的步骤 S18、 S40、 S42、 S66 及 S68 中, 该机柜 2。
44、1 主要是通过该控制模块 23 接收该控制指令 C1, 并且, 该控制模块 23 再依据该控制指令 C1 的内容, 控制该机柜 21 的对应位置上的该卡榫213移动, 以令该对应位置中的该实体主机22退出该机柜21。 更具 体而言, 该控制模块 23 控制该卡榫 213 脱离该实体主机 22 机壳上的该卡挚部 223, 以令该 机柜 21 后方的该弹性元件 212 将该实体主机 22 弹出该插槽外。然而以上所述仅为本发明 的一较佳实例, 不应以此为限。 0090 更具体而言, 该机柜 21 可于对应位置上设置有线圈电路 214, 当该控制模块 23 欲 令该实体主机 22 退出时, 令该线圈电。
45、路 214 通电以产生磁力, 以吸引该卡榫 213( 如图 12B 所示 )。如此, 该卡榫 213 脱离该实体主机 22 机壳上的该卡挚部 223, 进而该机柜 21 后方 的该弹性元件 212 将该实体主机 22 弹出插槽外。于本实施例中, 该卡榫 213 为可受磁力吸 引的材质所构成。然而, 以上所述仅为本发明的一较佳具体实例, 该机柜 21 实可通过其他 方式来退出该实体主机 22, 应视实际结构而定, 不应以此为限。 0091 以上所述仅为本发明的较佳具体实例, 非因此即局限本发明的专利范围, 故举凡 运用本发明内容所为的等效变化, 均同理皆包含于本发明的范围内, 合予陈明。 说 明。
46、 书 CN 103365755 A 11 1/11 页 12 图 1 说 明 书 附 图 CN 103365755 A 12 2/11 页 13 图 2 说 明 书 附 图 CN 103365755 A 13 3/11 页 14 图 3 图 4 说 明 书 附 图 CN 103365755 A 14 4/11 页 15 图 5 说 明 书 附 图 CN 103365755 A 15 5/11 页 16 图 6 说 明 书 附 图 CN 103365755 A 16 6/11 页 17 图 7 图 8 说 明 书 附 图 CN 103365755 A 17 7/11 页 18 图 9 说 明 书 附 图 CN 103365755 A 18 8/11 页 19 图 10 说 明 书 附 图 CN 103365755 A 19 9/11 页 20 图 11 说 明 书 附 图 CN 103365755 A 20 10/11 页 21 图 12A 说 明 书 附 图 CN 103365755 A 21 11/11 页 22 图 12B 说 明 书 附 图 CN 103365755 A 22 。