一种机群性能监控接口及其方法.pdf

上传人:1*** 文档编号:1069059 上传时间:2018-03-29 格式:PDF 页数:19 大小:14.88MB
返回 下载 相关 举报
摘要
申请专利号:

CN201010533991.1

申请日:

2010.11.01

公开号:

CN101996126A

公开日:

2011.03.30

当前法律状态:

授权

有效性:

有权

法律详情:

著录事项变更IPC(主分类):G06F 11/30变更事项:申请人变更前:北京并行科技有限公司变更后:北京并行科技股份有限公司变更事项:地址变更前:100085 北京市海淀区上地信息路甲28号科实大厦B座11B-05变更后:100085 北京市海淀区上地信息路甲28号科实大厦B座11B-05|||授权|||实质审查的生效IPC(主分类):G06F 11/30申请日:20101101|||公开

IPC分类号:

G06F11/30; H04L12/26

主分类号:

G06F11/30

申请人:

北京并行科技有限公司

发明人:

不公告发明人

地址:

100085 北京市海淀区上地信息路甲28号科实大厦B座11B-05

优先权:

专利代理机构:

中国专利代理(香港)有限公司 72001

代理人:

谢建云;刘鹏

PDF下载: PDF下载
内容摘要

本发明公开了一种机群性能监控接口,适于监控一个或者多个机群,其中每个机群包括多个节点,机群性能监控接口包括多个节点监控接口,每个节点监控接口对应于每个节点并为相应节点显示其性能指标,其中每个节点监控接口包括:多个子监控部件,每个子监控部件包括多个监控单元,其中每个子监控部件实时显示相应节点的某个类别性能的指标,而且多个监控单元中的每个监控单元实时显示该类别性能中某个性能的当前指标,其中每个监控单元都以柱状图形式显示相应性能的指标,柱状图中的柱高度反映了相应性能指标的大小,以及其中每个节点监控接口具有相同的子监控部件布局。本发明还公开了相应的机群性能监控方法。

权利要求书

1: 一种机群性能监控接口, 适于监控一个或者多个机群, 其中每个机群包括多个节点, 所述机群监控接口包括多个节点监控接口, 每个节点监控接口对应于所述多个节点中的每 个节点并为相应节点显示其性能指标, 其中所述多个节点监控接口中的每个节点监控接口 包括 : 多个子监控部件, 每个子监控部件包括多个监控单元, 其中每个子监控部件实时显示 所述相应节点的某个类别性能的指标, 而且多个监控单元中的每个监控单元实时显示所述 类别性能中某个性能的当前指标, 其中所述每个监控单元都以柱状图形式显示相应性能的指标, 所述柱状图中的柱高度 反映了所述相应性能指标的大小, 以及 其中所述每个节点监控接口具有相同的子监控部件布局。
2: 如权利要求 1 所述的机群性能监控接口, 其中所述每个节点监控接口具有相同的背 景色, 而所述每个节点监控接口中的多个子监控部件具有不同的前景色。
3: 如权利要求 1 所述的机群性能监控接口, 其中所述节点的性能类别选自包括以下性 能类别的组中的一个或者多个性能类别 : 内存类性能、 CPU 类性能、 存储类性能和网络类性 能。
4: 如权利要求 3 所述的机群性能监控接口, 其中所述内存类性能包括一个或者多个下 述性能 : 内存交换分区的访问率、 内存交换分区的利用率、 内存访问率和内存利用率 ; 所述 CPU 类性能包括一个或者多个下述性能 : 节点中各个 CPU 核心的 CPU 利用率、 CPU 系统利用率, 以及高级性能指标 : 代码综合效率 ; 所述存储类性能包括一个或者多个下述性能 : 节点中各种类型存储器的存储器写入速 率和存储器读取速率 ; 以及 所述网络类性能包括一个或者多个下述性能 : 以太网数据发送速率、 以太网数据接收 速率、 高速互联网络带宽数据发送速率以及高速互联网络带宽数据接收速率。
5: 如权利要求 3 或者 4 所述的机群性能监控接口, 其中所述多个子监控部件之一包括 用于 CPU 类性能的子监控部件, 其处于节点监控接口的中央区域, 以及 所述用于 CPU 类性能的子监控部件的每个监控单元对应于相应节点中的每个 CPU 核 心, 且每个监控单元以绿色柱子来呈现相应 CPU 核心的 CPU 利用率。
6: 如权利要求 3-5 中任一个所述的机群性能监控接口, 其中所述每个节点监控接口包 括四个子监控部件, 分别为用于内存类性能的子监控部件、 用于 CPU 类性能的子监控部件、 用于存储类性能的子监控部件以及用于网络类性能的子监控部件。
7: 如权利要求 6 所述的机群性能监控接口, 其中所述用于 CPU 类性能的子监控部件位 于所述节点监控接口的中央, 所述用于内存类性能的子监控部件位于所述用于 CPU 类性能 的子监控部件的左侧, 所述用于存储类性能的子监控部件位于所述用于内存类性能的子监 控部件和所述用于 CPU 类性能的子监控部件的下方, 以及所述用于网络类性能的子监控部 件位于所述用于 CPU 类性能的子监控部件和所述用于存储类性能的子监控部件的右侧。
8: 如权利要求 7 所述的机群性能监控接口, 其中所述用于内存类性能的子监控部件包 括分别用于内存交换分区的访问率和内存交换分区的利用率的监控单元, 所述用于内存交 换分区的访问率和内存交换分区的利用率的监控单元分别以红色柱子来呈现内存交换分 区的访问率和内存交换分区的利用率。 2
9: 如权利要求 1-8 中的任一个所述的机群性能监控接口, 其中所述多个节点监控接口 根据相对应节点所述的机群而分组成相应的一个或者多个节点监控接口组, 而且所述一个 或者多个节点监控接口组中的节点监控接口根据节点的属性而进行排列。
10: 如权利要求 9 所述的机群性能监控接口, 其中在所述一个或者多个节点监控接口 组中, 节点监控接口以行和列的方式排列, 并且具有相同节点属性的节点监控接口布置在 相同行中。
11: 一种适于监控一个或者多个机群的机群性能监控方法, 其中所述每个机群包括多 个节点, 所述方法包括步骤 : 为所述机群中的每个节点提供具有相同布局的相应节点监控接口 ; 为所述相应节点监控接口提供多个子监控部件, 其中每个子监控部件对应于所述相应 节点的某个类别性能 ; 为所述每个子监控部件提供多个监控单元, 每个监控单元对应于所述类别性能中的某 个性能 ; 以及 在所述每个监控单元中, 以柱状图形式实时显示所述性能指标, 其中所述柱状图中的 柱高度反映了所述性能指标的大小。
12: 如权利要求 11 所述的机群性能监控方法, 其中所述每个节点监控接口具有相同的 背景色, 而所述每个节点监控接口中的多个子监控部件具有不同的前景色。
13: 如权利要求 11 所述的机群性能监控方法, 其中所述节点的性能类别选自包括以下 性能类别的组中的一个或者多个性能类别 : 内存类性能、 CPU 类性能、 存储类性能和网络类 性能。
14: 如权利要求 13 所述的机群性能监控方法, 其中所述内存类性能包括一个或者多个 下述性能 : 内存交换分区的访问率、 内存交换分区的利用率、 内存访问率和内存利用率 ; 所述 CPU 类性能包括一个或者多个下述性能 : 节点中各个 CPU 核心的 CPU 利用率和 CPU 系统利用率 ; 所述存储类性能包括一个或者多个下述性能 : 节点中各种类型存储器的存储器吸入速 率和存储器读取速率 ; 以及 所述网络类性能包括一个或者多个下述性能 : 以太网数据发送速率、 以太网数据接收 速率、 无线带宽数据发送速率以及无线带宽数据接收速率。
15: 如权利要求 13 或者 14 所述的机群性能监控方法, 其中所述为所述相应节点监控接 口提供多个子监控部件的步骤包括 : 提供用于 CPU 类性能的子监控部件, 其处于节点监控 接口的中央区域, 以及 所述为所述每个子监控部件提供多个监控单元的步骤包括 : 为所述用于 CPU 类性能的 子监控部件提供多个监控单元, 其中所述多个监控单元中的每个监控单元对应于相应节点 中的每个 CPU 核心, 且每个监控单元以绿色柱子来呈现相应 CPU 核心的 CPU 利用率。
16: 如权利要求 13-15 中任一个所述的机群性能监控方法, 其中所述为所述相应节点 监控接口提供多个子监控部件的步骤包括 : 提供用于内存类性能的子监控部件 ; 提供用于 CPU 类性能的子监控部件 ; 提供用于存储类性能的子监控部件 ; 以及 3 提供用于网络类性能的子监控部件。
17: 如权利要求 16 所述的机群性能监控方法, 其中所述用于 CPU 类性能的子监控部件 位于所述节点监控接口的中央, 所述用于内存类性能的子监控部件位于所述用于 CPU 类性 能的子监控部件的左侧, 所述用于存储类性能的子监控部件位于所述用于内存类性能的子 监控部件和所述用于 CPU 类性能的子监控部件的下方, 以及所述用于网络类性能的子监控 部件位于所述用于 CPU 类性能的子监控部件和所述用于存储类性能的子监控部件的右侧。
18: 如权利要求 17 所述的机群性能监控方法, 其中所述用于内存类性能的子监控部件 包括分别用于内存交换分区的访问率和内存交换分区的利用率的监控单元, 所述用于内存 交换分区的访问率和内存交换分区的利用率的监控单元分别以红色柱子来呈现内存交换 分区的访问率和内存交换分区的利用率。
19: 如权利要求 11-18 中的任一个所述的机群性能监控方法, 还包括步骤 : 根据相应节点所属机群而将多个节点监控接口分组成相应的一个或者多个节点监控 接口组 ; 以及 根据节点的属性对所述一个或者多个节点监控接口组中的节点监控接口进行排列。
20: 如权利要求 19 所述的机群性能监控方法, 其中在所述一个或者多个节点监控接口 组中, 节点监控接口以行和列的方式排列, 并且具有相同节点属性的节点监控接口布置在 相同行中。

说明书


一种机群性能监控接口及其方法

    技术领域 本发明涉及机群监控领域, 尤其涉及对机群中的各个节点的性能进行监控的用户 接口以及监控方法。
     背景技术 为了满足各种对强大计算性能要求的应用, 出现了将多个独立的计算机用软件和 硬件组合在一起以提供强大计算性能的机群系统。 在机群系统中的每个独立计算机称为节 点。在将机群系统投入运行中时, 机群系统的性能, 即在特定的硬件环境和软件环境下, 机 群系统对于特定的工作负载所表现的计算能力是个非常关键的因素。 机群系统的性能通常 取决于机群系统中各个节点的性能。一般而言, 这些节点的性能指标包括每个节点的内存 交换区 ( 以下简称 SWAP) 的利用率、 SWAP 的访问率, 内存的利用率、 内存的访问率、 中央处 理器 ( 以下简称 CPU) 的利用率、 CPU 主频、 CPU 个数和核数、 存储的读写速率以及网络的收 发速率等。
     目前, 已经存在有多种机群性能监控系统, 用于对机群的性能进行监控。
     附图 1 给出了惠普公司的机群管理软件 CMU 的用户接口, 其中在接口的左侧部分 列出了机群中的各个节点, 而在右下侧以圆形饼图方式示出了机群的各类性能的整体性能 参数。但是惠普公司的 CMU 存在以下问题 : 首先, 该用户接口并没有给出诸如单个节点 CPU 每核的利用率、 SWAP 的利用率以及 I B 数据之类的关键性能指标 ; 其次, CMU 的用户接口无 法在单个界面内容显示整个机群中各个节点的具体性能状态 ; 而且 CMU 也不支持同时显示 多个机群的性能。
     附图 2 给出了 CGGVeritas 公司的机群软件 GeoCluster 提供的机群监控接口 SCP, 如附图 2 可以看出, 该监控接口只提供了多个节点在过去 24 小时的 CPU 使用情况, 并没有 提供实时显示, 另外该监控接口仅仅提供有关每个节点的 CPU 使用率的性能指标的信息, 而没有提供其他同样非常重要的性能指标, 因而无法被使用该监控接口的用户用于性能分 析。
     由于机群监控系统一般在机群系统运行时实时运行, 而且一般有用户通过机群监 控接口来实时监控机群系统的运行状况, 因此, 能够在单个机群监控接口中呈现尽可能多 的机群性能信息, 尤其是机群中各个节点的性能信息是所希望的。另外, 由于机群监控接 口中通常呈现大量的信息, 监控接口的用户通常希望能够在监控中及时发现存在问题的节 点, 因此, 能够以足够引起注意的方式来显示存在问题的节点也是机群监控接口所希望有 的功能。
     发明内容
     鉴于上述问题, 提出了本发明以便提供一种克服上述问题或者至少部分地解决上 述问题的机群性能监控接口和机群监控方法。
     根据本发明的一个方面提供了一种机群性能监控接口, 适于监控一个或者多个机群, 其中每个机群包括多个节点, 所述机群性能监控接口包括多个节点监控接口, 每个节点 监控接口对应于所述多个节点中的每个节点并为相应节点显示其性能指标, 其中所述多个 节点监控接口中的每个节点监控接口包括 : 多个子监控部件, 每个子监控部件包括多个监 控单元, 其中每个子监控部件实时显示所述相应节点的某个类别性能的指标, 而且多个监 控单元中的每个监控单元实时显示所述类别性能中某个性能的当前指标, 其中所述每个监 控单元都以柱状图形式显示相应性能的指标, 所述柱状图中的柱高度反映了所述相应性能 指标的大小, 以及其中所述每个节点监控接口具有相同的子监控部件布局。
     根据本发明的另一个方面, 提供了适于监控一个或者多个机群的机群性能监控方 法, 其中所述每个机群包括多个节点, 所述方法包括步骤 : 为所述机群中的每个节点提供具 有相同布局的相应节点监控接口 ; 为所述相应节点监控接口提供多个子监控部件, 其中每 个子监控部件对应于所述相应节点的某个类别性能 ; 为所述每个子监控部件提供多个监控 单元, 每个监控单元对应于所述类别性能中的某个性能 ; 以及在所述每个监控单元中, 以 柱状图形式实时显示所述性能指标, 其中所述柱状图中的柱高度反映了所述性能指标的大 小。
     根据本发明的机群性能监控接口和方法可以在单个监控接口中同时显示机群中 所有节点的多个重要性能指标, 由于每个性能指标都已不同颜色或者方式的柱状图显示, 而且每个节点具有相同的监控接口布局, 因此用户使用根据本发明的机群性能监控接口可 以方便且容易地查看整个机群的运行状态。 每个节点监控接口包括四个子监控部件, 分别为用于内存类性能的子监控部件、 用于 CPU 类性能的子监控部件、 用于存储类性能的子监控部件以及用于网络类性能的子监 控部件。其中用于 CPU 类性能的子监控部件的每个监控单元对应于相应节点中的每个 CPU 核心, 且每个监控单元以绿色 ( 其在 RGB 色彩模式中的值为 (0, 255, 0)) 柱子来呈现相应 CPU 核心的 CPU 利用率。用于内存类性能的子监控部件包括用于内存交换分区的访问率和 内存交换分区的利用率的监控单元, 用于内存交换分区的访问率和内存交换分区的利用率 的监控单元分别以红色 ( 其在 RGB 色彩模式中的值为 (255, 0, 0)) 柱子来呈现内存交换分 区的访问率和内存交换分区的利用率。
     就机群性能而言, 各个节点的 CPU 利用率以及内存交换分区的状况属于节点运行 状况的最重要判断指标, 通过以例如绿色或者红色之类能够引起人足够关注度的颜色显示 这些指标, 可以使得机群监控接口的用户面对具有大量节点的监控接口时及时关注可能存 在问题的节点, 从而可以及时发现机群系统运行时可能出现的问题。
     附图说明 通过阅读下文优选实施方式的详细描述, 各种其他的优点和益处对于本领域普通 技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的, 而并不认为是对本发明 的限制。而且在整个附图中, 用相同的参考符号表示相同的部件。在附图中 :
     图 1 示意性地示出了现有技术中惠普公司的机群管理工具 CMU 监控接口 ;
     图 2 示意性地示出了现有技术中 CGGVeritas 公司的机群软件 GeoCluster 提供的 机群监控接口 SCP ;
     图 3 示意性地示出了根据本发明一个实施例的机群监控接口 ;
     图 4 示意性地示出了根据本发明一个实施例的机群监控接口中的节点监控接口 ;
     图 5 示意性地示出了根据本发明一个实施例的节点监控接口中用于内存类性能 的子监控部件 ;
     图 6 示意性地示出了根据本发明一个实施例的节点监控接口中用于 CPU 类性能的 子监控部件 ;
     图 7 示意性地示出了根据本发明一个实施例的节点监控接口中用于存储类性能 的子监控部件 ;
     图 8 示意性地示出了根据本发明一个实施例的节点监控接口中用于网络类性能 的子监控部件 ;
     图 9 示意性地示出了根据本发明另一个实施例的机群监控接口 ; 以及
     图 10 示意性地示出了根据本发明一个实施例的机群监控方法。 具体实施方式
     下面结合附图和具体的实施方式对本发明作进一步的描述。
     图 3 示意性地示出了根据本发明一个实施例的机群监控接口 300, 如图 3 所示, 机 群监控接口 300 包括多个节点监控接口 310_1, 310_2, ..., 310_n( 在下文中, 当不特指特定 节点监控接口时, 用符号 310 泛指节点监控接口 )。每个节点监控接口 310 具有相同的布 局, 并且对应于一个相应的节点, 并且显示该相应节点中的各种性能指标。同时, 如图 3 所 示, 当机群包括较多节点时, 可以利用定位装置 ( 例如鼠标 ) 选择机群监控接口 300 中的某 个节点监控接口 310 来放大显示所选择的节点监控接口 310 以便更清楚显示该节点中的各 种性能指标。为了保持接口的一致性, 放大前后的节点监控接口 310 除了尺寸之外, 其他布 局均相同。 如图 3 所示, 在机群监控接口中, 多个节点监控接口以行和列的方式排列, 而且由 于机群中的节点可以根据功能的不同而可以归类为具有不同属性的节点。例如, 节点可以 划分为管理节点、 IO 节点和计算节点。将具有相关属性的节点布置在同一行或者紧邻的多 行中可以便于对节点进行监控。因此在图 3 中, 第一行节点为属于管理节点的节点, 第二行 节点为属于 IO 节点的节点, 而后面几行的节点为计算节点。
     图 4 示出了根据本发明一个实施例的机群监控接口中的节点监控接口 310 的具体 结构。如图 4 所示, 节点监控接口 310 包括多个子监控部件 410( 如 410_1、 410_2、 410_3 和 410_4)。每个子监控部件 410 对应于节点中某个类别性能的指标, 并且显示该类性能指标 的值。通过将某个类别的性能指标集中在一个子监控部件中显示, 可以便于机群监控接口 的用户方便定位节点中某个类别的性能。
     每个子监控部件 410 还包括一个或者多个监控单元 510, 每个监控单元 510 对应于 相应类别性能中的每个性能指标。 这些监控单元通常为矩形, 并且在矩形中, 以柱状图的形 式显示相应性能指标, 例如, 相应性能指标的值由柱状图中柱的高度来反映。
     应当注意的是, 监控单元可以沿不同的方向延伸, 而且监控单元中的柱子也可以 根据需要沿不同方向延伸。同时, 可以根据各个类别性能的特点来选择监控单元的延伸方 向以及柱子的延伸方向。
     如图 4 所示, 节点监控接口 310 包括四个子监控部件, 分别为用于内存类性能的子
     监控部件 410_1、 用于 CPU 类性能的子监控部件 410_2、 用于存储类性能的子监控部件 410_3 以及用于网络类性能的子监控部件 410_4。其中, 用于 CPU 类性能的子监控部件 410_2 位 于节点监控接口 310 的中央, 用于内存类性能的子监控部件 410_1 位于用于 CPU 类性能的 子监控部件 410_2 的左侧, 用于存储类性能的子监控部件 410_3 位于用于内存类性能的子 监控部件 410_1 和用于 CPU 类性能的子监控部件 410_2 的下方, 以及用于网络类性能的子 监控部件 410_4 位于用于 CPU 类性能的子监控部件 410_2 和用于存储类性能的子监控部件 410_3 的右侧。 利用这个布局, 在节点监控接口的中央部分着重显示用于 CPU 类性能的子监 控部件 410_2, 由于在机群性能监控中, 每个节点的 CPU 类性能是重要的性能指标, 利用该 布局, 可以便于机群监控接口的用户在接口上方便地注意到各个节点的重要状态。
     应当注意的是, 本发明并不局限于仅仅四个子监控部件, 而是可以根据实际机群 性能监控的需要来增加或者减少子监控部件。下面详细介绍各个子监控部件 410 的具体结 构。
     图 5 示意性地示出了根据本发明一个实施例的节点监控接口中用于内存类性能 的子监控部件 410_1 的具体结构。如图 5 所示, 子监控部件 410_1 包括四个监控单元, 其中 沿纵向包括涉及内存交换区 (SWAP) 和内存的监控单元, 而沿横向包括涉及访问率和利用 率的监控单元, 也就是说, 子监控部件 410_1 包括处于左上角区域的用于 SWAP 访问率的监 控单元 510、 处于右上角区域的用于 SWAP 利用率的监控单元 520、 处于左下角区域的用于内 存访问率的监控单元 530 以及处于右下角区域的用于内存利用率的监控单元 540。在监控 单元 510 和 520 中, 即在涉及 SWAP 的监控单元中, 柱状图中的柱子以较为醒目的颜色如红 色填充, 而在涉及内存的监控单元 530 和 540 中, 柱子以相对较为柔和的颜色如深黄色 ( 其 在 RGB 色彩模式中的值为 (128, 128, 0)) 来填充。由于在机群性能监控中, 如果某个节点的 SWAP 的访问率和利用率较高, 则该节点出现问题的几率较大, 根据本发明的机群监控接口 以较为醒目的颜色来显示 SWAP 的性能指标, 可以便于机群监控接口的用户快速地在多个 节点中定位可能出现问题的节点, 从而提高机群监控的效率。 另外, 在用于内存类性能的子 监控部件 410_1 中, 各个监控单元 510-540 中的柱状图向上填充, 即随着 SWAP 或者内存的 访问率或者利用率的增加, 柱状图中的柱子向上逐步上升。
     图 6 示意性地示出了根据本发明一个实施例的节点监控接口中用于 CPU 类性能的 子监控部件 410_2 的具体结构。如图 6 所示, 子监控部件 410_2 根据相应节点中的实际的 CPU 核数沿纵向划分成多个监控单元 610, 每个监控单元 610 对应于一个 CPU 核。每个监控 单元 610 的柱状图中的柱子高度指示相应 CPU 内核的利用率。由于在节点的性能指标中, 就某个 CPU 内核的 CPU 利用率而言, 其中 CPU 用于操作系统的利用率也是值得关注的性能。 为了在单个柱状图中同时显示这两个性能指标, 在每个监控单元 610 中, 将指示 CPU 内核利 用率的柱状图分为两个部分, 其中以柱子的总长度指示 CPU 内核的整体利用率, 而在柱状 图的底部, 以不同颜色的部分柱子长度指示 CPU 用于操作系统的利用率。由于 CPU 用于操 作系统的利用率仅仅为 CPU 整体利用率的一部分, 因此, 可以以单根柱子来同时指示两个 不同性能指标。同时, 在监控单元 610 的柱状图显示中, 以深红色 ( 其在 RGB 色彩模式中的 值为 (128, 0, 0)) 的柱子指示 CPU 用于操作系统的利用率, 而以较为醒目但对眼睛刺激较少 的颜色如绿色柱子表示除去 CPU 用于操作系统的利用率之外的 CPU 利用率的其他部分。由 于 CPU 利用率是性能监控中经常要关注的性能指标, 通过在节点监控接口的中央部分并以较为醒目但对眼睛刺激较少的颜色如绿色来显示 CPU 利用率, 可以减少对机群监控接口的 用户的眼睛刺激, 并同时便于用户进行监控。另外, 在用于 CPU 类性能的子监控部件 410_2 中, 各个监控单元 610 中的柱状图向上填充, 即随着 CPU 利用率的增加, 柱状图中的柱子向 上逐步填充。
     图 7 示意性地示出了根据本发明一个实施例的节点监控接口中用于存储类性能 的子监控部件 410_3 的具体结构。如图 7 所示, 子监控部件 410_3 沿纵向包括涉及存储类 型的监控单元, 并且沿横向包括涉及读操作和写操作的监控单元。具体而言, 子监控单元 410_3 可包括四个监控单元, 如处于左上角区域的用于第一种存储设备的读取速率的监控 单元 710、 处于右上角区域的用于第一种存储设备的写入速率的监控单元 720、 处于左下角 区域的用于第二种存储设备的读取速率的监控单元 730 以及处于右下角区域的用于第二 种存储设备的写入速率的监控单元 740。子监控部件 410_3 可以为节点中的每种存储设备 包括两个分别对应于读取和写入速率的监控单元, 而不仅仅限于两种存储设备。考虑在大 规模情况下的显示效果, 需要使用亮度较高的色彩来显示磁盘数据, 本方案使用橙色 ( 其 在 RGB 色彩模式中的值为 (255, 128, 0)) 的柱子指示存储设备的读取速率, 使用天蓝色 ( 其 在 RGB 色彩模式中的值为 (0, 128, 255)) 的柱子指示存储设备的写入速率。同时, 指示存储 设备读取速率的监控单元 ( 如 710 和 730) 中的柱状图从中间向左填充 ( 即随着读取速率 的增大, 柱子从中间向左填充 ), 而指示存储设备写入速率的监控单元 ( 如 720 和 740) 中的 柱状图从中间向右填充 ( 即随着读取速率的增大, 柱子从中间向右填充 )。
     图 8 示意性地示出了根据本发明一个实施例的节点监控接口中用于网络类性能 的子监控部件 410_4 的具体结构。如图 8 所示, 子监控部件 410_4 沿横向包括涉及网络 接口类型的监控单元, 而沿横向包括涉及网络数据发送和接收速率的监控单元。具体而 言, 子监控部件 410_4 包括四个监控单元, 如处于左上角区域的用于第一种网络接口 ( 如 以太网接口 ) 的网络数据发送速率的监控单元 810、 处于左下角区域的用于第一种网络 接口的网络数据接收速率的监控单元 830、 处于右上角区域的用于第二种网络接口 ( 如 IB(Infiniband) 接口 ) 的网络数据发送速率的监控单元 820 以及处于右下角区域的用于 第二种网络接口的网络数据接收速率的监控单元 840。子监控部件 410_4 可以为节点中的 每种网络接口包括两个分别对应于网络数据发送和接收速率的监控单元, 而不仅仅限于两 种网络接口。另外, 根据本发明的一个实施方式, 以洋红色 ( 其在 RGB 色彩模式中的值为 (255, 0, 255)) 柱子指示网络数据的发送速率, 而以青色 ( 其在 RGB 色彩模式中的值为 (0, 255, 255)) 柱子指示网络数据的接收速率。同时, 指示网络数据发送速率的监控单元 ( 如 810 和 820) 中的柱状图从中间向上填充 ( 即随着网络数据发送速率的增大, 柱子从中间向 上填充 ), 而指示网络数据接收速率的监控单元 ( 如 830 和 840) 中的柱状图从中间向下填 充 ( 即随着网络数据接收速率的增大, 柱子从中间向下填充 )。
     图 9 示意性地示出了根据本发明另一个实施例的机群监控接口 900, 其类似于图 3 所示的机群监控接口 300, 但是在图 9 中, 还示出了另一个机群中的所有节点, 即根据本发 明的机群监控接口可以将多个节点监控接口根据相对应节点所述的机群而分组成相应的 一个或者多个节点监控接口组, 并同时显示多个机群。
     图 10 示意性地示出了根据本发明一个实施例的机群监控方法 1000 的流程图, 该 方法适于监控一个或者多个机群的性能, 而且每个机群包括多个节点。如图 10 所示, 该方法始于步骤 S1010, 其中对于机群中的每个节点, 提供具有相同布局的相应节点监控接口。 随后, 该方法进入步骤 S1020, 其中为每个节点监控接口提供多个子监控部件, 其中每个子 监控部件对应于所述相应节点的某个类别性能。并且在步骤 S1030 中, 为每个子监控部件 提供多个监控单元, 其中每个监控单元对应于子监控部件所对应类别性能中的某个性能。 然后在步骤 S1040 中, 在每个监控单元中, 以柱状图形式实时显示与该监控单元相对应的 性能指标的值, 其中柱状图中的柱的高度反映了该性能指标的大小。利用根据图 10 所述的 方法, 可以构造一个可以同时显示机群中所有节点的重要性能指标的机群监控接口, 从而 便于机群监控接口的用户进行监控。
     通常, 在机群监控接口中, 每个节点监控接口具有相同的背景色, 而每个节点监控 接口中的多个子监控部件以及子监控部件中的监控单元可以具有不同的前景色。 通过以不 同前景色显示各个性能指标, 便于机群监控接口的用户根据某个颜色柱状图的长度就可以 判断出某个相应性能指标的大小。
     根据本发明的一个实施方式, 节点的性能类别可以包括 : 内存类性能、 CPU 类性 能、 存储类性能和网络类性能。而每个节点监控接口的结构可以如上面参考图 4-8 所述的 那样布局。 因此, 上述为每个节点监控接口提供多个子监控部件的步骤 S 1020 可以包括下 列子步骤 : 即提供用于内存类性能的子监控部件 ; 提供用于 CPU 类性能的子监控部件 ; 提供 用于存储类性能的子监控部件 ; 以及提供用于网络类性能的子监控部件。
     另外, 根据本发明的方法, 还可以根据节点的属性对节点监控接口的位置进行排 列。 因此, 方法还可以包括步骤 : 根据相应节点所属机群而将多个节点监控接口分组成相应 的一个或者多个节点监控接口组 ; 以及根据节点的属性对所述一个或者多个节点监控接口 组中的节点监控接口进行排列。
     本发明的各个部件实施例可以以硬件实现, 或者以在一个或者多个处理器上运行 的软件模块实现, 或者以它们的组合实现。 本领域的技术人员应当理解, 可以在实践中使用 微处理器或者数字信号处理器 (DSP) 来实现根据本发明实施例的机群监控接口中的一些 或者全部部件的一些或者全部功能。 本发明还可以实现为用于执行这里所描述的方法的一 部分或者全部的设备或者装置程序 ( 例如, 计算机程序和计算机程序产品 )。 这样的实现本 发明的程序可以存储在计算机可读介质上, 或者可以具有一个或者多个信号的形式。这样 的信号可以从因特网网站上下载得到, 或者在载体信号上提供, 或者以任何其他形式提供。
     应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制, 并且本领 域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中, 不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词 “包含” 不排除存在 未列在权利要求中的元件或步骤。位于元件之前的单词 “一” 或 “一个” 不排除存在多个这 样的元件。 本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来 实现。在列举了若干装置的单元权利要求中, 这些装置中的若干个可以是通过同一个硬件 项来具体体现。单词第一、 第二、 以及第三等的使用不表示任何顺序。可将这些单词解释为 名称。
    

一种机群性能监控接口及其方法.pdf_第1页
第1页 / 共19页
一种机群性能监控接口及其方法.pdf_第2页
第2页 / 共19页
一种机群性能监控接口及其方法.pdf_第3页
第3页 / 共19页
点击查看更多>>
资源描述

《一种机群性能监控接口及其方法.pdf》由会员分享,可在线阅读,更多相关《一种机群性能监控接口及其方法.pdf(19页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN101996126A43申请公布日20110330CN101996126ACN101996126A21申请号201010533991122申请日20101101G06F11/30200601H04L12/2620060171申请人北京并行科技有限公司地址100085北京市海淀区上地信息路甲28号科实大厦B座11B0572发明人不公告发明人74专利代理机构中国专利代理香港有限公司72001代理人谢建云刘鹏54发明名称一种机群性能监控接口及其方法57摘要本发明公开了一种机群性能监控接口,适于监控一个或者多个机群,其中每个机群包括多个节点,机群性能监控接口包括多个节点监控接口,每个。

2、节点监控接口对应于每个节点并为相应节点显示其性能指标,其中每个节点监控接口包括多个子监控部件,每个子监控部件包括多个监控单元,其中每个子监控部件实时显示相应节点的某个类别性能的指标,而且多个监控单元中的每个监控单元实时显示该类别性能中某个性能的当前指标,其中每个监控单元都以柱状图形式显示相应性能的指标,柱状图中的柱高度反映了相应性能指标的大小,以及其中每个节点监控接口具有相同的子监控部件布局。本发明还公开了相应的机群性能监控方法。51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书3页说明书6页附图9页CN101996131A1/3页21一种机群性能监控接口,适于监控一个或。

3、者多个机群,其中每个机群包括多个节点,所述机群监控接口包括多个节点监控接口,每个节点监控接口对应于所述多个节点中的每个节点并为相应节点显示其性能指标,其中所述多个节点监控接口中的每个节点监控接口包括多个子监控部件,每个子监控部件包括多个监控单元,其中每个子监控部件实时显示所述相应节点的某个类别性能的指标,而且多个监控单元中的每个监控单元实时显示所述类别性能中某个性能的当前指标,其中所述每个监控单元都以柱状图形式显示相应性能的指标,所述柱状图中的柱高度反映了所述相应性能指标的大小,以及其中所述每个节点监控接口具有相同的子监控部件布局。2如权利要求1所述的机群性能监控接口,其中所述每个节点监控接口。

4、具有相同的背景色,而所述每个节点监控接口中的多个子监控部件具有不同的前景色。3如权利要求1所述的机群性能监控接口,其中所述节点的性能类别选自包括以下性能类别的组中的一个或者多个性能类别内存类性能、CPU类性能、存储类性能和网络类性能。4如权利要求3所述的机群性能监控接口,其中所述内存类性能包括一个或者多个下述性能内存交换分区的访问率、内存交换分区的利用率、内存访问率和内存利用率;所述CPU类性能包括一个或者多个下述性能节点中各个CPU核心的CPU利用率、CPU系统利用率,以及高级性能指标代码综合效率;所述存储类性能包括一个或者多个下述性能节点中各种类型存储器的存储器写入速率和存储器读取速率;以。

5、及所述网络类性能包括一个或者多个下述性能以太网数据发送速率、以太网数据接收速率、高速互联网络带宽数据发送速率以及高速互联网络带宽数据接收速率。5如权利要求3或者4所述的机群性能监控接口,其中所述多个子监控部件之一包括用于CPU类性能的子监控部件,其处于节点监控接口的中央区域,以及所述用于CPU类性能的子监控部件的每个监控单元对应于相应节点中的每个CPU核心,且每个监控单元以绿色柱子来呈现相应CPU核心的CPU利用率。6如权利要求35中任一个所述的机群性能监控接口,其中所述每个节点监控接口包括四个子监控部件,分别为用于内存类性能的子监控部件、用于CPU类性能的子监控部件、用于存储类性能的子监控部。

6、件以及用于网络类性能的子监控部件。7如权利要求6所述的机群性能监控接口,其中所述用于CPU类性能的子监控部件位于所述节点监控接口的中央,所述用于内存类性能的子监控部件位于所述用于CPU类性能的子监控部件的左侧,所述用于存储类性能的子监控部件位于所述用于内存类性能的子监控部件和所述用于CPU类性能的子监控部件的下方,以及所述用于网络类性能的子监控部件位于所述用于CPU类性能的子监控部件和所述用于存储类性能的子监控部件的右侧。8如权利要求7所述的机群性能监控接口,其中所述用于内存类性能的子监控部件包括分别用于内存交换分区的访问率和内存交换分区的利用率的监控单元,所述用于内存交换分区的访问率和内存交。

7、换分区的利用率的监控单元分别以红色柱子来呈现内存交换分区的访问率和内存交换分区的利用率。权利要求书CN101996126ACN101996131A2/3页39如权利要求18中的任一个所述的机群性能监控接口,其中所述多个节点监控接口根据相对应节点所述的机群而分组成相应的一个或者多个节点监控接口组,而且所述一个或者多个节点监控接口组中的节点监控接口根据节点的属性而进行排列。10如权利要求9所述的机群性能监控接口,其中在所述一个或者多个节点监控接口组中,节点监控接口以行和列的方式排列,并且具有相同节点属性的节点监控接口布置在相同行中。11一种适于监控一个或者多个机群的机群性能监控方法,其中所述每个机。

8、群包括多个节点,所述方法包括步骤为所述机群中的每个节点提供具有相同布局的相应节点监控接口;为所述相应节点监控接口提供多个子监控部件,其中每个子监控部件对应于所述相应节点的某个类别性能;为所述每个子监控部件提供多个监控单元,每个监控单元对应于所述类别性能中的某个性能;以及在所述每个监控单元中,以柱状图形式实时显示所述性能指标,其中所述柱状图中的柱高度反映了所述性能指标的大小。12如权利要求11所述的机群性能监控方法,其中所述每个节点监控接口具有相同的背景色,而所述每个节点监控接口中的多个子监控部件具有不同的前景色。13如权利要求11所述的机群性能监控方法,其中所述节点的性能类别选自包括以下性能类。

9、别的组中的一个或者多个性能类别内存类性能、CPU类性能、存储类性能和网络类性能。14如权利要求13所述的机群性能监控方法,其中所述内存类性能包括一个或者多个下述性能内存交换分区的访问率、内存交换分区的利用率、内存访问率和内存利用率;所述CPU类性能包括一个或者多个下述性能节点中各个CPU核心的CPU利用率和CPU系统利用率;所述存储类性能包括一个或者多个下述性能节点中各种类型存储器的存储器吸入速率和存储器读取速率;以及所述网络类性能包括一个或者多个下述性能以太网数据发送速率、以太网数据接收速率、无线带宽数据发送速率以及无线带宽数据接收速率。15如权利要求13或者14所述的机群性能监控方法,其中。

10、所述为所述相应节点监控接口提供多个子监控部件的步骤包括提供用于CPU类性能的子监控部件,其处于节点监控接口的中央区域,以及所述为所述每个子监控部件提供多个监控单元的步骤包括为所述用于CPU类性能的子监控部件提供多个监控单元,其中所述多个监控单元中的每个监控单元对应于相应节点中的每个CPU核心,且每个监控单元以绿色柱子来呈现相应CPU核心的CPU利用率。16如权利要求1315中任一个所述的机群性能监控方法,其中所述为所述相应节点监控接口提供多个子监控部件的步骤包括提供用于内存类性能的子监控部件;提供用于CPU类性能的子监控部件;提供用于存储类性能的子监控部件;以及权利要求书CN101996126。

11、ACN101996131A3/3页4提供用于网络类性能的子监控部件。17如权利要求16所述的机群性能监控方法,其中所述用于CPU类性能的子监控部件位于所述节点监控接口的中央,所述用于内存类性能的子监控部件位于所述用于CPU类性能的子监控部件的左侧,所述用于存储类性能的子监控部件位于所述用于内存类性能的子监控部件和所述用于CPU类性能的子监控部件的下方,以及所述用于网络类性能的子监控部件位于所述用于CPU类性能的子监控部件和所述用于存储类性能的子监控部件的右侧。18如权利要求17所述的机群性能监控方法,其中所述用于内存类性能的子监控部件包括分别用于内存交换分区的访问率和内存交换分区的利用率的监控。

12、单元,所述用于内存交换分区的访问率和内存交换分区的利用率的监控单元分别以红色柱子来呈现内存交换分区的访问率和内存交换分区的利用率。19如权利要求1118中的任一个所述的机群性能监控方法,还包括步骤根据相应节点所属机群而将多个节点监控接口分组成相应的一个或者多个节点监控接口组;以及根据节点的属性对所述一个或者多个节点监控接口组中的节点监控接口进行排列。20如权利要求19所述的机群性能监控方法,其中在所述一个或者多个节点监控接口组中,节点监控接口以行和列的方式排列,并且具有相同节点属性的节点监控接口布置在相同行中。权利要求书CN101996126ACN101996131A1/6页5一种机群性能监控。

13、接口及其方法技术领域0001本发明涉及机群监控领域,尤其涉及对机群中的各个节点的性能进行监控的用户接口以及监控方法。背景技术0002为了满足各种对强大计算性能要求的应用,出现了将多个独立的计算机用软件和硬件组合在一起以提供强大计算性能的机群系统。在机群系统中的每个独立计算机称为节点。在将机群系统投入运行中时,机群系统的性能,即在特定的硬件环境和软件环境下,机群系统对于特定的工作负载所表现的计算能力是个非常关键的因素。机群系统的性能通常取决于机群系统中各个节点的性能。一般而言,这些节点的性能指标包括每个节点的内存交换区以下简称SWAP的利用率、SWAP的访问率,内存的利用率、内存的访问率、中央处。

14、理器以下简称CPU的利用率、CPU主频、CPU个数和核数、存储的读写速率以及网络的收发速率等。0003目前,已经存在有多种机群性能监控系统,用于对机群的性能进行监控。0004附图1给出了惠普公司的机群管理软件CMU的用户接口,其中在接口的左侧部分列出了机群中的各个节点,而在右下侧以圆形饼图方式示出了机群的各类性能的整体性能参数。但是惠普公司的CMU存在以下问题首先,该用户接口并没有给出诸如单个节点CPU每核的利用率、SWAP的利用率以及IB数据之类的关键性能指标;其次,CMU的用户接口无法在单个界面内容显示整个机群中各个节点的具体性能状态;而且CMU也不支持同时显示多个机群的性能。0005附图。

15、2给出了CGGVERITAS公司的机群软件GEOCLUSTER提供的机群监控接口SCP,如附图2可以看出,该监控接口只提供了多个节点在过去24小时的CPU使用情况,并没有提供实时显示,另外该监控接口仅仅提供有关每个节点的CPU使用率的性能指标的信息,而没有提供其他同样非常重要的性能指标,因而无法被使用该监控接口的用户用于性能分析。0006由于机群监控系统一般在机群系统运行时实时运行,而且一般有用户通过机群监控接口来实时监控机群系统的运行状况,因此,能够在单个机群监控接口中呈现尽可能多的机群性能信息,尤其是机群中各个节点的性能信息是所希望的。另外,由于机群监控接口中通常呈现大量的信息,监控接口的。

16、用户通常希望能够在监控中及时发现存在问题的节点,因此,能够以足够引起注意的方式来显示存在问题的节点也是机群监控接口所希望有的功能。发明内容0007鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的机群性能监控接口和机群监控方法。0008根据本发明的一个方面提供了一种机群性能监控接口,适于监控一个或者多个机说明书CN101996126ACN101996131A2/6页6群,其中每个机群包括多个节点,所述机群性能监控接口包括多个节点监控接口,每个节点监控接口对应于所述多个节点中的每个节点并为相应节点显示其性能指标,其中所述多个节点监控接口中的每个节点监控接口包括多个子监。

17、控部件,每个子监控部件包括多个监控单元,其中每个子监控部件实时显示所述相应节点的某个类别性能的指标,而且多个监控单元中的每个监控单元实时显示所述类别性能中某个性能的当前指标,其中所述每个监控单元都以柱状图形式显示相应性能的指标,所述柱状图中的柱高度反映了所述相应性能指标的大小,以及其中所述每个节点监控接口具有相同的子监控部件布局。0009根据本发明的另一个方面,提供了适于监控一个或者多个机群的机群性能监控方法,其中所述每个机群包括多个节点,所述方法包括步骤为所述机群中的每个节点提供具有相同布局的相应节点监控接口;为所述相应节点监控接口提供多个子监控部件,其中每个子监控部件对应于所述相应节点的某。

18、个类别性能;为所述每个子监控部件提供多个监控单元,每个监控单元对应于所述类别性能中的某个性能;以及在所述每个监控单元中,以柱状图形式实时显示所述性能指标,其中所述柱状图中的柱高度反映了所述性能指标的大小。0010根据本发明的机群性能监控接口和方法可以在单个监控接口中同时显示机群中所有节点的多个重要性能指标,由于每个性能指标都已不同颜色或者方式的柱状图显示,而且每个节点具有相同的监控接口布局,因此用户使用根据本发明的机群性能监控接口可以方便且容易地查看整个机群的运行状态。0011每个节点监控接口包括四个子监控部件,分别为用于内存类性能的子监控部件、用于CPU类性能的子监控部件、用于存储类性能的子。

19、监控部件以及用于网络类性能的子监控部件。其中用于CPU类性能的子监控部件的每个监控单元对应于相应节点中的每个CPU核心,且每个监控单元以绿色其在RGB色彩模式中的值为0,255,0柱子来呈现相应CPU核心的CPU利用率。用于内存类性能的子监控部件包括用于内存交换分区的访问率和内存交换分区的利用率的监控单元,用于内存交换分区的访问率和内存交换分区的利用率的监控单元分别以红色其在RGB色彩模式中的值为255,0,0柱子来呈现内存交换分区的访问率和内存交换分区的利用率。0012就机群性能而言,各个节点的CPU利用率以及内存交换分区的状况属于节点运行状况的最重要判断指标,通过以例如绿色或者红色之类能够。

20、引起人足够关注度的颜色显示这些指标,可以使得机群监控接口的用户面对具有大量节点的监控接口时及时关注可能存在问题的节点,从而可以及时发现机群系统运行时可能出现的问题。附图说明0013通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中0014图1示意性地示出了现有技术中惠普公司的机群管理工具CMU监控接口;0015图2示意性地示出了现有技术中CGGVERITAS公司的机群软件GEOCLUSTER提供的机群监控接口SCP;0016图3示意。

21、性地示出了根据本发明一个实施例的机群监控接口;说明书CN101996126ACN101996131A3/6页70017图4示意性地示出了根据本发明一个实施例的机群监控接口中的节点监控接口;0018图5示意性地示出了根据本发明一个实施例的节点监控接口中用于内存类性能的子监控部件;0019图6示意性地示出了根据本发明一个实施例的节点监控接口中用于CPU类性能的子监控部件;0020图7示意性地示出了根据本发明一个实施例的节点监控接口中用于存储类性能的子监控部件;0021图8示意性地示出了根据本发明一个实施例的节点监控接口中用于网络类性能的子监控部件;0022图9示意性地示出了根据本发明另一个实施例的。

22、机群监控接口;以及0023图10示意性地示出了根据本发明一个实施例的机群监控方法。具体实施方式0024下面结合附图和具体的实施方式对本发明作进一步的描述。0025图3示意性地示出了根据本发明一个实施例的机群监控接口300,如图3所示,机群监控接口300包括多个节点监控接口310_1,310_2,310_N在下文中,当不特指特定节点监控接口时,用符号310泛指节点监控接口。每个节点监控接口310具有相同的布局,并且对应于一个相应的节点,并且显示该相应节点中的各种性能指标。同时,如图3所示,当机群包括较多节点时,可以利用定位装置例如鼠标选择机群监控接口300中的某个节点监控接口310来放大显示所选。

23、择的节点监控接口310以便更清楚显示该节点中的各种性能指标。为了保持接口的一致性,放大前后的节点监控接口310除了尺寸之外,其他布局均相同。0026如图3所示,在机群监控接口中,多个节点监控接口以行和列的方式排列,而且由于机群中的节点可以根据功能的不同而可以归类为具有不同属性的节点。例如,节点可以划分为管理节点、IO节点和计算节点。将具有相关属性的节点布置在同一行或者紧邻的多行中可以便于对节点进行监控。因此在图3中,第一行节点为属于管理节点的节点,第二行节点为属于IO节点的节点,而后面几行的节点为计算节点。0027图4示出了根据本发明一个实施例的机群监控接口中的节点监控接口310的具体结构。如。

24、图4所示,节点监控接口310包括多个子监控部件410如410_1、410_2、410_3和410_4。每个子监控部件410对应于节点中某个类别性能的指标,并且显示该类性能指标的值。通过将某个类别的性能指标集中在一个子监控部件中显示,可以便于机群监控接口的用户方便定位节点中某个类别的性能。0028每个子监控部件410还包括一个或者多个监控单元510,每个监控单元510对应于相应类别性能中的每个性能指标。这些监控单元通常为矩形,并且在矩形中,以柱状图的形式显示相应性能指标,例如,相应性能指标的值由柱状图中柱的高度来反映。0029应当注意的是,监控单元可以沿不同的方向延伸,而且监控单元中的柱子也可以。

25、根据需要沿不同方向延伸。同时,可以根据各个类别性能的特点来选择监控单元的延伸方向以及柱子的延伸方向。0030如图4所示,节点监控接口310包括四个子监控部件,分别为用于内存类性能的子说明书CN101996126ACN101996131A4/6页8监控部件410_1、用于CPU类性能的子监控部件410_2、用于存储类性能的子监控部件410_3以及用于网络类性能的子监控部件410_4。其中,用于CPU类性能的子监控部件410_2位于节点监控接口310的中央,用于内存类性能的子监控部件410_1位于用于CPU类性能的子监控部件410_2的左侧,用于存储类性能的子监控部件410_3位于用于内存类性能的。

26、子监控部件410_1和用于CPU类性能的子监控部件410_2的下方,以及用于网络类性能的子监控部件410_4位于用于CPU类性能的子监控部件410_2和用于存储类性能的子监控部件410_3的右侧。利用这个布局,在节点监控接口的中央部分着重显示用于CPU类性能的子监控部件410_2,由于在机群性能监控中,每个节点的CPU类性能是重要的性能指标,利用该布局,可以便于机群监控接口的用户在接口上方便地注意到各个节点的重要状态。0031应当注意的是,本发明并不局限于仅仅四个子监控部件,而是可以根据实际机群性能监控的需要来增加或者减少子监控部件。下面详细介绍各个子监控部件410的具体结构。0032图5示意。

27、性地示出了根据本发明一个实施例的节点监控接口中用于内存类性能的子监控部件410_1的具体结构。如图5所示,子监控部件410_1包括四个监控单元,其中沿纵向包括涉及内存交换区SWAP和内存的监控单元,而沿横向包括涉及访问率和利用率的监控单元,也就是说,子监控部件410_1包括处于左上角区域的用于SWAP访问率的监控单元510、处于右上角区域的用于SWAP利用率的监控单元520、处于左下角区域的用于内存访问率的监控单元530以及处于右下角区域的用于内存利用率的监控单元540。在监控单元510和520中,即在涉及SWAP的监控单元中,柱状图中的柱子以较为醒目的颜色如红色填充,而在涉及内存的监控单元5。

28、30和540中,柱子以相对较为柔和的颜色如深黄色其在RGB色彩模式中的值为128,128,0来填充。由于在机群性能监控中,如果某个节点的SWAP的访问率和利用率较高,则该节点出现问题的几率较大,根据本发明的机群监控接口以较为醒目的颜色来显示SWAP的性能指标,可以便于机群监控接口的用户快速地在多个节点中定位可能出现问题的节点,从而提高机群监控的效率。另外,在用于内存类性能的子监控部件410_1中,各个监控单元510540中的柱状图向上填充,即随着SWAP或者内存的访问率或者利用率的增加,柱状图中的柱子向上逐步上升。0033图6示意性地示出了根据本发明一个实施例的节点监控接口中用于CPU类性能的。

29、子监控部件410_2的具体结构。如图6所示,子监控部件410_2根据相应节点中的实际的CPU核数沿纵向划分成多个监控单元610,每个监控单元610对应于一个CPU核。每个监控单元610的柱状图中的柱子高度指示相应CPU内核的利用率。由于在节点的性能指标中,就某个CPU内核的CPU利用率而言,其中CPU用于操作系统的利用率也是值得关注的性能。为了在单个柱状图中同时显示这两个性能指标,在每个监控单元610中,将指示CPU内核利用率的柱状图分为两个部分,其中以柱子的总长度指示CPU内核的整体利用率,而在柱状图的底部,以不同颜色的部分柱子长度指示CPU用于操作系统的利用率。由于CPU用于操作系统的利用。

30、率仅仅为CPU整体利用率的一部分,因此,可以以单根柱子来同时指示两个不同性能指标。同时,在监控单元610的柱状图显示中,以深红色其在RGB色彩模式中的值为128,0,0的柱子指示CPU用于操作系统的利用率,而以较为醒目但对眼睛刺激较少的颜色如绿色柱子表示除去CPU用于操作系统的利用率之外的CPU利用率的其他部分。由于CPU利用率是性能监控中经常要关注的性能指标,通过在节点监控接口的中央部分并以说明书CN101996126ACN101996131A5/6页9较为醒目但对眼睛刺激较少的颜色如绿色来显示CPU利用率,可以减少对机群监控接口的用户的眼睛刺激,并同时便于用户进行监控。另外,在用于CPU类。

31、性能的子监控部件410_2中,各个监控单元610中的柱状图向上填充,即随着CPU利用率的增加,柱状图中的柱子向上逐步填充。0034图7示意性地示出了根据本发明一个实施例的节点监控接口中用于存储类性能的子监控部件410_3的具体结构。如图7所示,子监控部件410_3沿纵向包括涉及存储类型的监控单元,并且沿横向包括涉及读操作和写操作的监控单元。具体而言,子监控单元410_3可包括四个监控单元,如处于左上角区域的用于第一种存储设备的读取速率的监控单元710、处于右上角区域的用于第一种存储设备的写入速率的监控单元720、处于左下角区域的用于第二种存储设备的读取速率的监控单元730以及处于右下角区域的用。

32、于第二种存储设备的写入速率的监控单元740。子监控部件410_3可以为节点中的每种存储设备包括两个分别对应于读取和写入速率的监控单元,而不仅仅限于两种存储设备。考虑在大规模情况下的显示效果,需要使用亮度较高的色彩来显示磁盘数据,本方案使用橙色其在RGB色彩模式中的值为255,128,0的柱子指示存储设备的读取速率,使用天蓝色其在RGB色彩模式中的值为0,128,255的柱子指示存储设备的写入速率。同时,指示存储设备读取速率的监控单元如710和730中的柱状图从中间向左填充即随着读取速率的增大,柱子从中间向左填充,而指示存储设备写入速率的监控单元如720和740中的柱状图从中间向右填充即随着读取。

33、速率的增大,柱子从中间向右填充。0035图8示意性地示出了根据本发明一个实施例的节点监控接口中用于网络类性能的子监控部件410_4的具体结构。如图8所示,子监控部件410_4沿横向包括涉及网络接口类型的监控单元,而沿横向包括涉及网络数据发送和接收速率的监控单元。具体而言,子监控部件410_4包括四个监控单元,如处于左上角区域的用于第一种网络接口如以太网接口的网络数据发送速率的监控单元810、处于左下角区域的用于第一种网络接口的网络数据接收速率的监控单元830、处于右上角区域的用于第二种网络接口如IBINFINIBAND接口的网络数据发送速率的监控单元820以及处于右下角区域的用于第二种网络接口。

34、的网络数据接收速率的监控单元840。子监控部件410_4可以为节点中的每种网络接口包括两个分别对应于网络数据发送和接收速率的监控单元,而不仅仅限于两种网络接口。另外,根据本发明的一个实施方式,以洋红色其在RGB色彩模式中的值为255,0,255柱子指示网络数据的发送速率,而以青色其在RGB色彩模式中的值为0,255,255柱子指示网络数据的接收速率。同时,指示网络数据发送速率的监控单元如810和820中的柱状图从中间向上填充即随着网络数据发送速率的增大,柱子从中间向上填充,而指示网络数据接收速率的监控单元如830和840中的柱状图从中间向下填充即随着网络数据接收速率的增大,柱子从中间向下填充。。

35、0036图9示意性地示出了根据本发明另一个实施例的机群监控接口900,其类似于图3所示的机群监控接口300,但是在图9中,还示出了另一个机群中的所有节点,即根据本发明的机群监控接口可以将多个节点监控接口根据相对应节点所述的机群而分组成相应的一个或者多个节点监控接口组,并同时显示多个机群。0037图10示意性地示出了根据本发明一个实施例的机群监控方法1000的流程图,该方法适于监控一个或者多个机群的性能,而且每个机群包括多个节点。如图10所示,该方说明书CN101996126ACN101996131A6/6页10法始于步骤S1010,其中对于机群中的每个节点,提供具有相同布局的相应节点监控接口。。

36、随后,该方法进入步骤S1020,其中为每个节点监控接口提供多个子监控部件,其中每个子监控部件对应于所述相应节点的某个类别性能。并且在步骤S1030中,为每个子监控部件提供多个监控单元,其中每个监控单元对应于子监控部件所对应类别性能中的某个性能。然后在步骤S1040中,在每个监控单元中,以柱状图形式实时显示与该监控单元相对应的性能指标的值,其中柱状图中的柱的高度反映了该性能指标的大小。利用根据图10所述的方法,可以构造一个可以同时显示机群中所有节点的重要性能指标的机群监控接口,从而便于机群监控接口的用户进行监控。0038通常,在机群监控接口中,每个节点监控接口具有相同的背景色,而每个节点监控接口。

37、中的多个子监控部件以及子监控部件中的监控单元可以具有不同的前景色。通过以不同前景色显示各个性能指标,便于机群监控接口的用户根据某个颜色柱状图的长度就可以判断出某个相应性能指标的大小。0039根据本发明的一个实施方式,节点的性能类别可以包括内存类性能、CPU类性能、存储类性能和网络类性能。而每个节点监控接口的结构可以如上面参考图48所述的那样布局。0040因此,上述为每个节点监控接口提供多个子监控部件的步骤S1020可以包括下列子步骤即提供用于内存类性能的子监控部件;提供用于CPU类性能的子监控部件;提供用于存储类性能的子监控部件;以及提供用于网络类性能的子监控部件。0041另外,根据本发明的方。

38、法,还可以根据节点的属性对节点监控接口的位置进行排列。因此,方法还可以包括步骤根据相应节点所属机群而将多个节点监控接口分组成相应的一个或者多个节点监控接口组;以及根据节点的属性对所述一个或者多个节点监控接口组中的节点监控接口进行排列。0042本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器DSP来实现根据本发明实施例的机群监控接口中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序例如,计算机程序和计算机。

39、程序产品。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。0043应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元。

40、权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。说明书CN101996126ACN101996131A1/9页11图1说明书附图CN101996126ACN101996131A2/9页12图2说明书附图CN101996126ACN101996131A3/9页13图3说明书附图CN101996126ACN101996131A4/9页14图4说明书附图CN101996126ACN101996131A5/9页15图5说明书附图CN101996126ACN101996131A6/9页16图6说明书附图CN101996126ACN101996131A7/9页17图7图8说明书附图CN101996126ACN101996131A8/9页18图9说明书附图CN101996126ACN101996131A9/9页19图10说明书附图CN101996126A。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1