用于显示计算机系统状态信息的系统和方法 参照有关申请
本申请涉及Timothy C.Dearborn和Shawn P.Hoss的标题为“Computer System Status Display(计算机系统状态显示)”的美国设计专利申请,它与此同时提出申请并在此出于各种目的结合参考其全部内容。
【技术领域】
本发明的公开一般涉及计算机系统领域,并尤其涉及显示状态信息的一种系统和方法。
背景技术
一个数据中心,也称作一个服务器车间,典型的包括一组网络的服务器。网络的服务器被共同收容在一个单一的位置中。一个数据中心通过组合多个服务器的功率来加速计算机网络处理并通过分配服务器中的工作负荷来使负载平衡。多个公司和其他的组织正在使用数据中心,因为这些中心在处理大量的存储检索和数据处理交易很有效。取决于操作的性质和大小,一个数据中心可以具有成千上万的服务器。典型的,这些服务器是安装在机架上的和放在机柜里。每个机柜可以容纳许多机柜上的服务器。这些机柜通常组成管束或通道。因而,一个大的数据中心可以具有成排地机柜,每个包含几个机架上的服务器。典型的经一个单一的控制台通过一个或两个作为网络监视器的个体监视数据中心内的所有这些服务器。
常规的数据中心典型的使用服务器管理软件监视服务器部件并且万一发生一个部件故障时告警系统监视器。例如,如果一个服务器的硬盘驱动之一出错,则服务器管理软件将发送一个告警讯息到系统监视器的控制台。网络监视器将响应该告警讯息并纠正该故障。因为数据中心经常实现于命令连续和可靠操作的任务临界操作中,这些数据中心的服务器必须用很少的故障连续操作。万一一个服务器出错,必须立即解决问题。在此类环境下,任何停机时间是不可接受的。例如,如果一个金融公司的数据中心价格下降,一分钟的下降时间能导致成千上万的美元收入处于未执行的股票交易中。通常,一个错误的或故障的服务器部件导致服务器出错。可以出错的服务器部件的例子包括硬盘驱动,风扇,和电源。
万一一个系统出错,网络监视器必须分派一个技术员到数据中心以发现和替换故障的部件。因为数据中心用于一种连续的或任务临界函数,技术员必须尽快更换故障部件。每个服务器典型的包括能由一个用户或技术员服务的几个部件。这些部件包括风扇,硬盘驱动,母板,PCI卡,存储器DIMM,电源,电缆,和CPU,连同其他的部件。这些部件的每个可以包括报告部件操作状态的一个或多个状态灯。一个单一的部件可以包括报告设备状态的几个状态灯。状态灯的颜色以及灯是否闪烁表示部件是否正常操作。例如,一个绿色状态灯通常表示部件正确进行操作。如果状态灯是其它的一种颜色而不是绿色,或者正在闪烁,则设备可能出故障了。如果不复杂的话,许多部件使用一种唯一的颜色,闪烁灯的模式来通知部件的状态。
作为一个例子,一个典型的服务器硬盘驱动包含几个状态灯。这些硬盘状态灯可以对应于电源,磁盘活动性,和一个告警指示器。其它的服务器部件可以包括多于典型硬盘驱动的状态灯。因为每个服务器具有若干部件,每个服务器将具有许多状态灯。例如,一个典型的服务器可以包含八个硬盘驱动,每个包括三个状态灯。此外,服务器在它的前面板上将典型的包括一打状态灯。该服务器也将包括不具有在前面板上是可见的状态灯的部件,例如,用于一个风扇单元的状态灯是不可见的,直到服务器的机壳被打开。总之,一个单一的服务器可以包括多于五十个的单独的状态灯。一个服务器的机架可以包括上百的单独的状态灯,并且一个数据中心内的一个单独的通道可以包括成千上万的单独的状态灯。
【发明内容】
按照本发明公开的教导,公开了在一个计算机系统中用于显示来自若干设备状态信息的一种系统和方法,提供了比现有开发的系统更为先进有效的方法
一个主状态指示器位于一个服务器的一个仪表前盖或面板上。主状态指示器是可通信的耦合到监视服务器的服务器管理软件。如果服务器管理软件在任何服务器的部件中没有检测到一个故障或一个将临的故障,则主状态指示器将被照明来反映一个正常的操作状态。如果服务器管理软件在服务器的一个部件中检测到一个故障或一个将临的故障,则主状态指示器将被照明来反映一个告警状态。在本发明公开的另一个实施例中,技术员则可以移去或打开仪表前盖以便显露出服务器的前面板。在本发明公开的另一个实施例中,前面板还可以包含一个状态显示,它输出文本或图形以识别一个告警状态的缘由。
在用于显示状态信息的本发明公开的系统和方法的另一个实施例中,一个主状态指示器可以与一组若干服务器有关,比如一个机柜或一排服务器。如果一个主状态指示器与一组服务器有关的话,则该主状态指示器将被照明来反映一个正常操作状态,如果服务器管理软件在组中的任何服务器中没有检测到一个故障的或出错部件。如果服务器组中的任何服务器的任何部件出错或是有出错的危险,则主状态指示器将反映一个告警状态。
本发明公开的一个技术优点是,一个单一的状态指示器最初展示给技术员。简单地显示允许一个技术员快速地评价若干服务器的状态而不用检查每个服务器的前面板或每个服务器的所有状态灯。如果服务器的其中之一具有一个故障部件,该服务器能被快速识别。本发明公开的另一个优点是,它提供了一个服务器状态的一种明确的指示。基于主状态指示器的照明的颜色和/或位置,一个技术员能快速确定是否一个服务器已经出错。本发明公开的另一个优点是,允许在一个数据中心内的所有服务器上统一定位状态信息而不管服务器的结构配置,并且作为每个主状态指示器的制造商可以在一个仪表前盖或面板上统一的被定位。此外,主状态指示器的集中位置有利于快速评估服务器状态。本发明公开的另一个优点是,主状态指示器可以被用在具有小的或窄的前面板的服务器上,因为主状态指示器指示一个单一的指示器,并且它还可以结合标志图或标记,它们可以不同的起到限制空间的作用。而且,因为一个公司标记可以被合并在主状态指示器中,整个正常状态情况中正名和商标识别可以被加强。此外,本发明的公开允许在整体数据中心上进行统一的设计而不管服务器的结构或制造商,这也增强了名称和商标识别。根据本发明的具体描述,权利要求书,以及附图,本领域的普通技术人员将会更加明白其他的技术优点。
【附图说明】
通过结合附图参考下面的描述,将会更加完全地明白本发明的实施例和优点,其中同样的参考数字表示同样的特征,和其中:
图1a和1b图示了具有部分打开的仪表前盖的一个服务器;
图1c图示了具有一个关闭仪表前盖的一个服务器;
图2a是仪表前盖的一个实施例的正面图;
图2b是仪表前盖一个实施例的背面图;
图2c是仪表前盖一个实施例的一个正面图;
图2d是仪表前盖一个实施例的一个正面图;
图3a是仪表前盖一个实施例的一个正面图;
图3b是仪表前盖一个实施例的背面图;
图3c是仪表前盖一个实施例的一个正面图;
图4a图示了去掉仪表前盖的一个服务器;
图4b图示了后面安装了状态显示的一个服务器;
图5图示了一个数据中心;和
图6是本发明公开的方法的一个实施例的流程图。
【具体实施方式】
本发明的详细描述公开了一个主状态指示器,它位于被安装的一个仪表前盖上以覆盖一个服务器的前面板。主状态指示器从监视服务器的服务器管理软件上接收状态信息。整个服务器管理软件在服务器的任何部件中没有检测到一个故障或一个将临的故障的那些周期中,主状态指示器将被照明来反映一种正常的操作状态。如果服务器管理软件确实检测到服务器一个部件中的一个故障或一个将临的故障,主状态指示器将被照明来反映一种高告警状态。
图1a,1b,和1c示例了本发明公开的一个实施例。图1a所示的是以一种塔结构的一个计算机系统或服务器15。图1b所示的是一个安装在机架上服务器15。服务器15可有若干部件,且每个可以具有一个或多个状态灯。例如,如图1a和1b所示,服务器15包含八个硬盘驱动35,每个包含三个状态灯40。服务器15还包含四个电源45,每个包含三个状态灯50。因而,服务器15在单独的前面板55上具有许多状态灯。此外,典型的服务器15也具有诸部件,它们不具有在前面板55上可见的状态灯。例如,用于一个风扇单元的状态灯是不可见的,直到打开服务器15的机壳。
可以安装仪表前盖或面板60来覆盖服务器前面板55。仪表前盖60可以被安装在服务器前面板55上,或安装在用于服务器15的机壳或外壳210上,或者任何其他合适的位置。仪表前盖最好定尺寸来覆盖全部的服务器前面板55并在宽度和高度上充分匹配服务器前面板55的尺寸。例如,仪表前盖60的宽度WB最好充分等与服务器15的宽度WS。同样,仪表前盖的高度HB最好充分等于服务器15的高度HS。仪表前盖60最好是不透明的以便防止来自服务器前面板55上的状态信息光传输通过仪表前盖60。仪表前盖60可以使通风的以允许冷却服务器前面板55。通过铰链90可以把仪表前盖附加在服务器前面板55上,以致于仪表前盖60可以被摆动打开从而露出服务器前面板55。如图1a和1b所示,仪表前盖不是完全关闭的。图1c示出了图1b的服务器15,其中仪表前盖60是关闭的。整个正常的服务器15操作期间,仪表前盖60最好是关闭的。可替换的,可以通过导轨把仪表前盖安装在服务器前面板55上,以致于仪表前盖可以滑动打开来露出服务器前面板55。可替换的,仪表前盖60可以通过插口被附属到服务器前面板55上,以致于仪表前盖60可以与服务器15分离来露出服务器前面板55。
图2a是仪表前盖60的一个实施例的正面图。主状态指示器65被安装在仪表前60的前表面上。主状态指示器65可以是一个标记或任何其他的指示器。主状态指示器65最好显著地位于仪表前盖60的前表面上以便具有最大的可见性。一个显著位置的主状态指示器65被安装或被定位在仪表前盖60前表面上的一个充分中心的位置。主状态指示器65最好结合一个公司标志,比如服务器15的制造商或经销商的公司标志。图2b显示了图2a所示的仪表前盖的背部。主状态指示器65包含至少一个灯源100以便主状态指示器65可以被照明。灯源100可以是任意的能提供一个一致的可靠灯源的设备。例如,灯源100可以是一个LED或LED灯杆。主状态指示器65以至少一种区别颜色照明。如果主状态指示器65结合一个公司标志,主状态指示器65可以以与公司标志相关的颜色被照明。此外,主状态指示器65还可以旋转以便主状态指示器65是水平的或处于一个固定的位置而不管服务器15的旋转。例如,如果主状态指示器65结合一个公司标志,该标志将是正面朝上的,而不管服务器15是否是水平或垂直定向的。
主状态指示器65可以被定位在仪表前盖的其他位置上。例如,如图2c所示,主状态指示器65被定位在仪表前盖60的右上角的地方。如上所述,对于数据中心中的每个服务器15,每个主状态指示器65最好充分的位于仪表前盖60上的相同的位置。主状态指示器65可以是任意的形状。例如,主状态指示器65可以是一种正方形的指示器,如图2d所示。由于一种统一的外形将便于一个特殊主状态指示器65的视觉位置,因此,对于数据中心中的每个服务器15,每个主状态指示器65最好是充分相同的尺寸和形状。如果计算机系统没有仪表前盖60,则主状态指示器65可以被安装在前面板55上。
图3a是仪表前盖60另一个实施例的正面图。在该实施例中,主状态指示器65具有两种选择:一个正常状态部分70和一个告警状态部分75。为了快速识别服务器15的状态,正常状态部分70最好位于告警状态部分75的上面。这两部分70和75不必是相同的尺寸。图3b显示了图3a所示的仪表前盖60的背部。在该实施例中,主状态指示器65包含两个灯源110和115来用于照明主状态指示器65。如上所述,灯源110和115可以是任何合适的灯源,比如一个LED或LED灯杆。灯源110照明正常的状态部分70。灯源110可以以任何颜色或方式照明正常状态部分70。灯源110最好通常以与正常操作条件或服务器15的制造商或经销商的公司标志或商标有关的一种颜色照明正常状态部分70。例如,灯源110可以以一种蓝色或绿色照明正常状态部分70。灯源115照明告警状态部分75。灯源115可以以任意的颜色或方式照明告警状态部分75。灯源115通常最好以与一个告警状态或一个故障相关的一种颜色照明告警状态部分75。例如,灯源115可以以一种琥珀色或一种红色照明告警状态部分75。可替换的,两个灯源110和115,或者一个单一的灯源,只可以产生白光,并且正常的和告警状态部分70和75可以由适当颜色的透明材料制成。上述的具体颜色仅作为示例—正常状态部分70和告警状态部分75可以以任何期望的颜色或方式被照明。
主状态指示器65可以具有多于一个或两个的部分,如图2a-d和3a-b所示。主状态指示器可以利用更多的部分通知用于服务器15的附加的状态信息。而且,如果主状态指示器65利用了两个或更多的部分,这些部分不必像图3a-b那样作为一个单一的单元出现。例如,主状态指示器65可以是状态指示器或灯的一个群集。在图3c中,主状态指示器65的正常状态部分70和告警状态部分75作为灯的一个群集出现,而不是像图3a所示的那样作为一个单一的或合并的单元。
如图5所示,一个数据中心140可以实现服务器管理软件120。主状态指示器65可以从服务器管理软件120接收状态信息。经一个硬线连接主状态指示器65被可通信的耦合到服务器管理软件120,比如一种光纤连接,一种无线连接,例如一种利用RF或IR的传输,或者任何其他的适当的通信连接。服务器管理软件120允许系统管理者监视包括服务器15的网络部件的状态。通常,服务器管理软件120评价网络上的系统和那些系统中部件的良好状况或操作状态,监视网络性能,预占网络中断和识别用于网络增长和重新排列的区域。例如,服务器管理软件120可以提供仪器运系统管理员收集状态信息,比如温度,风扇速度,电压和磁盘错误,以及其他的表示服务器15的良好状况的数据。因此,服务器管理软件120检测故障的或错误的网络部件并通知该状态信息。一旦检测到故障的或错误的网络部件,服务器管理软件120可以照明与故障的或错误的设备相关的适当的状态灯并通信一个告警讯息或注意到适当的终端或控制台。例如,在服务器管理软件120检测到网络中一个故障硬盘驱动的情况下,适当的硬盘驱动告警状态灯将被照亮并且一个注意将被通信到监视控制台155。因为主状态指示器65是可通信的被耦合到服务器管理软件120,主状态指示器65显示服务器15的状态。如果服务器管理软件120在服务器15中没有检测到故障的或错误的部件,则可以考虑服务器15的状态是一种正常的操作状态。如果服务器管理软件120检测到服务器15中的任何故障或错误的部件,则可以考虑服务器15的状态是一种告警状态。取决于状态,主状态指示器65将被适当的照明以反映该状态。此外,主状态指示器65还直接从服务器部件或与服务器部件相关的传感器上接收状态信息。
对于图2a所示的实施例,主状态指示器65可以通常以与正常操作相关的一种颜色照明,比如绿色。最好是,主状态指示器65可以以有关一个公司商标的一种颜色被照明,比如对于一种正常的操作状态是蓝色。在服务器15中被检测到一个故障的或错误的设备的情况下,用于服务器15的主状态指示器65可以通常以与一个故障相关的一种颜色被照明,比如红色或琥珀色。可替换的,对于正常的状态照明或告警状态照明,主状态指示器65可以暗淡或减弱照明。例如,当检测到一个故障的或错误的设备时,主状态指示器65的照明状态可以是一种暗淡的或熄灭状态。对于图3a中所示的实施例,只要服务器管理软件120在与主状态指示器65相关的服务器15中没有检测到一个故障的或错误的设备,主状态指示器65的正常状态部分70可以长时间地保持照明。如上所述,正常状态部分70最好是以与一个公司商标的一种颜色或者以与通常的一种正常操作状态的一种颜色来被照明。在服务器管理软件120检测到服务器15中一个故障的或错误的部件的情况下,则正常状态部分70减弱照明并且告警状态部分75被照明。如上所述,告警状态部分75最好是以与通常的一种出故障的一种颜色被照明,比如红色或琥珀色。
状态显示85最好位于服务器15的前面板55上。图4a显示了状态显示85的一个实施例,其中没有显示仪表前盖65。此外,状态显示85还可通信的被耦合到服务器管理软件120。状态显示85可以是能显示文本或图形的任何设备。例如,状态显示85可以是一个LCD显示。状态显示85显示从服务器管理软件120通信的状态信息。该状态信息可以包括正常操作,比如有关故障的或错误部件的一个引导硬盘驱动或信息。可以用由服务器管理软件120使用的文本或数字代码显示该状态信息来报告问题,或者二者一起使用。例如,在用于一个服务器15的第二风扇出故障的情况下,状态显示85可以显示文本“风扇2-故障”。状态显示85可以显示对应于第二风扇中一个错误的错误代码。在服务器管理软件120没有报告有关服务器15任何信息的情况下,则状态显示85只显示服务器15的名称或地址。
状态显示85可以以一种或多种颜色被照明。例如,整个正常操作状态期间,状态显示可以以与一种正常操作状态相关的选择的颜色被照明,比如绿色或蓝色。可替换的,整个正常操作状态期间,状态显示85可以完全不被照明。在一个故障或错误部件的情况下,状态显示85可以以与一种告警状态相关的选择的颜色被照明,比如红色或琥珀色。
状态显示85也可以是自激活的。例如,如图1a和1b所示,仪表前盖60可以包含与服务器15前面板上的对接头80耦合的连接器125。当仪表前盖60被关上时,连接器125被耦合到对接头80。在连接器125被耦合到对接头80的情况下,状态显示85不被照明。当仪表前盖60被打开和连接器125脱离对接头80的情况下,状态显示85可以被照明。因此,只在仪表前盖60被打开的情况下状态显示85可以被照明,并因此保存能量和有最少量的光通过仪表前盖65。
如上所述,服务器可以被组成在机柜里和若干机柜可以放在一个组合库里。如果从服务器15的前面不能访问需要服务的故障部件,则技术员必须到组合库的后面打开服务器15并替换故障部件。如果一个状态显示85只位于服务器15的前面板55上,如果技术员在组合库的后面,他就不能够读取在状态显示85上显示的信息。因此,一个状态显示85也可以位于服务器15的背面板130上,如图4b所示。因为两个状态显示85从相同的源接收状态信息,例如,从服务器管理软件120,可以避免不一致的状态信息。
图5示例了实现本发明公开的一个实施例的一个数据中心140。若干服务器15被安装在机柜145中。这些服务器15可通信的被耦合以构成一个或多个计算机网络,一般在215上表示。若干机柜145被安排在组合库150中。一个系统管理员通过具有服务器管理软件120控制台155来监视数据中心140。在服务器管理软件120登记一个错误或故障的部件的情况下,一个技术员可以被调度到数据中心140。代替需要控制具有许多状态灯的多个服务器前面板55,以具有主状态指示器65的一个统一的仪表前盖60的阵列呈现给技术员。
此外,主状态指示器65与可以与一组服务器15或一个计算机系统相关而不是一个单一的服务器15。例如,除了在用于服务器15的仪表前盖60上进行实现之外,一个主状态指示器65可以在机柜外壳145上被实现成一个机柜状态指示器160。一个机柜状态指示器160是一个与一整个机柜145有关的一个主状态指示器而不是与一个单一的服务器15有关。因此,与上述的主状态指示器65相比,机柜状态指示器160具有充分相同的功能性和以相同的方式操作。当服务器管理软件检测到一个服务器15中的一个错误或故障的部件时,与包含受影响服务器15的机柜145有关的机柜状态指示器160将被适当的照明来反映告警状态。这样,如果位于机柜145中的任何服务器15需要业务,机柜状态指示器160将反映一个告警状态。如果服务器管理软件120报告安装在机柜145上的所有服务器15的状态是正常的,则机柜状态指示器160将反映正常操作状态。主状态指示器65和机柜状态指示器160将能够使技术员更快的响应一个业务呼叫。
除了在一个仪表前盖60和机柜外壳145上进行实现之外,一个主状态指示器也可以被实现成用于一个整个组合库150的一个组合库状态指示器165组合库指示器165是一个与一个完整的组合库150有关的主状态指示器而不是与一个单一的服务器15相关。因此,与上述的主状态指示器65相比,组合库状态指示器165具有充分相同的功能性和以相同的方式操作。组合库状态指示器165可以被安装在一个选择的机柜外壳145上,比如在组合库150末端上的一个机柜145。当服务器管理软件检测到一个服务器15中的一个错误或故障的部件时,与包含受影响的服务器15的组合库150相关的组合库状态指示器165将被适当的照明来反应告警状态。这样,如果位于组合库150中的任何服务器15需要业务,组合库状态指示器165将反映一个告警状态。如果服务器管理软件120报告位于组合库150中的所有服务器15的状态是正常的,则组合库状态指示器165将被反映正常操作状态。主状态指示器65,机柜状态指示器160和组合库状态指示器165的组合允许一个技术员更快速的定位和替换或修理故障部件。
图6是使用本发明公开的响应一个故障的或错误服务器15的处理流程图。在步骤170,服务器管理软件120检测一个错误或故障的部件。例如,参考图5,故障部件可以是位于组合库150c的机柜145c中的用于服务器205的一个硬盘驱动。接着,在步骤175,一个告警讯息被通信到监视控制台155。用于故障硬盘驱动的告警状态灯被适当照明。有关服务器205的主状态指示器65也被适当照明来反映一个告警状态。如果组合库状态指示器165被实现在数据中心140中,则组合库状态指示器165c被适当照明来反映告警状态,因为服务器205是位于组合库150c中。如果机柜状态指示器160被实现在数据中心140中,则机柜状态指示器160c被适当照明来反映告警状态,因为服务器205是位于机柜145c中。
在步骤180,一个技术员被分派到数据中心140。技术员接着在步骤185定位包含错误或故障硬盘驱动的服务器的组合库150和机柜145。当他通过每个组合库150时,技术员通过勘察主状态指示器65可以快速定位用于服务器205的组合库150和机柜145。因为用于服务器205的主状态指示器65将被照明以反映告警状态,同时每个其他的主状态指示器65被照明来反映一种正常操作状态,技术员将能够快速地发现服务器205。此外,技术员还可以通过第一次勘察组合状态指示器165快速的和容易的定位右边的组合库150,并发现组合库状态指示器165c。因为组合库指示器165c被适当的照明来反映告警状态,技术员将能够容易地认出该指示器。接着,技术员通过第一次勘察机柜状态指示器160可以快速和容易的定位右边的机柜145,并发现组合状态160c。因为机柜状态指示器160c被适当照明以反映告警状态,技术员将能够容易地认出该指示器。
一旦技术员已经定位了正确的组合库150c和机柜145c,在步骤190,它能容易的定位服务器205,通过查找被照明反映一个告警状态的主状态指示器65。接着,在步骤200,技术员移开或打开用于服务器205的仪表前盖60以观察服务器205的前面板55。技术员现在可以查看用于服务器205的状态显示和读取对应于服务器205的状态讯息。如果用于服务器205的硬盘驱动被安装在前面,技术员也可以查看用于所有硬盘驱动35的状态灯40以便定位已经故障的或正在出错的硬盘驱动。技术员现在可以替换故障硬盘驱动35。
因为主状态指示器65最初只出现一个状态指示器,技术员能够快速地访问若干服务器15的状态而不用检查每个服务器15的前面板。这样,具有一个故障部件的一个服务器15能够快速的从一大组服务器15中被认出。基于主状态指示器65照明的颜色和/或位置,一个技术员能够快速地确定是否一个服务器部件已经出错。实现主状态指示器65允许在一个数据中心140中的所有服务器15上统一定位状态信息而不管服务器的结构和制造商。因为在一个仪表前盖60上只需要定位放置一个主状态指示器65,主状态指示器65可以被统一的定位在所有仪表前盖60上。主状态指示器65的一致位置也便于快速评估服务器状态。在具有小的或窄的前面板55的服务器15上可以使用主状态指示器65,因为主状态指示器65仅有一个单一的指示器,并且它还可以结合标志图或标记,它们可以不同的起到限制空间的作用。而且,因为一个公司标记可以被合并在主状态指示器中,整个正常状态情况中正名商标识别可以被加强。此外,主状态指示器65还允许在整体数据中心上进行统一的设计而不管服务器的结构或制造商,这也增强了名称和商标识别。
尽管公开的实施例已经被详细的描述,但应该明白,在不脱离本发明的精神和范围的情况下,可以对实施例进行各种变化,替换和更改。