原位处理器重新表征.pdf

上传人:Y948****062 文档编号:625014 上传时间:2018-02-26 格式:PDF 页数:18 大小:2.74MB
返回 下载 相关 举报
摘要
申请专利号:

CN201380006014.8

申请日:

2013.01.11

公开号:

CN104067234A

公开日:

2014.09.24

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 11/24申请日:20130111|||公开

IPC分类号:

G06F11/24

主分类号:

G06F11/24

申请人:

国际商业机器公司

发明人:

C.A.克里戈夫斯基; S.卡洛; B.R.普拉斯基; F.Y.布萨巴; C-L.K.舒姆

地址:

美国纽约阿芒克

优先权:

2012.01.19 US 13/353,544

专利代理机构:

北京市柳沈律师事务所 11105

代理人:

张晓明

PDF下载: PDF下载
内容摘要

提供了一种重新表征处理,其调整处理器的一个或多个运行参数以改进处理器的健康度(例如,减少错误)。作为示例,参数包括电压和/或时钟频率。处理器可以是不活动的或活动的处理器,对其执行重新表征处理。在一个示例中,通过硬件控制器实时执行。

权利要求书

1.  一种用于促进计算环境中的处理的计算机系统,所述计算机系统包括:
存储器;
与所述存储器通信的处理器;
检查部件,用于检查处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数;
调整部件,响应于确定要调整至少一个运行参数,用于调整所述至少一个运行参数,其中在所述计算环境的其他处理器保持运行的产生工作负载的执行期间,实时执行调整;以及
发起部件,响应于所述调整,用于发起所述处理器的测试以用至少一个调整的运行参数确定所述处理器是否运行在可接受的运行水平,其中基于指示所述处理器运行在可接受的运行水平的测试,所述处理器可用于执行工作负载。

2.
  如权利要求1所述的计算机系统,其中所述一个或多个运行参数包括电压、时钟频率和温度的至少一个。

3.
  如权利要求1或2的任一所述的计算机系统,还包括获得部件,用于获得所述处理器处于不可接受的运行水平的指示,并且其中所述检查部件进一步可操作用于基于所述处理器处于不可接受的运行水平的指示检查。

4.
  如权利要求3所述的计算机系统,其中所述获得部件进一步可操作用于基于所述处理器具有重新出现的错误并且在从所述处理器卸载状态之后,执行一个或多个诊断测试,并且用于接收指示所述处理器处于不可接受的运行水平的故障信号。

5.
  如权利要求1所述的计算机系统,其中所述检查部件进一步可操作用于以预定时间间隔检查。

6.
  如权利要求1到5的任一所述的计算机系统,其中所述检查部件进一步可操作用于确定所述处理器的提供电压是否处于预定电压,并且其中所述调整部件进一步可操作用于基于确定所述提供电压未处于所述预定电压,改变到所述处理器的电压。

7.
  如权利要求6所述的计算机系统,其中所述检查部件进一步可操作用于基于所述提供电压处于所述预定电压,确定所述处理器的时钟频率是否处 于预定频率,并且其中所述调整部件进一步可操作用于基于确定所述时钟频率未处于所述预定频率,改变所述时钟频率。

8.
  如权利要求6所述的计算机系统,其中所述检查部件进一步可操作用于响应于在改变电压之后确定所述处理器的运行水平处于不可接受的水平,确定时钟频率是否处于预定频率,并且其中所述调整部件进一步可操作用于基于确定所述时钟频率未处于所述预定频率,改变所述时钟频率。

9.
  如前述权利要求的任一所述的计算机系统,其中所述检查部件进一步可操作用于确定所述处理器的时钟频率是否处于预定频率,并且其中所述调整部件进一步可操作用于响应于确定所述时钟频率未处于所述预定频率,改变所述时钟频率。

10.
  如前述权利要求的任一所述的计算机系统,其中所述测试部件进一步可操作用于:
运行一个或多个诊断测试;以及
基于所述一个或多个诊断测试,确定所述处理器是否处于可接受的运行水平。

11.
  一种促进计算环境中的处理的方法,所述方法包括:
通过所述计算环境的硬件控制器检查处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数;
基于所述检查确定要调整至少一个运行参数,调整所述至少一个运行参数,其中在所述计算环境的其他处理器保持运行的产生工作负载的执行期间,实时执行所述调整;以及
基于所述调整,发起所述处理器的测试以用至少一个调整的运行参数确定所述处理器是否运行在可接受的运行水平,其中基于指示所述处理器运行在可接受的运行水平的测试,所述处理器可用于执行工作负载。

12.
  如权利要求11所述的方法,其中所述检查包括确定所述处理器的提供电压是否处于预定电压,并且其中基于确定所述提供电压未处于所述预定电压,所述调整包括改变到所述处理器的电压。

13.
  如权利要求12所述的方法,其中所述检查进一步包括基于所述提供电压处于所述预定电压,确定所述处理器的时钟频率是否处于预定频率,并且其中基于确定所述时钟频率未处于所述预定频率,所述调整包括改变所述时钟频率。

14.
  如权利要求12所述的方法,其中所述检查进一步包括基于在改变电压之后确定所述处理器的运行水平处于不可接受的水平,确定时钟频率是否处于预定频率,并且其中基于确定所述时钟频率未处于所述预定频率,所述调整包括改变所述时钟频率。

15.
  如权利要求11到14的任一所述的方法,其中所述检查包括确定所述处理器的时钟频率是否处于预定频率,并且其中所述调整包括基于确定所述时钟频率未处于所述预定频率,改变所述时钟频率。

16.
  如权利要求11到15的任一所述的方法,还包括获得所述处理器处于不可接受的运行水平的指示,并且其中所述检查基于所述处理器处于不可接受的运行水平的指示。

17.
  如权利要求11到16的任一所述的方法,其中以预定时间间隔执行所述检查。

18.
  一种用于促进计算环境中的处理的计算机程序产品,所述计算机程序产品包括:可由处理电路读取的计算机可读存储介质,并且存储用于由所述处理电路执行的指令,用于执行如权利要求11到17的任一所述的方法。

19.
  一种存储在计算机可读存储介质上并且可载入数字计算机的内部存储器的计算机程序,包括软件代码部分,当所述程序在计算机上运行时,用于执行权利要求11到17的任一所述的方法。

说明书

原位处理器重新表征
技术领域
本发明的一个或多个方面一般地涉及计算环境中的处理器,并且具体地涉及重新表征计算环境的处理器。
背景技术
典型地,从多个处理元件(在此称为处理器)构造高可靠的计算机系统,多个处理元件中的一些可以是在处理故障的情况下要使用的不活动的备件。
处于不活动状态的故障处理器常常保持在该状态,直到它们物理地被其他处理器替代。如果太多处理器由于故障而变得不活动,并且没有被替代,那么系统可能用完备件,导致系统性能的劣化或者系统能力降低。
因此,本领域需要解决上述问题。
发明内容
通过提供用于促进计算环境中的处理的计算机系统,克服了现有技术的缺点并且提供了额外的优点。所述计算机系统包括存储器和与所述存储器通信的处理器,并且所述计算机系统配置为执行一种方法。所述方法例如包括检查处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数;基于所述检查确定要调整至少一个运行参数,调整所述至少一个运行参数,其中在所述计算环境的其他处理器保持运行的产生工作负载的执行期间,实时执行所述调整;以及基于所述调整,发起所述处理器的测试以用至少一个调整的运行参数确定所述处理器是否运行在可接受的运行水平,其中基于指示所述处理器运行在可接受的运行水平的测试,所述处理器可用于执行工作负载。
在此还描述和要求保护与本发明的一个或多个方面相关的方法和计算机程序产品。此外,在此还描述并且可能要求保护与本发明的一个或多个方面相关的服务。
通过本发明的一个或多个方面的技术实现额外的特征和优点。在此详细 描述本发明的其他实施例和方面,并且视为要求保护的发明的一部分。
从第一方面看,本发明提供一种用于促进计算环境中的处理的计算机系统,所述计算机系统包括:存储器;与所述存储器通信的处理器;检查部件,用于检查处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数;调整部件,响应于确定要调整至少一个运行参数,用于调整所述至少一个运行参数,其中在所述计算环境的其他处理器保持运行的产生工作负载的执行期间,实时执行调整;以及发起部件,响应于所述调整,用于发起所述处理器的测试以用至少一个调整的运行参数确定所述处理器是否运行在可接受的运行水平,其中基于指示所述处理器运行在可接受的运行水平的测试,所述处理器可用于执行工作负载。
从进一步的方面看,本发明提供一种用于促进计算环境中的处理的计算机系统,所述计算机系统包括:存储器;与所述存储器通信的处理器,其中所述计算机系统配置为执行一种方法,所述方法包括:检查处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数;基于所述检查确定要调整至少一个运行参数,调整所述至少一个运行参数,其中在所述计算环境的其他处理器保持运行的产生工作负载的执行期间,实时执行所述调整;以及基于所述调整,发起所述处理器的测试以用至少一个调整的运行参数确定所述处理器是否运行在可接受的运行水平,其中基于指示所述处理器运行在可接受的运行水平的测试,所述处理器可用于执行工作负载。
从进一步的方面看,本发明提供一种促进计算环境中的处理的方法,所述方法包括:通过所述计算环境的硬件控制器检查处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数;基于所述检查确定要调整至少一个运行参数,调整所述至少一个运行参数,其中在所述计算环境的其他处理器保持运行的产生工作负载的执行期间,实时执行所述调整;以及基于所述调整,发起所述处理器的测试以用至少一个调整的运行参数确定所述处理器是否运行在可接受的运行水平,其中基于指示所述处理器运行在可接受的运行水平的测试,所述处理器可用于执行工作负载。
从进一步的方面看,本发明提供一种用于促进计算环境中的处理的计算机程序产品,所述计算机程序产品包括:可由处理电路读取的计算机可读存 储介质,并且存储用于由所述处理电路执行的指令,所述指令用于执行本发明的步骤。
从进一步的方面看,本发明提供一种存储在计算机可读存储介质上并且可载入数字计算机的内部存储器的计算机程序,包括软件代码部分,当所述程序在计算机上运行时,用于执行本发明的步骤。
附图说明
现在将仅通过示例的方式,参照如在以下附图中图示的优选实施例,描述本发明:
图1A根据现有技术,描绘并入并且使用本发明的一个或多个方面的计算环境的一个实施例,并且其中可以实施本发明的优选实施例;
图1B根据现有技术,描绘根据本发明的一个方面的图1A的中央处理器的进一步细节,并且其中可以实施本发明的优选实施例;
图2根据本发明的优选实施例,描绘根据本发明的一个方面的用于重新表征运行在不可接受水平的处理器的逻辑的一个实施例;以及
图3根据现有技术,描绘并入并且本发明的一个或多个方面的计算程序产品的一个实施例,并且其中可以实施本发明的优选实施例。
具体实施方式
根据本发明的一个方面,提供通过在处理器上运行重新表征处理(例如,电气表征处理),以确定将允许处理器在可接受运行水平执行(例如,没有重新出现错误)的一组运行参数,重新激活运行在不可接受水平的不活动处理器的能力。执行重新表征处理,而不使处理器或计算机系统掉电。在一个实施例中,在生产环境(例如,非测试环境)中执行重新表征处理。在其中其他处理器保持运行的情况下,实时地执行重新表征处理的一个或多个方面。在进一步的实施例中,对活动处理器执行重新表征处理,以便例如改进系统性能,或者对备件处理器执行重新表征处理以检查它们的健康度。
参照图1A描述并入并且使用本发明的一个或多个方面的计算环境的一个实施例。计算环境100基于例如由国际商业机器公司(纽约阿蒙克市)提供的在题为“z/Architecture–Principles of Operation”的IBM公开(公开第SA22-7832-08号,第九版,2010年8月)中描述了在一个示例中,基于的计算环境包括由国际商业机器公司(纽约阿蒙克市)提供的IBM、z/Architecture、Systemz、z/OS和处理器资源/系统管理器是在许多全球司法管辖区中注册的国际商业机器公司的商标。
作为一个示例,计算环境100包括耦合到输入/输出(I/O)子系统120的中央处理器复合体(CPC)102。中央处理器复合体102包括例如一个或多个分区104(例如,逻辑分区LP1-LPn)、一个或多个中央处理器106、管理程序108(例如,逻辑分区管理器)和系统控制器110,下面描述其中的每一个。
每个逻辑分区104能够用作分离的系统。也就是说,如果需要的话,每个逻辑分区能够独立地重置、初始地加载操作系统,并且运行不同程序。在逻辑分区中运行的操作系统或应用程序似乎具有对于整个和完全系统的访问,但是实际上,仅仅它自己的部分是可用的。硬件和固件的组合保持逻辑分区中的程序不干扰不同逻辑分区中的程序。这允许若干不同逻辑分区以时间片方式在单个处理器或多个物理处理器上运行。
如在此使用的,固件包括例如处理器的微代码、毫代码和/或宏代码。它包括例如硬件级指令和/或在更高级机器代码的实施中使用的数据结构。在一个实施例中,它包括例如通常作为微代码递送的专有代码,该微代码包括特定针对基础硬件的受信任软件或微代码且控制操作系统对系统硬件的访问。
在该特定示例中,每个逻辑分区具有驻留操作系统112,其可以对于一个或多个逻辑分区不同。在一个实施例中,操作系统是操作系统。此外,在该示例中,每个逻辑分区具有为其指派(assign)的一部分系统主存储(存储器),其称为区段(zone)。
逻辑分区104包括一个或多个逻辑处理器。每个逻辑处理器可以具有永久地分配给它的中央处理器106,或者可能存在中央处理器106池,可用于可能跨越多个逻辑分区104的逻辑处理器的任何分组的动态分配。
逻辑分区104由例如通过运行在处理器106上的固件实施的管理程序108管理。逻辑分区104和管理程序108每个包括驻留在与中央处理器相关联的主存储的各个分区中的一个或多个程序。管理程序108的一个示例是IBM处理器资源/系统管理器TM(PR/SM)。
中央处理器106耦合到系统控制器110,但是与系统控制器110分离。 系统控制器110是例如控制对于存储器和中央处理器中的高速缓冲存储器的访问并且在中央处理器与输入/输出子系统120之间通信的硬件组件。系统控制器负责由中央处理器和I/O子系统120作出的请求的列队、串行化和执行。在一个示例中,其负责发送命令到特定中央处理器和/或将命令广播到多个中央处理器。系统控制器可以是中心化组件,或者其功能可以分布。系统控制器不是处理器或核心;例如,它不能执行用户应用。替代地,它是I/O子系统和中央处理器之间的通信机制。
参照图1B描述关于中央处理器106的进一步细节。在一个示例中,中央处理器106包括一个或多个核心或处理器150,其是分配给一个或多个逻辑分区的物理处理器。中央处理器被视为节点的一部分,并且每个节点包括一个或多个中央处理器。逻辑分区可以跨越节点,其中来自一个节点的一个或多个中央处理器以及来自另一节点的一个或多个中央处理器可以指派给该逻辑分区。
此外,根据本发明的一个方面,中央处理器106包括控制器160(例如,硬件控制器),其用于执行重新表征以便调整可以为不活动或活动的处理器的参数。不活动的处理器是当前没有接受要执行的工作负载的处理器。其可以是执行在不可接受水平的处理器,并且因此它的工作负载移动到另一处理器,但是它仍然上电;或者其可以是等待激活的备件处理器。活动的处理器是准备接收和执行工作负载和/或正在执行工作负载的处理器。
参照图2描述与重新表征相关联的逻辑的一个实施例。在一个示例中,除非另外指定,由控制器160(图1B)执行该逻辑。
参照图2,最初,在该示例中,确定特定处理器(例如,处理器A)具有重新出现的错误,步骤200。例如,每个处理器具有用于确定它是否正确地运行的自测逻辑。特别地,每个处理器包括用于确定是否已经出现错误的错误检查逻辑。如果错误已经出现,则处理器使用它的恢复逻辑恢复自身。其跟踪在预定时间量中必须恢复的次数,并且如果发现恢复太频繁(例如,必须恢复的次数超过阈值),那么其检测其具有重新出现的错误。
响应于确定处理器具有重新出现的错误,停止该处理器的工作负载运行,并且从系统隔离该处理器,步骤202。在一个实施例中,处理器向管理程序报告其具有重新出现的错误,并且响应于此,管理程序停止处理器上的任务,处理器在系统中被隔离,其中管理程序仍然知道该处理器,但是没有工作指 派给该处理器,并且该处理器不包括由另一处理器所需的任何信息。
此外,处理器的状态以及其工作负载从该处理器(例如,处理器A)卸载到备件处理器(例如,处理器B),步骤204。在一个示例中,处理器或另一组件发起卸载,其由管理程序或固件执行。卸载包括保存当前状态(包括架构的和内部状态)以及至少到工作负载的标识符或指针,并且将它们置于一个或多个其他处理器(例如,备件)。
此后,对于现场重新表征是否可用进行确定,询问206。也就是说,本发明的一个或多个方面的能力在该系统上是否可用。在一个示例中,这可以由指示重新表征是否可用的指示符(例如,共享存储器中的一位)确定。如果重新表征不可用,那么将该处理器标记为缺陷的,并且在一个示例中,该处理器掉电,步骤208,并且处理完成。
然而,如果现场重新表征可用,那么由控制器发起标准诊断测试(例如,阵列内建自测(ABIST)和逻辑内建自测(LBIST)),并且在该处理器上运行,步骤210。如所知的,阵列内建自测组件运行作为系统引导处理的一部分的内部诊断。ABIST测试每个处理器(作为可应用的)中的逻辑和阵列,并且如果需要则对于处理器执行阵列修复(位备份)。逻辑内建自测是由此集成电路测试其自身电路的完整性的手段。LBIST通过练习集成电路逻辑并且然后检测该逻辑是否如所预期的表现来运行。实际上,具有LBIST的集成电路测试用于生成刺激并且检测反应的专用嵌入测试电路。在一个示例中,作为LBIST测试的一部分,清除(flush)处理器的内部状态,并且重新初始化到已知的好状态。
响应于运行任何诊断测试,对于是否获取通过信号进行确定,询问212。这指示自我诊断测试是否被视为成功(例如,匹配的模式等)。如果由控制器获取并且接收通过信号,那么该处理器标记为可用的,步骤214。工作负载可以调度到该处理器,并且该处理器可以重新进入运行状态,步骤216。
然而,如果没有获取通过信号(级,诊断测试被视为不成功),那么在一个实施例中,调整处理器的一个或多个参数以便提高其性能(例如,减少错误)。作为示例,这些参数包括电压和/或时钟频率;然而,可以调整其他参数,诸如温度或其他。在一个示例中,对于到处理器的提供(运行)电压是否处于最大电压进行确定,询问220。最大电压基于该技术,并且是预定值。如果提供电压不处于最大电压,那么处理器的提供电压递增预定量,步骤222。 例如,提供或运行电压是电路运行的电压。在一个示例中,当前运行电压是0.95伏,并且增量是大约0.05V(大约5%)。
此后,由控制器发起ABIST和/或LBIST,并且再次在处理器上运行,步骤224。如果此时获取通过信号,询问226,那么处理以步骤214继续,并且将处理器标记为可用的。(在进一步的实施例中,除了调整电压外,还检查并且可以调整时钟频率,即使获取通过信号。此外,在另一实施例中,响应于确定调整运行参数,由处理器自身发起诊断测试。)
然而,如果仍然没有获取通过信号,询问226,那么对于处理器的时钟频率是否处于最小值进行确定,询问230。最小值也基于该技术并且是预定值。如果时钟信号没有处于最小值,那么将其减少预定量以放慢处理,步骤232。例如,高端企业级处理器(比如IBM z/Architecture处理器)的当前运行频率是5.2GHz,并且减小量是大约5%。
然后,ABIST和/或LBIST再一次运行,步骤234。响应于运行一个或多个ABIST和LBIST,对于是否获取通过信号进行确定,询问236。如果获取,那么将处理器标记为可用的,步骤214。然而,如果没有获取通过信号,或者如果时钟频率处于最小值,询问230,那么处理以询问220继续,并且处理重复。
返回到询问220,如果提供电压处于最大值,那么处理以检查时钟频率继续,询问240。如果时钟频率处于最小值,那么处理器仍处于不可接受的运行水平,所以其标记为缺陷的,并且在一个示例中,其掉电并且将不再次调整,步骤242。否则,处理以步骤232继续,其中减小时钟频率,并且执行其他处理。这完成重新表征处理的处理。
在进一步的示例中,除了或者替代电压和/或时钟频率,可以测试和调整其他运行参数。一个这样的参数是温度。然而,在温度的情况下,替代直接改变参数(例如,温度),调整是间接的,改变影响参数的一个或多个成分/条件,诸如影响温度的处理器的冷却技术、处理器邻近的空气温度或者风扇速度作为示例。然而,如同电压和时钟频率,在调整参数之后,再次运行诊断测试,并且测试通过信号。
如在此使用的,调整参数包括其中直接调整参数本身(如在电压和时钟频率的情况下,作为示例)的直接控制和/或其中替代直接调整参数调整影响参数的一个或多个成分/条件从而调整参数(诸如温度,作为示例)的间接控 制。
如上所述,在一个实施例中,当处理器检测到错误时,其典型地将自身恢复到已知的好状态。如果错误重新出现,那么状态转移到备件处理器,并且缺陷的处理器置为隔离状态。然后,系统中的控制器执行表征处理,其在运行一组诊断模式(例如,ABIST和LBIST)的同时,改变电属性(诸如提供电压和时钟频率)。执行测试,直到发现测试通过的运行点。响应于获取该点,该处理器返回在线,并且从工作负载管理器接收新的工作负载。
在进一步的实施例中,在处理器仍然活动的同时(例如,在其状态转移到其他处理器之前),其还可以经历该现场类型测试(例如,当空闲时)以便验证该处理器的健康度。此外,对备件处理器执行该处理,以便确定用于备件的最佳运行参数。在该系统中备件处理器的指派轮转的情况下,可以对所有安装的处理器执行现场健康检查。在一个示例中,对备件或空闲处理器以预定时间间隔执行现场测试,以检查安装的处理器的健康度(例如,运行质量)。
在一个方面中,执行重新表征而不要求指令恢复/重试控制器。作为一个示例,检测缺陷的活动处理器,并且无破坏地从活动状态移除为非活动状态。在处于非活动状态的同时,练习处理器以确定是否存在可操作状态(例如,电压电平、频率、温度),并且如果存在,则使得处理器可用于在新的可操作状态下重新激活。也就是说,替代将处理器标记为缺陷的并且不再次使用,将其运行参数调整为其中抢救处理器并且不视为缺陷的水平,即使可能处于劣化的水平。通过抢救处理器,该环境较不可能用完备件。
作为一个示例,在计算环境的其他处理器可操作的同时,实时执行该重新表征处理。不存在对于由计算环境提供的服务的破坏,并且对于该环境的其他处理器透明。
可不接受的运行水平可以是处理器具有重新出现的错误的水平、处理器未通过诊断测试的水平和/或预定义为不可接受的任何水平。例如,活动的处理器可能未接收重新出现的错误,但是作为示例如果它不满足特定性能特性或其运行在不希望的电压或时钟频率(或其他运行参数),则可以被视为运行在不可接受的水平。类似地,由于类似的理由以及其他,备件处理器可能被视为处于不可接受的运行水平。不可接受的运行水平可以对于每个处理器预定义。
此外,在一个示例中,如果其没有重新出现的错误和/或通过对其执行的诊断测试,则处理器运行在不可接受的运行水平。在进一步的示例中,如果其满足特定性能要求或特性或者运行在特性的希望运行参数,则其运行在可接受的水平。
如本领域的技术人员将了解,本发明的一个或多个方面可体现为系统、方法或计算机程序产品。因此,本发明的一个或多个方面可呈完全硬件实施例、完全软件实施例(包括固件、常驻软件、微代码等)或组合软件与硬件方面的实施例的形式,这些实施例在本文中通常都可被称为“电路”、“模块”或“系统”。此外,本发明的一个或多个方面可呈体现于具有体现于其上的计算机可读代码的一个或多个计算机可读介质中的计算机程序产品的形式。
可利用一个或多个计算机可读介质的任何组合。计算机可读介质可为计算机可读存储介质。举例而言,计算机可读存储介质可为(但不限于)电子、磁、光学、电磁、红外线或半导体系统、装置或设备或前述各者的任何合适组合。计算机可读存储介质的更特定示例(非详尽清单)包括以下各者:具有一个或多个电线的电连接、携带型计算机磁片、硬碟、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或高速缓冲存储器)、光纤、携带型致密盘-只读存储器(CD-ROM)、光学存储设备、磁性存储设备或前述各者的任何合适组合。在此文件的情况下,计算机可读存储介质可为可含有或存储供指令执行系统、装置或设备使用或结合指令执行系统、装置或设备而使用的程序的任何有形介质。
现参看图3,在一个示例中,计算机程序产品300包括例如一个或多个非暂时性计算机可读存储介质302,以在其上存储计算机可读代码构件或逻辑304以提供并且有助于本发明的一个或多个方面。
可使用适当介质(包括但不限于无线、有线、光纤缆线、RF等或前述各者的任何合适组合)传输体现于计算机可读介质上的程序代码。
可用一个或多个程序设计语言的任何组合来撰写用于进行本发明的一个或多个方面的操作的计算机代码,该一个或多个程序设计语言包括诸如Java、Smalltalk、C++或类似者的物件导向式程序设计语言及诸如“C”程序设计语言、组译程序或类似程序设计语言的习知程序性程序设计语言。代码可整体地在用户的计算机上执行、部分地在用户的计算机上执行、作为一独立套装软件而执行、部分地在用户的计算机上且部分地在一远程计算机上执行或整 体地在该远程计算机或服务器上执行。在后者情形下,远程计算机可经由任何类型的网络(包括区域网络(LAN)或广域网络(WAN))连接至用户的计算机,或可进行至外部计算机的连接(例如,经由使用因特网服务提供者的因特网)。
本文中参照根据本发明的实施例的方法、装置(系统)及计算机程序产品的流程图说明和/或方块图描述本发明的一个或多个方面。应理解,可由计算机程序指令来实施流程图说明和/或方块图的每一区块及这些流程图说明和/或方块图中的区块的组合。可将这些计算机程序指令提供至通用计算机、专用计算机或其他可编程数据处理装置的处理器以产生机器,以使得经由该计算机或其他可编程数据处理装置的处理器执行的指令创建用于实施该或这些流程图和/或方块图区块中所指定的功能/动作的构件。
这些计算机程序指令也可存储在计算机可读介质中,其可指导计算机、其他可编程数据处理装置或其他设备以特定方式起作用,使得存储在该计算机可读介质中的指令产生一制品,该制品包括实施该或这些流程图和/或方块图方块中所指定的功能/动作的指令。
这些计算机程序指令也可载入至计算机、其他可编程数据处理装置或其他设备上以使一系列操作步骤在该计算机、其他可编程装置或其他设备上执行以产生计算机实施的程序,使得在该计算机或其他可编程装置上执行的指令提供用于实施该或这些流程图和/或方块图区块中所指定的功能/动作的程序。
这些图中的流程图及方块图说明根据本发明的一个或多个方面的各种实施例的系统、方法及计算机程序产品的可能实施的架构、功能性及操作。在此方面,流程图或方块图中的每一区块可表示模块、区段或代码的部分,其包含用于实施指定逻辑功能的一个或多个可执行指令。还应注意,在一些替代实施中,在区块中提到的功能可能不按图中所提到的顺序而发生。举例而言,实际上可实质上同时执行连续展示的两个区块,或有时可取决于所涉及饿功能性以相反顺序执行这些区块。还应注意,方块图和/或流程图说明的每一区块及方块图和/或流程图说明中的区块的组合可由执行指定功能或动作的基于专用硬件的系统或专用硬件与计算机指令的组合来实施。
除上之外,本发明的一个或多个方面可由提出客户环境的管理的服务提供者提供、提出、部署、管理、服务等。举例而言,服务提供者可为一个或 多个客户创建、维持、支持等执行本发明的一个或多个方面的计算机代码和/或计算机基础结构。作为回报,作为示例,服务提供者可在订用和/或收费协议下从客户收取付款。另外或替代地,服务提供者可从广告内容销售至一个或多个第三方而收取付款。
在本发明的一个方面中,可部署一种用于执行本发明的一个或多个方面的应用程序。作为一个示例,应用程序的部署包含提供可操作以执行本发明的一个或多个方面的计算机基础结构。
作为本发明的又一个方面,可部署计算基础结构,其包含将计算机可读代码整合至计算系统内,其中与该计算系统组合的代码能够执行本发明的一个或多个方面。
作为本发明的又一个方面,可提供一种用于整合计算基础结构的程序,其包含将计算机可读代码整合至计算机系统内。计算机系统包含计算机可读介质,其中计算机介质包含本发明的一个或多个方面。与该计算机系统组合的代码能够执行本发明的一个或多个方面。
虽然以上描述了各种实施例,但这些实施例仅为示例。例如,其他架构的计算环境可以并入和使用本发明的一个或多个方面。此外,中央处理器可以包括更多或更少在此描述的处理器。另外,处理器不需要是中央处理器的一部分。此外,除了和/或替代电压和/或时钟频率,可以调整其他运行参数以改进处理器的健康度和/或为了其他原因。此外,在一个示例中,当处理器标记为缺陷的时,其不需要掉电。还可以进行许多其他改变。
而且,其他类型的计算环境可受益于本发明的一个或多个方面。作为例子,环境可包括仿真器(例如,软件或其他仿真机制),其中特定架构(包括例如指令执行、诸如地址转换的架构功能、以及架构寄存器)或其子集被仿真(例如,在具有处理器和存储器的本机计算机系统中)。在这样的环境中,仿真器的一个或多个仿真功能可实施本发明的一个或多个方面,即使执行仿真器的计算机可具有与正被仿真的能力不同的架构。作为一个例子,在仿真模式中,解码正被仿真的特定指令或操作,且建立合适的仿真功能以实施单个指令或操作。
在仿真环境中,主计算机包括例如存储器以存储指令和数据;指令获取单元以从存储器获取指令,且可选地,提供用于获取的指令的本地缓冲;指令解码单元以接收获取的指令并确定已被获取的指令的类型;以及指令执行 单元以执行该指令。执行可包括将数据从存储器加载到寄存器;从寄存器将数据存储回存储器;或执行如由解码单元确定的某些类型的算术或逻辑运算。在一个例子中,每个单元在软件中实现。例如,被所述单元执行的操作被实现为仿真器软件中的一个或多个子例程。
输入/输出或I/O设备(包括但不限于键盘、显示器、指标设备、DASD、磁带、CD、DVD、随身碟及其他存储器介质等)可直接或经由介入的I/O控制器而耦接至系统。网络适配器也可耦接至系统以使数据处理系统能够经由介入私用或公用网络而变得耦接至其他数据处理系统或远程打印机或存储设备。调制解调器、电缆调制解调器及乙太网卡仅为可用类型网络适配器中的少数几种。
在此使用的术语仅是为了描述特定实施例,且不旨在限制本发明。如在此使用的,单数形式“一”、“一个”和“该”也旨在包括复数形式,除非上下文另外清楚地指明。还将理解,当在说明书中使用时,术语“包括”和/或“包含”指明存在所述的特征、整体、步骤、操作、元件和/或组件,但不排除存在或附加一个或多个其他特征、整体、步骤、操作、元件和/或组件。
所附权利要求书中的所有装置或步骤加功能元件的相应结构、材料、操作以及等价物,如有的话,旨在包括用于结合如特别要求保护的其他所要求保护的元件来执行所述功能的任何结构、材料或操作。呈现本发明的说明是为了示出和描述的作用,但不是穷尽性的或将本发明限制于所公开的形式。许多修改和变化对本领域普通技术人员来说是明显的,且不脱离本发明的范围和精神。选择和描述实施例是为了最佳地解释本发明的原理和实际应用,并使得本领域普通技术人员能针对适于考虑的特定用途的具有各种修改的各种实施例理解本发明。
权利要求书(按照条约第19条的修改)
1.一种用于促进计算环境中的处理的计算机系统,其中所述计算环境包括一组处理器,所述计算机系统包括:
存储器;
与所述存储器通信的处理器;
检查部件,用于检查该组处理器中的第一处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数,所述一个或多个运行参数包括电压、时钟频率和温度的至少一个;
调整部件,响应于确定要调整至少一个运行参数,用于调整所述至少一个运行参数,其中实时执行调整,其中实时调整包括在通过所述计算环境的其他处理器的产生工作负载的执行期间,所述第一处理器不掉电并且所述其他处理器保持运行;以及
测试部件,响应于所述调整,用于测试所述第一处理器,所述测试包括执行一个或多个诊断测试,以确定所述第一处理器在至少一个调整的运行参数的情况下是否运行在其中从所述一个或多个诊断测试获取通过信号的运行点,并且其中基于所述测试指示所述第一处理器运行在其中从所述一个或多个诊断测试获取通过信号的运行点,所述第一处理器可用于执行工作负载,并且其中基于所述测试指示所述第一处理器没有运行在其中从所述一个或多个诊断测试获取通过信号的运行点,重复所述检查、调整和测试一次或多次,其中在重复一次或多次并且所述测试指示所述第一处理器没有运行在其中从所述一个或多个诊断测试获取通过信号的运行点之后,使所述第一处理器掉电。
2.如权利要求1所述的计算机系统,还包括获得部件,用于获得所述第一处理器处于不可接受的运行水平的指示,其中不可接受的运行水平是其中特定处理器具有重新出现的错误、不满足确定性能特性或者运行在不希望的运行参数的水平,并且其中所述检查部件进一步可操作用于基于所述第一处理器处于不可接受的运行水平的指示的检查。
3.如权利要求2所述的计算机系统,其中不可接受的运行水平是其中特定处理器具有重新出现的错误的水平,并且其中所述获得部件进一步可操作用于基于所述第一处理器具有重新出现的错误并且在从所述第一处理器卸载状态之后,执行一个或多个诊断测试,并且用于基于执行所述第一或多个诊断测试,接收失败信号。
4.如权利要求1所述的计算机系统,其中所述检查部件进一步可操作用于以预定时间间隔检查。
5.如权利要求1到4的任一所述的计算机系统,其中所述检查部件进一步可操作用于确定所述第一处理器的提供电压是否处于预定电压,并且其中所述调整部件进一步可操作用于基于确定所述提供电压未处于所述预定电压,改变到所述第一处理器的电压。
6.如权利要求5所述的计算机系统,其中所述检查部件进一步可操作用于基于所述提供电压处于所述预定电压,确定所述第一处理器的时钟频率是否处于预定频率,并且其中所述调整部件进一步可操作用于基于确定所述时钟频率未处于所述预定频率,改变所述时钟频率。
7.如权利要求5所述的计算机系统,其中所述检查部件进一步可操作用于响应于在改变电压之后确定所述第一处理器的运行水平处于不可接受的水平,确定时钟频率是否处于预定频率,并且其中所述调整部件进一步可操作用于基于确定所述时钟频率未处于所述预定频率,改变所述时钟频率。
8.如前述权利要求的任一所述的计算机系统,其中所述检查部件进一步可操作用于确定所述第一处理器的时钟频率是否处于预定频率,并且其中所述调整部件进一步可操作用于响应于确定所述时钟频率未处于所述预定频率,改变所述时钟频率。
9.如前述权利要求的任一所述的计算机系统,其中所述测试部件进一步可操作用于:
运行一个或多个诊断测试;以及
基于所述一个或多个诊断测试,确定所述第一处理器是否处于可接受的运行水平。
10.如前述权利要求的任一所述的计算机系统,其中所述第一处理器配置为具有自测逻辑和恢复逻辑,以从由所述自测逻辑检测到的错误自我恢复,并且其中所述系统进一步包括:
获得部件,用于获得使用所述恢复逻辑确定的特定处理器具有重新出现的错误的指示;以及初始测试部件,用于初始地测试特定处理器,初始地测试包括在特定处理器上运行一个或多个初始标准诊断测试,并且确定对于初始测试未获取通过信号,并且其中基于对于初始测试未获取通过信号执行所述检查。
11.如权利要求10所述的计算机系统,其中所述系统进一步包括可用性部件,用于确定对于特定处理器的重新表征是否可用,所述确定基于获得特定处理器具有重新出现的错误的指示。
12.一种促进计算环境中的处理的方法,其中所述计算环境包括一组处理器,所述方法包括:
通过所述计算环境的硬件控制器检查该组处理器中的第一处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数,所述一个或多个运行参数包括电压、时钟频率和温度的至少一个;
响应于确定要调整至少一个运行参数,调整所述至少一个运行参数,其中实时执行调整,其中实时调整包括在通过所述计算环境的其他处理器的产生工作负载的执行期间,所述第一处理器不掉电并且所述其他处理器保持运行;以及
响应于所述调整,测试所述第一处理器,所述测试包括执行一个或多个诊断测试,以确定所述第一处理器在至少一个调整的运行参数的情况下是否运行在其中从所述一个或多个诊断测试获取通过信号的运行点,并且其中基于所述测试指示所述第一处理器运行在其中从所述一个或多个诊断测试获取通过信号的运行点,所述第一处理器可用于执行工作负载,并且其中基于所述测试指示所述第一处理器没有运行在其中从所述一个或多个诊断测试获取通过信号的运行点,重复所述检查、调整和测试一次或多次,其中在重复一次或多次并且所述测试指示所述第一处理器没有运行在其中从所述一个或多个诊断测试获取通过信号的运行点之后,使所述第一处理器掉电。
13.如权利要求12所述的方法,其中所述检查包括确定所述处理器的提供电压是否处于预定电压,并且其中基于确定所述提供电压未处于所述预定电压,所述调整包括改变到所述处理器的电压。
14.如权利要求13所述的方法,其中所述检查进一步包括基于所述提供电压处于所述预定电压,确定所述处理器的时钟频率是否处于预定频率,并且其中基于确定所述时钟频率未处于所述预定频率,所述调整包括改变所述时钟频率。
15.如权利要求13所述的方法,其中所述检查进一步包括基于在改变电压之后确定所述处理器的运行水平处于不可接受的水平,确定时钟频率是否处于预定频率,并且其中基于确定所述时钟频率未处于所述预定频率,所述调整包括改变所述时钟频率。
16.如权利要求11到15的任一所述的方法,其中所述检查包括确定所述处理器的时钟频率是否处于预定频率,并且其中所述调整包括基于确定所述时钟频率未处于所述预定频率,改变所述时钟频率。
17.如权利要求11到16的任一所述的方法,还包括获得所述处理器处于不可接受的运行水平的指示,并且其中所述检查基于所述处理器处于不可接受的运行水平的指示。
18.如权利要求11到17的任一所述的方法,其中以预定时间间隔执行所述检查。
19.如权利要求12到18的任一所述的方法,还包括:
配置所述第一处理器具有自测逻辑和恢复逻辑,以从由所述自测逻辑检测到的错误自我恢复;
使用所述恢复逻辑确定的特定处理器具有重新出现的错误的指示;以及
测试所述第一处理器,测试包括在特定处理器上运行一个或多个初始标准诊断测试,并且确定对于初始测试未获取通过信号,并且其中基于对于初始测试未获取通过信号执行所述检查。
20.如权利要求19所述的计算机系统,进一步包括确定对于特定处理器的重新表征是否可用,所述确定基于获得特定处理器具有重新出现的错误的指示。
21.一种用于促进计算环境中的处理的计算机程序产品,所述计算机程序产品包括:可由处理电路读取的计算机可读存储介质,并且存储用于由所述处理电路执行的指令,用于执行如权利要求12到20的任一所述的方法。
22.一种存储在计算机可读存储介质上并且可载入数字计算机的内部存储器的计算机程序,包括软件代码部分,当所述程序在计算机上运行时,用于执行权利要求12到20的任一所述的方法。

原位处理器重新表征.pdf_第1页
第1页 / 共18页
原位处理器重新表征.pdf_第2页
第2页 / 共18页
原位处理器重新表征.pdf_第3页
第3页 / 共18页
点击查看更多>>
资源描述

《原位处理器重新表征.pdf》由会员分享,可在线阅读,更多相关《原位处理器重新表征.pdf(18页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104067234A43申请公布日20140924CN104067234A21申请号201380006014822申请日2013011113/353,54420120119USG06F11/2420060171申请人国际商业机器公司地址美国纽约阿芒克72发明人CA克里戈夫斯基S卡洛BR普拉斯基FY布萨巴CLK舒姆74专利代理机构北京市柳沈律师事务所11105代理人张晓明54发明名称原位处理器重新表征57摘要提供了一种重新表征处理,其调整处理器的一个或多个运行参数以改进处理器的健康度例如,减少错误。作为示例,参数包括电压和/或时钟频率。处理器可以是不活动的或活动的处理器,对其执。

2、行重新表征处理。在一个示例中,通过硬件控制器实时执行。30优先权数据85PCT国际申请进入国家阶段日2014071886PCT国际申请的申请数据PCT/EP2013/0504592013011187PCT国际申请的公布数据WO2013/107694EN2013072551INTCL权利要求书2页说明书9页附图3页按照条约第19条修改的权利要求书3页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书9页附图3页按照条约第19条修改的权利要求书3页10申请公布号CN104067234ACN104067234A1/2页21一种用于促进计算环境中的处理的计算机系统,所述计算机系统包括。

3、存储器;与所述存储器通信的处理器;检查部件,用于检查处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数;调整部件,响应于确定要调整至少一个运行参数,用于调整所述至少一个运行参数,其中在所述计算环境的其他处理器保持运行的产生工作负载的执行期间,实时执行调整;以及发起部件,响应于所述调整,用于发起所述处理器的测试以用至少一个调整的运行参数确定所述处理器是否运行在可接受的运行水平,其中基于指示所述处理器运行在可接受的运行水平的测试,所述处理器可用于执行工作负载。2如权利要求1所述的计算机系统,其中所述一个或多个运行参数包括电压、时钟频率和温度的至少一个。3如权利要求。

4、1或2的任一所述的计算机系统,还包括获得部件,用于获得所述处理器处于不可接受的运行水平的指示,并且其中所述检查部件进一步可操作用于基于所述处理器处于不可接受的运行水平的指示检查。4如权利要求3所述的计算机系统,其中所述获得部件进一步可操作用于基于所述处理器具有重新出现的错误并且在从所述处理器卸载状态之后,执行一个或多个诊断测试,并且用于接收指示所述处理器处于不可接受的运行水平的故障信号。5如权利要求1所述的计算机系统,其中所述检查部件进一步可操作用于以预定时间间隔检查。6如权利要求1到5的任一所述的计算机系统,其中所述检查部件进一步可操作用于确定所述处理器的提供电压是否处于预定电压,并且其中所。

5、述调整部件进一步可操作用于基于确定所述提供电压未处于所述预定电压,改变到所述处理器的电压。7如权利要求6所述的计算机系统,其中所述检查部件进一步可操作用于基于所述提供电压处于所述预定电压,确定所述处理器的时钟频率是否处于预定频率,并且其中所述调整部件进一步可操作用于基于确定所述时钟频率未处于所述预定频率,改变所述时钟频率。8如权利要求6所述的计算机系统,其中所述检查部件进一步可操作用于响应于在改变电压之后确定所述处理器的运行水平处于不可接受的水平,确定时钟频率是否处于预定频率,并且其中所述调整部件进一步可操作用于基于确定所述时钟频率未处于所述预定频率,改变所述时钟频率。9如前述权利要求的任一所。

6、述的计算机系统,其中所述检查部件进一步可操作用于确定所述处理器的时钟频率是否处于预定频率,并且其中所述调整部件进一步可操作用于响应于确定所述时钟频率未处于所述预定频率,改变所述时钟频率。10如前述权利要求的任一所述的计算机系统,其中所述测试部件进一步可操作用于运行一个或多个诊断测试;以及基于所述一个或多个诊断测试,确定所述处理器是否处于可接受的运行水平。权利要求书CN104067234A2/2页311一种促进计算环境中的处理的方法,所述方法包括通过所述计算环境的硬件控制器检查处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数;基于所述检查确定要调整至少一个运行。

7、参数,调整所述至少一个运行参数,其中在所述计算环境的其他处理器保持运行的产生工作负载的执行期间,实时执行所述调整;以及基于所述调整,发起所述处理器的测试以用至少一个调整的运行参数确定所述处理器是否运行在可接受的运行水平,其中基于指示所述处理器运行在可接受的运行水平的测试,所述处理器可用于执行工作负载。12如权利要求11所述的方法,其中所述检查包括确定所述处理器的提供电压是否处于预定电压,并且其中基于确定所述提供电压未处于所述预定电压,所述调整包括改变到所述处理器的电压。13如权利要求12所述的方法,其中所述检查进一步包括基于所述提供电压处于所述预定电压,确定所述处理器的时钟频率是否处于预定频率。

8、,并且其中基于确定所述时钟频率未处于所述预定频率,所述调整包括改变所述时钟频率。14如权利要求12所述的方法,其中所述检查进一步包括基于在改变电压之后确定所述处理器的运行水平处于不可接受的水平,确定时钟频率是否处于预定频率,并且其中基于确定所述时钟频率未处于所述预定频率,所述调整包括改变所述时钟频率。15如权利要求11到14的任一所述的方法,其中所述检查包括确定所述处理器的时钟频率是否处于预定频率,并且其中所述调整包括基于确定所述时钟频率未处于所述预定频率,改变所述时钟频率。16如权利要求11到15的任一所述的方法,还包括获得所述处理器处于不可接受的运行水平的指示,并且其中所述检查基于所述处理。

9、器处于不可接受的运行水平的指示。17如权利要求11到16的任一所述的方法,其中以预定时间间隔执行所述检查。18一种用于促进计算环境中的处理的计算机程序产品,所述计算机程序产品包括可由处理电路读取的计算机可读存储介质,并且存储用于由所述处理电路执行的指令,用于执行如权利要求11到17的任一所述的方法。19一种存储在计算机可读存储介质上并且可载入数字计算机的内部存储器的计算机程序,包括软件代码部分,当所述程序在计算机上运行时,用于执行权利要求11到17的任一所述的方法。权利要求书CN104067234A1/9页4原位处理器重新表征技术领域0001本发明的一个或多个方面一般地涉及计算环境中的处理器,。

10、并且具体地涉及重新表征计算环境的处理器。背景技术0002典型地,从多个处理元件在此称为处理器构造高可靠的计算机系统,多个处理元件中的一些可以是在处理故障的情况下要使用的不活动的备件。0003处于不活动状态的故障处理器常常保持在该状态,直到它们物理地被其他处理器替代。如果太多处理器由于故障而变得不活动,并且没有被替代,那么系统可能用完备件,导致系统性能的劣化或者系统能力降低。0004因此,本领域需要解决上述问题。发明内容0005通过提供用于促进计算环境中的处理的计算机系统,克服了现有技术的缺点并且提供了额外的优点。所述计算机系统包括存储器和与所述存储器通信的处理器,并且所述计算机系统配置为执行一。

11、种方法。所述方法例如包括检查处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数;基于所述检查确定要调整至少一个运行参数,调整所述至少一个运行参数,其中在所述计算环境的其他处理器保持运行的产生工作负载的执行期间,实时执行所述调整;以及基于所述调整,发起所述处理器的测试以用至少一个调整的运行参数确定所述处理器是否运行在可接受的运行水平,其中基于指示所述处理器运行在可接受的运行水平的测试,所述处理器可用于执行工作负载。0006在此还描述和要求保护与本发明的一个或多个方面相关的方法和计算机程序产品。此外,在此还描述并且可能要求保护与本发明的一个或多个方面相关的服务。0。

12、007通过本发明的一个或多个方面的技术实现额外的特征和优点。在此详细描述本发明的其他实施例和方面,并且视为要求保护的发明的一部分。0008从第一方面看,本发明提供一种用于促进计算环境中的处理的计算机系统,所述计算机系统包括存储器;与所述存储器通信的处理器;检查部件,用于检查处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数;调整部件,响应于确定要调整至少一个运行参数,用于调整所述至少一个运行参数,其中在所述计算环境的其他处理器保持运行的产生工作负载的执行期间,实时执行调整;以及发起部件,响应于所述调整,用于发起所述处理器的测试以用至少一个调整的运行参数确定所述。

13、处理器是否运行在可接受的运行水平,其中基于指示所述处理器运行在可接受的运行水平的测试,所述处理器可用于执行工作负载。0009从进一步的方面看,本发明提供一种用于促进计算环境中的处理的计算机系统,所述计算机系统包括存储器;与所述存储器通信的处理器,其中所述计算机系统配置为说明书CN104067234A2/9页5执行一种方法,所述方法包括检查处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数;基于所述检查确定要调整至少一个运行参数,调整所述至少一个运行参数,其中在所述计算环境的其他处理器保持运行的产生工作负载的执行期间,实时执行所述调整;以及基于所述调整,发起所述。

14、处理器的测试以用至少一个调整的运行参数确定所述处理器是否运行在可接受的运行水平,其中基于指示所述处理器运行在可接受的运行水平的测试,所述处理器可用于执行工作负载。0010从进一步的方面看,本发明提供一种促进计算环境中的处理的方法,所述方法包括通过所述计算环境的硬件控制器检查处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数;基于所述检查确定要调整至少一个运行参数,调整所述至少一个运行参数,其中在所述计算环境的其他处理器保持运行的产生工作负载的执行期间,实时执行所述调整;以及基于所述调整,发起所述处理器的测试以用至少一个调整的运行参数确定所述处理器是否运行在可接。

15、受的运行水平,其中基于指示所述处理器运行在可接受的运行水平的测试,所述处理器可用于执行工作负载。0011从进一步的方面看,本发明提供一种用于促进计算环境中的处理的计算机程序产品,所述计算机程序产品包括可由处理电路读取的计算机可读存储介质,并且存储用于由所述处理电路执行的指令,所述指令用于执行本发明的步骤。0012从进一步的方面看,本发明提供一种存储在计算机可读存储介质上并且可载入数字计算机的内部存储器的计算机程序,包括软件代码部分,当所述程序在计算机上运行时,用于执行本发明的步骤。附图说明0013现在将仅通过示例的方式,参照如在以下附图中图示的优选实施例,描述本发明0014图1A根据现有技术,。

16、描绘并入并且使用本发明的一个或多个方面的计算环境的一个实施例,并且其中可以实施本发明的优选实施例;0015图1B根据现有技术,描绘根据本发明的一个方面的图1A的中央处理器的进一步细节,并且其中可以实施本发明的优选实施例;0016图2根据本发明的优选实施例,描绘根据本发明的一个方面的用于重新表征运行在不可接受水平的处理器的逻辑的一个实施例;以及0017图3根据现有技术,描绘并入并且本发明的一个或多个方面的计算程序产品的一个实施例,并且其中可以实施本发明的优选实施例。具体实施方式0018根据本发明的一个方面,提供通过在处理器上运行重新表征处理例如,电气表征处理,以确定将允许处理器在可接受运行水平执。

17、行例如,没有重新出现错误的一组运行参数,重新激活运行在不可接受水平的不活动处理器的能力。执行重新表征处理,而不使处理器或计算机系统掉电。在一个实施例中,在生产环境例如,非测试环境中执行重新表征处理。在其中其他处理器保持运行的情况下,实时地执行重新表征处理的一个或多个方面。在进一步的实施例中,对活动处理器执行重新表征处理,以便例如改进系统性能,说明书CN104067234A3/9页6或者对备件处理器执行重新表征处理以检查它们的健康度。0019参照图1A描述并入并且使用本发明的一个或多个方面的计算环境的一个实施例。计算环境100基于例如由国际商业机器公司纽约阿蒙克市提供的在题为“Z/ARCHITE。

18、CTUREPRINCIPLESOFOPERATION”的IBM公开公开第SA22783208号,第九版,2010年8月中描述了在一个示例中,基于的计算环境包括由国际商业机器公司纽约阿蒙克市提供的IBM、Z/ARCHITECTURE、SYSTEMZ、Z/OS和处理器资源/系统管理器是在许多全球司法管辖区中注册的国际商业机器公司的商标。0020作为一个示例,计算环境100包括耦合到输入/输出I/O子系统120的中央处理器复合体CPC102。中央处理器复合体102包括例如一个或多个分区104例如,逻辑分区LP1LPN、一个或多个中央处理器106、管理程序108例如,逻辑分区管理器和系统控制器110,。

19、下面描述其中的每一个。0021每个逻辑分区104能够用作分离的系统。也就是说,如果需要的话,每个逻辑分区能够独立地重置、初始地加载操作系统,并且运行不同程序。在逻辑分区中运行的操作系统或应用程序似乎具有对于整个和完全系统的访问,但是实际上,仅仅它自己的部分是可用的。硬件和固件的组合保持逻辑分区中的程序不干扰不同逻辑分区中的程序。这允许若干不同逻辑分区以时间片方式在单个处理器或多个物理处理器上运行。0022如在此使用的,固件包括例如处理器的微代码、毫代码和/或宏代码。它包括例如硬件级指令和/或在更高级机器代码的实施中使用的数据结构。在一个实施例中,它包括例如通常作为微代码递送的专有代码,该微代码。

20、包括特定针对基础硬件的受信任软件或微代码且控制操作系统对系统硬件的访问。0023在该特定示例中,每个逻辑分区具有驻留操作系统112,其可以对于一个或多个逻辑分区不同。在一个实施例中,操作系统是操作系统。此外,在该示例中,每个逻辑分区具有为其指派ASSIGN的一部分系统主存储存储器,其称为区段ZONE。0024逻辑分区104包括一个或多个逻辑处理器。每个逻辑处理器可以具有永久地分配给它的中央处理器106,或者可能存在中央处理器106池,可用于可能跨越多个逻辑分区104的逻辑处理器的任何分组的动态分配。0025逻辑分区104由例如通过运行在处理器106上的固件实施的管理程序108管理。逻辑分区10。

21、4和管理程序108每个包括驻留在与中央处理器相关联的主存储的各个分区中的一个或多个程序。管理程序108的一个示例是IBM处理器资源/系统管理器TMPR/SM。0026中央处理器106耦合到系统控制器110,但是与系统控制器110分离。系统控制器110是例如控制对于存储器和中央处理器中的高速缓冲存储器的访问并且在中央处理器与输入/输出子系统120之间通信的硬件组件。系统控制器负责由中央处理器和I/O子系统120作出的请求的列队、串行化和执行。在一个示例中,其负责发送命令到特定中央处理器和/或将命令广播到多个中央处理器。系统控制器可以是中心化组件,或者其功能可以分布。系统控制器不是处理器或核心;例。

22、如,它不能执行用户应用。替代地,它是I/O子系统和中央处理器之间的通信机制。说明书CN104067234A4/9页70027参照图1B描述关于中央处理器106的进一步细节。在一个示例中,中央处理器106包括一个或多个核心或处理器150,其是分配给一个或多个逻辑分区的物理处理器。中央处理器被视为节点的一部分,并且每个节点包括一个或多个中央处理器。逻辑分区可以跨越节点,其中来自一个节点的一个或多个中央处理器以及来自另一节点的一个或多个中央处理器可以指派给该逻辑分区。0028此外,根据本发明的一个方面,中央处理器106包括控制器160例如,硬件控制器,其用于执行重新表征以便调整可以为不活动或活动的处。

23、理器的参数。不活动的处理器是当前没有接受要执行的工作负载的处理器。其可以是执行在不可接受水平的处理器,并且因此它的工作负载移动到另一处理器,但是它仍然上电;或者其可以是等待激活的备件处理器。活动的处理器是准备接收和执行工作负载和/或正在执行工作负载的处理器。0029参照图2描述与重新表征相关联的逻辑的一个实施例。在一个示例中,除非另外指定,由控制器160图1B执行该逻辑。0030参照图2,最初,在该示例中,确定特定处理器例如,处理器A具有重新出现的错误,步骤200。例如,每个处理器具有用于确定它是否正确地运行的自测逻辑。特别地,每个处理器包括用于确定是否已经出现错误的错误检查逻辑。如果错误已经。

24、出现,则处理器使用它的恢复逻辑恢复自身。其跟踪在预定时间量中必须恢复的次数,并且如果发现恢复太频繁例如,必须恢复的次数超过阈值,那么其检测其具有重新出现的错误。0031响应于确定处理器具有重新出现的错误,停止该处理器的工作负载运行,并且从系统隔离该处理器,步骤202。在一个实施例中,处理器向管理程序报告其具有重新出现的错误,并且响应于此,管理程序停止处理器上的任务,处理器在系统中被隔离,其中管理程序仍然知道该处理器,但是没有工作指派给该处理器,并且该处理器不包括由另一处理器所需的任何信息。0032此外,处理器的状态以及其工作负载从该处理器例如,处理器A卸载到备件处理器例如,处理器B,步骤204。

25、。在一个示例中,处理器或另一组件发起卸载,其由管理程序或固件执行。卸载包括保存当前状态包括架构的和内部状态以及至少到工作负载的标识符或指针,并且将它们置于一个或多个其他处理器例如,备件。0033此后,对于现场重新表征是否可用进行确定,询问206。也就是说,本发明的一个或多个方面的能力在该系统上是否可用。在一个示例中,这可以由指示重新表征是否可用的指示符例如,共享存储器中的一位确定。如果重新表征不可用,那么将该处理器标记为缺陷的,并且在一个示例中,该处理器掉电,步骤208,并且处理完成。0034然而,如果现场重新表征可用,那么由控制器发起标准诊断测试例如,阵列内建自测ABIST和逻辑内建自测LB。

26、IST,并且在该处理器上运行,步骤210。如所知的,阵列内建自测组件运行作为系统引导处理的一部分的内部诊断。ABIST测试每个处理器作为可应用的中的逻辑和阵列,并且如果需要则对于处理器执行阵列修复位备份。逻辑内建自测是由此集成电路测试其自身电路的完整性的手段。LBIST通过练习集成电路逻辑并且然后检测该逻辑是否如所预期的表现来运行。实际上,具有LBIST的集成电路测试用于生成刺激并且检测反应的专用嵌入测试电路。在一个示例中,作为LBIST测试的一部分,清除FLUSH处理器的内部状态,并且重新初始化到已知的好状态。0035响应于运行任何诊断测试,对于是否获取通过信号进行确定,询问212。这指示自。

27、说明书CN104067234A5/9页8我诊断测试是否被视为成功例如,匹配的模式等。如果由控制器获取并且接收通过信号,那么该处理器标记为可用的,步骤214。工作负载可以调度到该处理器,并且该处理器可以重新进入运行状态,步骤216。0036然而,如果没有获取通过信号级,诊断测试被视为不成功,那么在一个实施例中,调整处理器的一个或多个参数以便提高其性能例如,减少错误。作为示例,这些参数包括电压和/或时钟频率;然而,可以调整其他参数,诸如温度或其他。在一个示例中,对于到处理器的提供运行电压是否处于最大电压进行确定,询问220。最大电压基于该技术,并且是预定值。如果提供电压不处于最大电压,那么处理器的。

28、提供电压递增预定量,步骤222。例如,提供或运行电压是电路运行的电压。在一个示例中,当前运行电压是095伏,并且增量是大约005V大约5。0037此后,由控制器发起ABIST和/或LBIST,并且再次在处理器上运行,步骤224。如果此时获取通过信号,询问226,那么处理以步骤214继续,并且将处理器标记为可用的。在进一步的实施例中,除了调整电压外,还检查并且可以调整时钟频率,即使获取通过信号。此外,在另一实施例中,响应于确定调整运行参数,由处理器自身发起诊断测试。0038然而,如果仍然没有获取通过信号,询问226,那么对于处理器的时钟频率是否处于最小值进行确定,询问230。最小值也基于该技术并。

29、且是预定值。如果时钟信号没有处于最小值,那么将其减少预定量以放慢处理,步骤232。例如,高端企业级处理器比如IBMZ/ARCHITECTURE处理器的当前运行频率是52GHZ,并且减小量是大约5。0039然后,ABIST和/或LBIST再一次运行,步骤234。响应于运行一个或多个ABIST和LBIST,对于是否获取通过信号进行确定,询问236。如果获取,那么将处理器标记为可用的,步骤214。然而,如果没有获取通过信号,或者如果时钟频率处于最小值,询问230,那么处理以询问220继续,并且处理重复。0040返回到询问220,如果提供电压处于最大值,那么处理以检查时钟频率继续,询问240。如果时钟。

30、频率处于最小值,那么处理器仍处于不可接受的运行水平,所以其标记为缺陷的,并且在一个示例中,其掉电并且将不再次调整,步骤242。否则,处理以步骤232继续,其中减小时钟频率,并且执行其他处理。这完成重新表征处理的处理。0041在进一步的示例中,除了或者替代电压和/或时钟频率,可以测试和调整其他运行参数。一个这样的参数是温度。然而,在温度的情况下,替代直接改变参数例如,温度,调整是间接的,改变影响参数的一个或多个成分/条件,诸如影响温度的处理器的冷却技术、处理器邻近的空气温度或者风扇速度作为示例。然而,如同电压和时钟频率,在调整参数之后,再次运行诊断测试,并且测试通过信号。0042如在此使用的,调。

31、整参数包括其中直接调整参数本身如在电压和时钟频率的情况下,作为示例的直接控制和/或其中替代直接调整参数调整影响参数的一个或多个成分/条件从而调整参数诸如温度,作为示例的间接控制。0043如上所述,在一个实施例中,当处理器检测到错误时,其典型地将自身恢复到已知的好状态。如果错误重新出现,那么状态转移到备件处理器,并且缺陷的处理器置为隔离状态。然后,系统中的控制器执行表征处理,其在运行一组诊断模式例如,ABIST和LBIST的同时,改变电属性诸如提供电压和时钟频率。执行测试,直到发现测试通过的运行点。响应于获取该点,该处理器返回在线,并且从工作负载管理器接收新的工作负载。说明书CN10406723。

32、4A6/9页90044在进一步的实施例中,在处理器仍然活动的同时例如,在其状态转移到其他处理器之前,其还可以经历该现场类型测试例如,当空闲时以便验证该处理器的健康度。此外,对备件处理器执行该处理,以便确定用于备件的最佳运行参数。在该系统中备件处理器的指派轮转的情况下,可以对所有安装的处理器执行现场健康检查。在一个示例中,对备件或空闲处理器以预定时间间隔执行现场测试,以检查安装的处理器的健康度例如,运行质量。0045在一个方面中,执行重新表征而不要求指令恢复/重试控制器。作为一个示例,检测缺陷的活动处理器,并且无破坏地从活动状态移除为非活动状态。在处于非活动状态的同时,练习处理器以确定是否存在可。

33、操作状态例如,电压电平、频率、温度,并且如果存在,则使得处理器可用于在新的可操作状态下重新激活。也就是说,替代将处理器标记为缺陷的并且不再次使用,将其运行参数调整为其中抢救处理器并且不视为缺陷的水平,即使可能处于劣化的水平。通过抢救处理器,该环境较不可能用完备件。0046作为一个示例,在计算环境的其他处理器可操作的同时,实时执行该重新表征处理。不存在对于由计算环境提供的服务的破坏,并且对于该环境的其他处理器透明。0047可不接受的运行水平可以是处理器具有重新出现的错误的水平、处理器未通过诊断测试的水平和/或预定义为不可接受的任何水平。例如,活动的处理器可能未接收重新出现的错误,但是作为示例如果。

34、它不满足特定性能特性或其运行在不希望的电压或时钟频率或其他运行参数,则可以被视为运行在不可接受的水平。类似地,由于类似的理由以及其他,备件处理器可能被视为处于不可接受的运行水平。不可接受的运行水平可以对于每个处理器预定义。0048此外,在一个示例中,如果其没有重新出现的错误和/或通过对其执行的诊断测试,则处理器运行在不可接受的运行水平。在进一步的示例中,如果其满足特定性能要求或特性或者运行在特性的希望运行参数,则其运行在可接受的水平。0049如本领域的技术人员将了解,本发明的一个或多个方面可体现为系统、方法或计算机程序产品。因此,本发明的一个或多个方面可呈完全硬件实施例、完全软件实施例包括固件。

35、、常驻软件、微代码等或组合软件与硬件方面的实施例的形式,这些实施例在本文中通常都可被称为“电路”、“模块”或“系统”。此外,本发明的一个或多个方面可呈体现于具有体现于其上的计算机可读代码的一个或多个计算机可读介质中的计算机程序产品的形式。0050可利用一个或多个计算机可读介质的任何组合。计算机可读介质可为计算机可读存储介质。举例而言,计算机可读存储介质可为但不限于电子、磁、光学、电磁、红外线或半导体系统、装置或设备或前述各者的任何合适组合。计算机可读存储介质的更特定示例非详尽清单包括以下各者具有一个或多个电线的电连接、携带型计算机磁片、硬碟、随机存取存储器RAM、只读存储器ROM、可擦除可编程。

36、只读存储器EPROM或高速缓冲存储器、光纤、携带型致密盘只读存储器CDROM、光学存储设备、磁性存储设备或前述各者的任何合适组合。在此文件的情况下,计算机可读存储介质可为可含有或存储供指令执行系统、装置或设备使用或结合指令执行系统、装置或设备而使用的程序的任何有形介质。0051现参看图3,在一个示例中,计算机程序产品300包括例如一个或多个非暂时性计算机可读存储介质302,以在其上存储计算机可读代码构件或逻辑304以提供并且有助于说明书CN104067234A7/9页10本发明的一个或多个方面。0052可使用适当介质包括但不限于无线、有线、光纤缆线、RF等或前述各者的任何合适组合传输体现于计算。

37、机可读介质上的程序代码。0053可用一个或多个程序设计语言的任何组合来撰写用于进行本发明的一个或多个方面的操作的计算机代码,该一个或多个程序设计语言包括诸如JAVA、SMALLTALK、C或类似者的物件导向式程序设计语言及诸如“C”程序设计语言、组译程序或类似程序设计语言的习知程序性程序设计语言。代码可整体地在用户的计算机上执行、部分地在用户的计算机上执行、作为一独立套装软件而执行、部分地在用户的计算机上且部分地在一远程计算机上执行或整体地在该远程计算机或服务器上执行。在后者情形下,远程计算机可经由任何类型的网络包括区域网络LAN或广域网络WAN连接至用户的计算机,或可进行至外部计算机的连接例。

38、如,经由使用因特网服务提供者的因特网。0054本文中参照根据本发明的实施例的方法、装置系统及计算机程序产品的流程图说明和/或方块图描述本发明的一个或多个方面。应理解,可由计算机程序指令来实施流程图说明和/或方块图的每一区块及这些流程图说明和/或方块图中的区块的组合。可将这些计算机程序指令提供至通用计算机、专用计算机或其他可编程数据处理装置的处理器以产生机器,以使得经由该计算机或其他可编程数据处理装置的处理器执行的指令创建用于实施该或这些流程图和/或方块图区块中所指定的功能/动作的构件。0055这些计算机程序指令也可存储在计算机可读介质中,其可指导计算机、其他可编程数据处理装置或其他设备以特定方。

39、式起作用,使得存储在该计算机可读介质中的指令产生一制品,该制品包括实施该或这些流程图和/或方块图方块中所指定的功能/动作的指令。0056这些计算机程序指令也可载入至计算机、其他可编程数据处理装置或其他设备上以使一系列操作步骤在该计算机、其他可编程装置或其他设备上执行以产生计算机实施的程序,使得在该计算机或其他可编程装置上执行的指令提供用于实施该或这些流程图和/或方块图区块中所指定的功能/动作的程序。0057这些图中的流程图及方块图说明根据本发明的一个或多个方面的各种实施例的系统、方法及计算机程序产品的可能实施的架构、功能性及操作。在此方面,流程图或方块图中的每一区块可表示模块、区段或代码的部分。

40、,其包含用于实施指定逻辑功能的一个或多个可执行指令。还应注意,在一些替代实施中,在区块中提到的功能可能不按图中所提到的顺序而发生。举例而言,实际上可实质上同时执行连续展示的两个区块,或有时可取决于所涉及饿功能性以相反顺序执行这些区块。还应注意,方块图和/或流程图说明的每一区块及方块图和/或流程图说明中的区块的组合可由执行指定功能或动作的基于专用硬件的系统或专用硬件与计算机指令的组合来实施。0058除上之外,本发明的一个或多个方面可由提出客户环境的管理的服务提供者提供、提出、部署、管理、服务等。举例而言,服务提供者可为一个或多个客户创建、维持、支持等执行本发明的一个或多个方面的计算机代码和/或计。

41、算机基础结构。作为回报,作为示例,服务提供者可在订用和/或收费协议下从客户收取付款。另外或替代地,服务提供者可从广告内容销售至一个或多个第三方而收取付款。0059在本发明的一个方面中,可部署一种用于执行本发明的一个或多个方面的应用程说明书CN104067234A108/9页11序。作为一个示例,应用程序的部署包含提供可操作以执行本发明的一个或多个方面的计算机基础结构。0060作为本发明的又一个方面,可部署计算基础结构,其包含将计算机可读代码整合至计算系统内,其中与该计算系统组合的代码能够执行本发明的一个或多个方面。0061作为本发明的又一个方面,可提供一种用于整合计算基础结构的程序,其包含将计。

42、算机可读代码整合至计算机系统内。计算机系统包含计算机可读介质,其中计算机介质包含本发明的一个或多个方面。与该计算机系统组合的代码能够执行本发明的一个或多个方面。0062虽然以上描述了各种实施例,但这些实施例仅为示例。例如,其他架构的计算环境可以并入和使用本发明的一个或多个方面。此外,中央处理器可以包括更多或更少在此描述的处理器。另外,处理器不需要是中央处理器的一部分。此外,除了和/或替代电压和/或时钟频率,可以调整其他运行参数以改进处理器的健康度和/或为了其他原因。此外,在一个示例中,当处理器标记为缺陷的时,其不需要掉电。还可以进行许多其他改变。0063而且,其他类型的计算环境可受益于本发明的。

43、一个或多个方面。作为例子,环境可包括仿真器例如,软件或其他仿真机制,其中特定架构包括例如指令执行、诸如地址转换的架构功能、以及架构寄存器或其子集被仿真例如,在具有处理器和存储器的本机计算机系统中。在这样的环境中,仿真器的一个或多个仿真功能可实施本发明的一个或多个方面,即使执行仿真器的计算机可具有与正被仿真的能力不同的架构。作为一个例子,在仿真模式中,解码正被仿真的特定指令或操作,且建立合适的仿真功能以实施单个指令或操作。0064在仿真环境中,主计算机包括例如存储器以存储指令和数据;指令获取单元以从存储器获取指令,且可选地,提供用于获取的指令的本地缓冲;指令解码单元以接收获取的指令并确定已被获取。

44、的指令的类型;以及指令执行单元以执行该指令。执行可包括将数据从存储器加载到寄存器;从寄存器将数据存储回存储器;或执行如由解码单元确定的某些类型的算术或逻辑运算。在一个例子中,每个单元在软件中实现。例如,被所述单元执行的操作被实现为仿真器软件中的一个或多个子例程。0065输入/输出或I/O设备包括但不限于键盘、显示器、指标设备、DASD、磁带、CD、DVD、随身碟及其他存储器介质等可直接或经由介入的I/O控制器而耦接至系统。网络适配器也可耦接至系统以使数据处理系统能够经由介入私用或公用网络而变得耦接至其他数据处理系统或远程打印机或存储设备。调制解调器、电缆调制解调器及乙太网卡仅为可用类型网络适配。

45、器中的少数几种。0066在此使用的术语仅是为了描述特定实施例,且不旨在限制本发明。如在此使用的,单数形式“一”、“一个”和“该”也旨在包括复数形式,除非上下文另外清楚地指明。还将理解,当在说明书中使用时,术语“包括”和/或“包含”指明存在所述的特征、整体、步骤、操作、元件和/或组件,但不排除存在或附加一个或多个其他特征、整体、步骤、操作、元件和/或组件。0067所附权利要求书中的所有装置或步骤加功能元件的相应结构、材料、操作以及等价物,如有的话,旨在包括用于结合如特别要求保护的其他所要求保护的元件来执行所述功能的任何结构、材料或操作。呈现本发明的说明是为了示出和描述的作用,但不是穷尽说明书CN。

46、104067234A119/9页12性的或将本发明限制于所公开的形式。许多修改和变化对本领域普通技术人员来说是明显的,且不脱离本发明的范围和精神。选择和描述实施例是为了最佳地解释本发明的原理和实际应用,并使得本领域普通技术人员能针对适于考虑的特定用途的具有各种修改的各种实施例理解本发明。说明书CN104067234A121/3页13图1A图1B说明书附图CN104067234A132/3页14图2说明书附图CN104067234A143/3页15图3说明书附图CN104067234A151/3页161一种用于促进计算环境中的处理的计算机系统,其中所述计算环境包括一组处理器,所述计算机系统包括存。

47、储器;与所述存储器通信的处理器;检查部件,用于检查该组处理器中的第一处理器的一个或多个运行参数,以确定是否要调整所述一个或多个运行参数的至少一个运行参数,所述一个或多个运行参数包括电压、时钟频率和温度的至少一个;调整部件,响应于确定要调整至少一个运行参数,用于调整所述至少一个运行参数,其中实时执行调整,其中实时调整包括在通过所述计算环境的其他处理器的产生工作负载的执行期间,所述第一处理器不掉电并且所述其他处理器保持运行;以及测试部件,响应于所述调整,用于测试所述第一处理器,所述测试包括执行一个或多个诊断测试,以确定所述第一处理器在至少一个调整的运行参数的情况下是否运行在其中从所述一个或多个诊断。

48、测试获取通过信号的运行点,并且其中基于所述测试指示所述第一处理器运行在其中从所述一个或多个诊断测试获取通过信号的运行点,所述第一处理器可用于执行工作负载,并且其中基于所述测试指示所述第一处理器没有运行在其中从所述一个或多个诊断测试获取通过信号的运行点,重复所述检查、调整和测试一次或多次,其中在重复一次或多次并且所述测试指示所述第一处理器没有运行在其中从所述一个或多个诊断测试获取通过信号的运行点之后,使所述第一处理器掉电。2如权利要求1所述的计算机系统,还包括获得部件,用于获得所述第一处理器处于不可接受的运行水平的指示,其中不可接受的运行水平是其中特定处理器具有重新出现的错误、不满足确定性能特性。

49、或者运行在不希望的运行参数的水平,并且其中所述检查部件进一步可操作用于基于所述第一处理器处于不可接受的运行水平的指示的检查。3如权利要求2所述的计算机系统,其中不可接受的运行水平是其中特定处理器具有重新出现的错误的水平,并且其中所述获得部件进一步可操作用于基于所述第一处理器具有重新出现的错误并且在从所述第一处理器卸载状态之后,执行一个或多个诊断测试,并且用于基于执行所述第一或多个诊断测试,接收失败信号。4如权利要求1所述的计算机系统,其中所述检查部件进一步可操作用于以预定时间间隔检查。5如权利要求1到4的任一所述的计算机系统,其中所述检查部件进一步可操作用于确定所述第一处理器的提供电压是否处于预定电压,并且其中所述调整部件进一步可操作用于基于确定所述提供电压未处于所述预定电压,改变到所述第一处理器的电压。6如权利要求5所述的计算机系统,其中所述检查部件进一步可操作用于基于所述提供电压处于所述预定电压,确定所述第一处理器的时钟频率是否处于预定频率,并且其中所述调整部件进一步可操作用于基于确定所述时钟频率未处于所述预定频率,改变所述时钟频率。7如权利要求5所述的计算机系统,其中所述检查部件进一步可操作用于响应于在改变电压之后确定所述第一处理器的运行水平处于不可接受的水平,确定时钟频率是否处于预定频率,并且其中所述调整部件进一步可操作用于基于确定所述时钟频率未处于所述预定频率,改变。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1