一种保护单板的方法及装置 【技术领域】
本发明涉及单板保护技术,尤其涉及一种保护单板的方法及装置。
背景技术
一般情况下,单板上具有一些功耗比较大的芯片。例如,作为单板的一种类型,交叉板是光数据单元(ODU,Optical Data Unit)交叉系统的重要组成部分,承担着时隙交叉的任务,但交叉板所用的芯片功耗大,发热量高,因此散热成了一个严重的问题。
由于单板所用的芯片功耗很大,因此需要对芯片进行温度检测。现有的检测方式具体为:预设芯片温度的门限值,当测温芯片检测到芯片的温度超过门限值时,通知控制单元,控制单元便发出告警信号,等待人为处理。这种检测方式的优点是方法简单、容易实现、且不易产生复杂情况;但缺点是不能进行功耗调节、保护能力弱,在芯片的温度过高时,没有自动处理功能,容易造成温度持续上升而最终导致单板工作异常。
【发明内容】
有鉴于此,本发明的主要目的在于提供一种保护单板的方法及装置,能够降低单板上的芯片功耗、保护单板,从而提高单板的工作稳定性。
为达到上述目的,本发明的技术方案是这样实现的:
一种保护单板的方法,该方法包括:
当检测到被测芯片的温度超过预设的门限值时,关闭被测芯片未使用的工作组(BANK),并再次对所述被测芯片进行温度检测;
在再次检测过程中,当检测到被测芯片的温度仍超过预设的门限值、且所述被测芯片所属的单板为主板时,则发出告警信号,将主板切换到备板,关闭被测芯片的所有BANK,并继续进行温度检测。
其中,所述方法进一步包括:
在所述再次检测过程中,当检测到被测芯片的温度仍超过预设的门限值、且所述被测芯片所属的单板为备板时,则发出告警信号,并继续进行温度检测。
其中,所述方法进一步包括:
当检测到被测芯片的温度不超过预设的门限值、且所述被测芯片所属的单板为主板时,则继续进行温度检测;
当检测到被测芯片的温度不超过预设的门限值、所述被测芯片所属的单板为备板、且备板未处于告警中时,则继续进行温度检测;
当检测到被测芯片的温度不超过预设的门限值、所述被测芯片所属的单板为备板、且备板正处于告警中时,则关闭告警,重新启动所述被测芯片的所有BANK,并继续进行温度检测。
其中,在重新启动所述被测芯片的所有BANK之后,所述方法进一步包括:
将主板切换到所述备板。
一种保护单板的装置,该装置包括:控制模块及用于检测被测芯片温度的检测模块;其中,
控制模块,用于当检测模块检测到被测芯片的温度超过预设的门限值时,关闭被测芯片未使用的BANK,并通知检测模块再次进行温度检测;
所述控制模块,还用于,在检测模块再次进行温度检测过程中,当检测到被测芯片的温度仍超过预设的门限值、且所述被测芯片所属的单板为主板时,发出告警信号,将主板切换到备板,关闭被测芯片的所有BANK,并通知检测模块继续温度检测。
其中,所述控制模块,进一步用于,在检测模块再次进行温度检测过程中,当检测到被测芯片的温度仍超过预设的门限值、且所述被测芯片所属的单板为备板时,发出告警信号,并通知所述检测模块继续温度检测。
其中,所述检测模块,进一步用于,当检测到被测芯片的温度不超过预设的门限值、且所述被测芯片所属的用于单板为主板时,继续进行温度检测;
所述检测模块,进一步用于,当检测到被测芯片的温度不超过预设的门限值、所述被测芯片所属的单板为备板、且备板未处于告警中时,继续进行温度检测;
所述控制模块,进一步用于,当检测模块检测到被测芯片的温度不超过预设的门限值、所述被测芯片所属的单板为备板、且备板正处于告警中时,关闭告警,重新启动所述被测芯片地所有BANK,并通知检测模块继续温度检测。
其中,所述控制模块进一步用于,在重新启动所述被测芯片的所有BANK之后,将主板切换到所述备板。
其中,所述检测模块为测温芯片。
由以上技术方案可以看出,当主板上被测芯片的温度超过预设的门限值时,本发明采用多级处理方式来保护单板,即:首先关闭被测芯片未使用的BANK以降低被测芯片的功耗;在关闭未使用的BANK之后,如果被测芯片的温度仍超过预设的门限值,则再进行主备切换、及关闭被测芯片的所有BANK,以进一步降低被测芯片的功耗。并且,关闭BANK以及进行主备切换都是由控制单元自动控制完成的,因此本发明对单板具有自动保护功能。综上所述,采用本发明所述的保护单板的方法,可以降低功耗,节约能源,并避免因温升过高而导致单板工作异常,从而有效地提高了单板的工作稳定性及可靠性。
【附图说明】
图1为本发明保护单板的方法的流程示意图;
图2为本发明保护单板的装置的结构示意图。
【具体实施方式】
在详细阐述本发明的技术方案之前,先介绍一下在本发明技术方案中将会涉及到的单板的功能,单板的这些功能都是现有的:
一、单板上的大功耗芯片,如现场可编程门阵列(FPGA,Field ProgrammableGate Array)芯片有几个工作组(BANK)组成,每个BANK内具有多路高速通道,每个BANK可以独立进行开关控制;
二、当芯片的温度检测异常时,系统具有告警机制;
三、单板采用1+1保护机制,即具有主板和备板两块板,在主板工作异常时可以进行主备切换;
四、单板上的芯片与测温芯片相接,测温芯片用于检测芯片的温度,并将检测结果通知控制单元,控制单元根据检测结果自动进行告警、控制芯片BANK的开关、及进行主备切换等处理。
在实际应用中,测温芯片通常仅检测单板上功耗大的芯片的温度。
如图1所示,本发明保护单板的方法包括以下步骤:
步骤101,检测被测芯片的温度。
由上文描述可知,在实际应用中,被测芯片的温度通常是由测温芯片检测的。
FPGA芯片在工作时会进行实时温度检测,因此这里的被测芯片可以以FPAG芯片为例。
步骤102,判断被测芯片的温度是否超过预设的门限值,如果是,则执行步骤103;否则,执行步骤107。
其中,可以根据实际需要预设门限值的具体数值。
步骤103,关闭被测芯片未使用的BANK以降低被测芯片的功耗及温度,并再次对该被测芯片进行温度检测。
由上文描述可知,在实际应用中,测温芯片将检测结果通知控制单元,控制单元根据该检测结果,即当前被测芯片的温度超过预设的门限值,自动关闭被测芯片未使用的BANK。
步骤104,当被测芯片未使用的BANK被关闭之后,检测到被测芯片的温度仍超过预设的门限值时,判断该被测芯片所属的单板是否为主板,如果是,则执行步骤105;否则,执行步骤106。
步骤105,发出告警信号,表示主板工作异常;将主板切换到备板,并关闭被测芯片的所有BANK,这样,被测芯片的功耗将大大降低,温度也会逐渐下降;接着,返回步骤101,继续进行温度检测。
其中,在实际应用中,控制单元自动发出告警信号,然后自动将主板切换到备板,并自动关闭被测芯片的所有BANK。
需要说明的是,将主板切换到备板之后,原来的主板被作为备板使用,而原来的备板被作为主板使用。
步骤106,发出告警信号,表示备板工作异常,并返回步骤101,继续进行温度检测,等待处理。
其中,在实际应用中,该告警信号也是由控制单元自动发出的。
步骤107,判断该被测芯片所属的单板是否为主板,如果是,则返回步骤101;否则,执行步骤108。
步骤108,判断备板是否处于告警中,如果是,则执行步骤109;否则,返回步骤101。
步骤109,如果备板正处于告警中,则关闭告警,并重新启动该被测芯片的所有BANK,使该被测芯片进入正常工作状态,然后返回步骤101,继续进行温度检测。
其中,在实际应用中,控制单元自动关闭告警,并自动启动被测芯片的所有BANK。
这一步骤的意义在于:如果原来的主板(即当前的备板),由于其上被测芯片的温度超过预设的门限值而被切换到备板(即当前的主板)之后,原来的主板上被测芯片的所有BANK都将被关闭,这样,被测芯片的温度将会逐渐降低,但在降到门限值以内之前,原来的主板一直处于告警状态,当温度正常之后,便需要关闭告警,并重新启动被测芯片的所有BANK,使被测芯片进入正常工作状态。
如果需要切换回原来的主板,即当前的备板,则在重新启动该被测芯片的所有BANK之后,将当前的主板切换到该当前的备板,然后返回步骤101,继续进行温度检测。
为实现上述方法,本发明相应提供一种保护单板的装置,如图2所示,该装置包括:用于检测被测芯片温度的检测模块10、及控制模块20;其中,
控制模块20,用于当检测模块10检测到被测芯片的温度超过预设的门限值时,关闭被测芯片未使用的BANK,并通知检测模块10再次进行温度检测;
控制模块20,还用于,在检测模块10再次进行温度检测过程中,当检测到被测芯片的温度仍超过预设的门限值、且所述被测芯片所属的单板为主板时,发出告警信号,将主板切换到备板,关闭被测芯片的所有BANK,并通知检测模块10继续温度检测。
控制模块20,进一步用于,在检测模块10再次进行温度检测过程中,当检测到被测芯片的温度仍超过预设的门限值、且所述被测芯片所属的单板为备板时,发出告警信号,并通知检测模块10继续温度检测。
另外,检测模块10,进一步用于,当检测到被测芯片的温度不超过预设的门限值、且所述被测芯片所属的用于单板为主板时,继续进行温度检测;
另外,检测模块10,进一步用于,当检测到被测芯片的温度不超过预设的门限值、所述被测芯片所属的单板为备板、且备板未处于告警中时,继续进行温度检测;
另外,控制模块20,进一步用于,当检测模块10检测到被测芯片的温度不超过预设的门限值、所述被测芯片所属的单板为备板、且备板正处于告警中时,关闭告警,重新启动所述被测芯片的所有BANK,并通知检测模块10继续温度检测。
其中,控制模块20进一步用于,在重新启动被测芯片的所有BANK之后,将主板切换到所述备板。
其中,检测模块10为测温芯片。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。