运动矢量检测装置 本发明涉及一种运动矢量检测装置的改良装置,该装置利用运动图象压缩方法之一的运动补偿预测来检测运动矢量。
传送或者储存具有庞大数据量的运动图象时,采用运动图象压缩技术来削减数据量是必不可少的。在运动图象压缩技术中,有称为运动补偿预测的压缩方法。运动补偿预测是通过将相关性高的图象间的变比特抽出,来降低运动图象在时间轴方向的冗长性,从而压缩信息量的一种方法。在运动补偿中所用的相关性高的图象间地变比特称为运动矢量,通常采用称为块匹配法的检测方法检测。下面用图5简单说明上述的块匹配法。
块匹配法是指用规定的块单比特评价两个图象间的相关的方法。在图5中,相对于图象A 501上的块(前图象)502检测运动矢量时,对图象B503上的给定的搜索图象范围504内的多个块计算评价值。在计算中,如果算出最好值(相关最高)的块是图5的块X 505时,从前图象块502投影在图象B 503上的比特置开始到块X 505为止的变比特即作为运动矢量被检测出来。
表示相关性高度的评价值通常采用具有相同像素的两个块相互之间,对所有象素累计相加空间上相对应的象素之间的差的绝对值所得的总合值。因此评价值越小相互块间的差就越小,既表示相关性高。
作为由上述块匹配法检测运动矢量的现有的运动矢量电路,例如有特开平7-184210号公报所公开的技术。图1表示运动矢量检测装置的整体构成。该构成是一个块内有256个象素,每个象素有8比特时的一例。在该图中,601表示级联的处理单元(以下简称PE),总共设置有与一个块内的象素数相同数目(即256个)的个数。602表示传送搜索范围504内的一个块的象素数据的总线R,603表示传送前图象块502的象素块的总线S,604表示给各PE601供给动作时钟的时钟线,605表示输入最后段的PE601的输出,并将该输出的前次值与本次值进行比较的比较方法。
图9表示上述运动矢量检测装置中的各PE601现有的内部构成。在该图中,610是计算通过总线R 602和总线S 603传送来的象素数据的差分值的绝对值的差分绝对值运算器,611是将差分绝对值运算器610的输出值与前段的PE601的输出值相加,并将相加的结果输出到后段的PE601的加法器,612是保存通过总线S 603传送来的前图象块的象素数据的寄存器,613是对差分绝对值运算器610和加法器611的运算进行流水线处理的流水线寄存器,614是对各PE601的加法器611的运算进行流水线处理的流水线寄存器。
下面对上述运动矢量检测装置的动作进行说明。前图象块502的前头的象素数据保存在最初段的PE0的寄存器612中同时传送给差分绝对值运算器610。并且将搜索范围504内的一个块(例如块X 505)的前头的象素数据传送给上述差分绝对值运算器610。该差分绝对值运算器610计算上面传送来的两个象素数据的差分绝对值,并将其结果传送给流水线寄存器613。加法器611将上述寄存器613的差分绝对值传送给后段的流水线寄存器614,并将该差分绝对值传送给后段的PE1。
然后,将前图象块502内的紧接着前头象素数据的第二个象素数据传送给第二段的PE1,同时将搜索范围504内的紧接着上述块X 505的象素数据传送给上述第二段的PE1。在第二段的PE1中,与上述最初段的PE0一样,计算传送来的两个象素数据的差分绝对值,并将其结果保存在流水线寄存器613中。并且,在第二段的PE1中,加法器611将从上述最初段的PE0传送来的前头象素数据的差分绝对值与第二级象素数据的差分绝对值进行相加,其结果保存在流水线寄存器614中,同时传送给后段的PE2。
以下重复同样的动作,在最终段的PE255中,流水线寄存器614的值即是前图象块502与搜索范围504的块X 505之间的所有象素的差分绝对值的累计值。
以上的动作将对搜索范围504内所包含的所有块(图5中示出了另一块Y 507)依次重复进行。
比较方法605接受最终段的PE601输出的差分绝对值的累计值,并将前次的块(例如块X 505)的累计值与本次的块(例如图5的块Y 507)的累计值进行比较,从中选出较小的累计值。对搜索范围504内的所有块计算其差分绝对值的累计值,并进行大小比较结束后,比较方法605将获得最小的累计值,具有最小值的块相对于前图象块502的变比特则作为运动矢量输出。
但是,在上述现有的运动矢量检测装置中,要进行大量的运算处理,具有消耗功率大,并且电路规模庞大的缺点。下面详细说明这些缺点。
既是说,如果是标准的电视运动图象时,则图5中所示的图象A 501是1秒钟30幅运动图象中一幅图象,其大小为720象素×480线。而在图5中前图象块502的大小,对于采用运动图象压缩中的运动补偿预测进行运动矢量检测而言,16象素×16线为标准设置,因此在搜索范围504内存在的块的个数应为1024个。对于以上的数值而言,需进行块匹配的块的个数1秒钟应为40,500(=720×480×30÷16÷16)个。而对每一块要进行块匹配处理时,总计需要进行262,144(=1024×16×16)次的差分绝对值的运算和累加运算。为此,利用上述块匹配法进行运动矢量检测时,1秒钟需要进行10,616,832,000(=40,500×262,144)次庞大的差分绝对值的运算和累加运算。因此,消耗功率很大。
并且为了提高上述各象素的差分绝对值的运算和累加运算的精度,各PE内差分绝对值运算器、加法器、流水线寄存器等需要扩大其比特数。更进一步,需要有256个其内部包含有这些单元的PE,其结果是造成电路规模庞大。
本发明正是为了解决上述问题,其目的是为了在运动矢量检测装置中缩小电路的规模,并且在低功率消耗的情况下进行运动矢量的检测。
为了达到以上的目的,本发明着眼于下列问题。即,在运动补偿预测中,运动矢量既使不是与前图象块的相关性最高的块的变比特,而是上述相关性足够高的块的变比特,就可有效降低图象间的冗长性。从而可以以高压缩效率压缩运动图象。
因此,第一,对搜索范围内的多个块的评价值进行计算时,即使不是最好的评价值,而让得到与该评价值相当的评价值,即即使让评价值可以区别相关性的高低的程度降低精度(分解度)而为好的构成的话,可以限制减小各PE内的加法器等的比特数,因而减小电路的规模并且降低消耗功率。
第二,在使用多个PE依次累计各象素的差分绝对值的累计计算中,作为各累加器的相加结果预先设定一设定值(门限值),当所计算的相加结果超过该设定值时,即使最终得到累计值也可以预测到其相关性低,这时则可以停止这之后的不必要的PE的差分绝对值的相加处理,从而可以降低消耗功率。
第三,当检测出与前图象块的相关性足够高的块时,就没有必要再检测比之更高相关性的块,因此可以停止这之后的评价值的计算,因而减少了计算次数,降低了消耗功率。
并且,在现有的运动矢量检测装置中,各PE0-PE255的加法器611均与在最终段的PE255(601)中所得到的可以表示差分绝对值的累计值的最大值时的比特数相同。但是,实际上各加法器611是将前段的PE的加法器611所得到的值,即已经计算出的各象素的差分绝对值的累计值与本段的PE计算的差分绝对值相加,因此越到后段的PE的累加器所算出的最大值越大,越到前段的PE的累加器所需要的比特数越小即可。因此如果越到前段的PE的累加器采用比特数越小的累加器构成,则可以减小电路的规模。
根据以上的观点,本发明所述的运动矢量检测装置,检测由多个象素组成的图象在包含有比上述象素的数量要多的象素的规定搜索范围内和具有与上述图象的象素相同数量的象素的多个块之间的相关,所具有的特征是计算所述图象和一个块的相对应的象素之间的数据的差分的绝对值,对上述各块依次进行各象素的差分的绝对值的累计相加的级联的处理单元,重复执行从最终段的处理单元获得的各块的差分绝对值的累计相加值之间通过减法进行比较并选择较小的累计相加值的比较方法和限制所述多个处理单元以及上述比较方法中至少一个的运算,使其具有虽然在所述比较方法最终获得的差分绝对值的累计相加值不是最小值但却是足够小的累计相加值的可能性的限制方法。
还有,本发明所述的运动矢量检测装置,所具有的特征是所述各处理单元具有计算所述图象和一个块的相对应的象素之间的数据的差分,同时计算其差分值的绝对值,获得规定比特数的差分绝对值的差分绝对值运算方法和将由所述差分绝对值运算方法获得的差分绝对值与前段的处理单元的输出相加,并将其加算结果传送到下一段处理单元的加法方法,所述限制方法由对由所述差分绝对值运算方法获得的差分绝对值的下位的规定的比特进行舍去或四舍五入处理,获得上位比特的差分绝对值的处理方法组成。
还有,本发明所述的运动矢量检测装置,所具有的特征是所述各处理单元具有计算所述图象和一个块的相对应的象素之间的数据的差分,同时计算其差分值的绝对值,获得规定比特数的差分绝对值的差分绝对值运算方法,并将由所述差分绝对值运算方法获得的差分绝对值与前段的处理单元的输出相加,并将其相加结果传送到下一段处理单元的加法方法,上述加法方法由比特数小的运算器所构成,所述限制方法由构成所述加法方法的上述运算器和当所述运算器运算出比上述比特数所能表现的最大值还要大的值时强制停止后段处理单元以后的差分绝对值的累计加法的强制停止方法所组成。
还有,本发明所述的运动矢量检测装置,所具有的特征是所述比特数小的运算器由当所述运算器运算出比上述比特数所能表现的最大值还要大的值时输出溢出信号的演算器所构成,所述强制停止方法接受前段的处理单元的所述运算器的溢出信号,忽视所述加法方法的相加结果,同时将本段以及前段的处理单元的所述溢出信号传送给下一段的处理单元。
更进一步,本发明所述的运动矢量检测装置,所具有的特征是所述限制方法将由所述比较方法所选择的小值累计相加值与设定值比较,当所述小值累计相加值达不到所述设定值时停止运动矢量检测装置整体的动作。
还有,本发明所述的运动矢量检测装置,所具有的特征是所述限制方法具有当所述小值累计相加值达不到所述设定值时产生停止信号的信号发生方法和当所述信号发生方法产生停止信号时,停止向所述各处理单元以及所述比较方法供给时钟信号的控制方法。
更进一步,本发明所述的运动矢量检测装置,所具有的特征是具有在所述各处理单元内具有的保存数据的多个寄存器和配置有向所述各处理单元传送构成一个块的多个象素数据的数据传送控制电路,所述限制方法将所述多个寄存器以及所述数据传送控制电路的各比特列分割成连续的多个比特列,所分割的比特列分别独立地进行写入控制和传送控制。
还有,本发明所述的运动矢量检测装置,所具有的特征是所述限制方法产生切换信号,由该切换信号停止向上述多个寄存器以及所述数据传送控制电路的各比特列的下位规定的比特列供给时钟信号。
更进一步,本发明所述的运动矢量检测装置,检测由多个象素组成的图象在包含有比所述象素的数量要多的象素的规定搜索范围内和具有与所述图象的象素相同数量的象素的多个块之间的相关,所具有的特征是具有计算所述图象和一个块的相对应的象素之间的数据的差分的绝对值,对所述各块依次进行各象素的差分的绝对值的累计相加的级联的处理单元,所述各处理单元具有计算所述图象和一个块的相对应的象素之间的数据的差分,同时计算其差分值的绝对值,获得差分绝对值的差分绝对值运算方法和将由所述差分绝对值运算方法获得的差分绝对值与前段的处理单元的输出相加,并将其相加结果传送到下一段处理单元的加法方法,所述各处理单元的加法方法越是位于后段的处理单元的加法方法比特数越大。
还有,本发明所述的运动矢量检测装置,所具有的特征是所述各处理单元的加法方法具有不发生溢出的所必要的最低限度的比特数。
根据以上的构成,在本发明所述的运动矢量检测装置中,多个处理单元的运算以及比较方法的减法处理中至少一个由限制方法所限制,可以构成为在减低消耗功率的同时缩小电路规模。这时,比较方法最终所获得的差分绝对值的累计相加值为最小值的附近的值时,即使以该附近的值的块作为相关性足够高的块检测运动矢量,也可以有效地降低图象间的冗长性,可以以高压缩效率压缩运动图象。
特别是,在本发明所述的运动矢量检测装置的各处理单元中,由于缩小设定了加法方法的比特数,可以缩小电路规模。进一步,可以降低电路规模缩小部分的消耗功率。
还有,在本发明所述的运动矢量检测装置的各处理单元中,当加法器算出超过设定值的相加结果,既是说,即使继续进行以后的加法最终获得累计值可以预测到相关性较低时,由于停止了其后的处理单元的差分绝对值的不必要的加法处理,因而可以减低消耗功率。
进一步,在本发明所述的运动矢量检测装置中,如果检测出与前图象块的相关性足够高的块,则依据该块检测出运动矢量,而不需要对比这更高相关性的块进行检测,停止这时以后的块的差分绝对值的累计相加值的计算,可以有效地减少计算次数,从而降低消耗功率。
还有,在本发明所述的运动矢量检测装置中,由切换信号强制停止各寄存器以及数据传送控制电路的下位比特的动作,既可以实现用所有比特获得所期待的精度的处理,也可以实现仅用上位比特进行降低了精度的处理,而仅用上位比特进行处理可以降低消耗功率。
还有,在本发明所述的运动矢量检测装置中,各处理单元的加算方法的比特数越到后段的处理单元的加法方法设定得越大,与现有那样在所有的加法方法中采用的是最终段的加法方法的比特数相比,有效地减小了电路规模,同时减少电路规模缩小那部分的消耗功率。
下面对附图作简要说明。
图1为表示本发明的实施例1的运动矢量检测装置的整体构造图。
图2为表示该运动矢量检测装置的构成单元的处理单元的构成图。
图3为表示本发明的实施例2的运动矢量检测装置的处理单元的构成图。
图4(a)为表示本发明的实施例3的运动矢量检测装置的构成图,(b)为表示该运动矢量检测装置的构成单元的比较方法的内部构成图。
图5为表示块匹配法的说明图。
图6为表示本发明的实施例4的运动矢量检测装置的处理单元的内部构成图。
图7为表示该运动矢量检测装置中时钟信号控制的说明图。
图8(a)为表示本发明的实施例5的运动矢量检测装置的整体构成图,(b)为表示各处理单元中加法器的所必要的比特数的特性图。
图9为表示现有的运动矢量检测装置的构成单元的处理单元的构成图。
以下为符号说明。
10—处理方法(限制方法),20—强制停止方法,30—限制方法,110、210、610、710—差分绝对值演算器,111、211、611、711—加法器(加法方法),112、212、612、712—寄存器,113、213、613、713—流水线寄存器,114、214、614、714—流水线寄存器,215—溢出信号,216—或电路,217—流水线寄存器,218—迁移禁止方法,301、401、601—处理单元,305、405、605—比较方法,310—比较器,311—寄存器,312—控制电路,313—减法器(信号发生方法),314—设定值寄存器,315—控制电路(控制方法),502—前图象块,504—搜索范围,506—运动矢量,715—数据传送控制电路,MODE—模式信号(切换信号),716—数据总线。
下面根据附图说明本发明的实施例。
实施例1
图1和图2为表示本发明的实施例1的运动矢量检测装置,图1表示整体构成。由于运动矢量检测装置的整体构成已经说明,下面根据图2说明其构成单元的处理单元(以下简称PE)的内部构成。
在图2中,110是计算差分值的绝对值获得8比特的差分绝对值的差分绝对值运算器,111是加法器(加法方法),112是与上述差分绝对值运算器110的B端子相接的的寄存器,输入图5的前图象块502的象素数据。113是配置在所述差分绝对值运算器110的输出端的流水线寄存器,114是配置上述加法器111的输出端的流水线寄存器。
本实施方案的PE601仅仅将由差分绝对值运算器110所算出的8比特的差分绝对值中的上位4比特经过流水线寄存器113输入给加法器111。因此上述加法器111以及两个流水线寄存器113、114为4比特构成。
由于让差分绝对值运算器110的差分绝对值中的上位4比特输入给加法器111的构成,因而构成有对差分绝对值运算器110的差分绝对值中的下位4比特进行舍去处理,获得上位4比特的差分绝对值的处理方法10。并且通过该处理方法10,构成有限制在处理单元PE的加法器111的运算的限制方法。
下面说明本实施例的运动矢量检测装置的动作。在寄存器112中保存前图象块502的象素,与该象素空间上相对应的块X 505内的象素之间的差分的绝对值由差分绝对值运算器110进行运算,所计算的差分绝对值的上位4比特保存在流水线寄存器113中。然后,保存在流水线寄存器113中的差分绝对值和前段PE的加法器111的输出(即已经计算出的差分绝对值的累计值)在本段的加法器111上进行相加,其相加结果保存在流水线寄存器114中。
在此,在各PE中,由于差分绝对值运算器110所得到的差分绝对值的下位4比特进行了舍去处理,因而在流水线寄存器113中保存了差分绝对值运算器110的差分绝对值除以“16”后的值,该上位4比特的差分绝对值输入给加法器111。其结果,在本实施例的运动矢量检测装置中,最终段的PE输出的是各象素的差分绝对值除以“16”后的值的累计值,与现有的比较,虽然精度(分解度)低,但该累计值是足够表示相关性高低的指标值,因此即使采用基于该累计值所得到的运动矢量进行运动补偿预测,也可以得到足够高的压缩率。
而且,在本实施例中的加法器111和流水线寄存器113、114的比特数与现有的8比特相比减少了4比特,电路规模减少。并且,电路规模的减小,使得消耗功率减少。
具体地说,在本实施例中,与现有的运动矢量检测装置相比,流水线寄存器113可以按50%、加法器111按75%、流水线寄存器114按75%的电路规模构成。
还有,在本实施例中,虽然舍去了差分绝对值运算器110输出的下位4比特,但在差分绝对值运算器110输出规定比特位上进行了四舍五入处理,即使减少了比特数,也可以获得同样的效果。
实施例2
下面按照图3说明本发明的实施例2。由于运动矢量检测装置的整体构成与图1相同,在此省略其说明。
图3表示PE的内部构成。在该图中,210是差分绝对值运算器,211是加法器,212是寄存器,213、214是流水线寄存器。图9所示的现有的加法器611为16比特构成,而本实施例中,加法器211为小比特数运算器,例如由10比特的运算器构成。
当上述加法器211计算出比上述10比特数所能表现的最大值(门限值)还要大的值时,输出溢出信号215。或电路216接受从上述加法器211来的溢出信号215,同时接受前段PE(图中未画出)经过信号线路216a输出来的信号,并取两信号的逻辑加。上述或电路216的输出经过流水线寄存器217输出给下一段PE(图中未画出)的或电路。迁移禁止方法218接受从上述累加器211来的溢出信号215,禁止向位于上述加法器211的后段的流水线寄存器214的数据迁移。
当任何一个PE的加法器211计算出比上述门限值要大的值时,在其后段PE的迁移禁止方法218根据上述溢出信号215禁止向本段PE的流水线寄存器214的数据迁移,从而无视本段加法器211的相加结果,强制停止下一段PE以后的差分绝对值的累计加法,同时构成将本段或前段PE的溢出信号经过或电路216以及流水线寄存器217传送给后段PE的强制停止方法20。
下面说明本实施例的运动矢量检测装置的动作。当加法器211的计算结果在门限值(10比特所能表现的最大值)以上时,加法器211输出溢出信号215。或电路216对从加法器211来的溢出信号215和前段PE来的溢出信号进行逻辑加,其结果通过流水线寄存器217传送到后段PE 。在各段PE,当溢出信号215从前段PE传送来的时候,迁移禁止方法218通过停止供给时钟信号的方式禁止在流水线寄存器214的数据迁移。其结果,当计算出门限值以上的值时,将停止这之后的累计计算。因此,可以降低功率消耗。接下来对搜索范围504内其余的块(例如图5的块Y 507)进行差分绝对值的累计值的计算,这当中任何一块的累计值为最小值时,具有最小值的累计值的块与前图象块的变位作为移动矢量被检测出来。
还有,根据溢出信号215停止累加计算时,从最终段PE输出的评价值为不定值。但是,如果构成为给比较方法605输入溢出信号215,而将不定的评价值排除在比较对象之外的话,可以防止误将该不定的评价值判断为最小的评价值。
在本实施例中,加法器211的比特数为10比特时,与现有的运动矢量检测装置相比,加法器211可以按62.5%,流水线寄存器214按62.5%的电路规模构成。
还有,在本实施例中,在各段PE中,由前段PE的溢出信号215禁止了向本段PE的流水线寄存器214的数据迁移。在此构成的基础之上,如果增加由前前段PE的溢出信号215禁止向本段PE的流水线寄存器213的数据迁移的构成,则也可以禁止自本段以后的PE进行不需要计算的加法器211的加法动作以及在流水线寄存器213的数据迁移。进一步,如果由前前前段的PE溢出信号215禁止向本段差分绝对值运算器210的A端子输入信号的迁移,则可以禁止自本段以后的PE进行不需要计算的差分绝对值运算器210的迁移,可以更进一步降低消耗功率。
实施例3
接下来,根据图4说明本发明的实施例3的运动矢量检测装置。
图4(a)表示本实施方案的运动矢量检测装置的整体构成。在该图(a)中,表示一个块内的象素数为256个时的构成,301是级联的多个PE,与块内的象素数具有相同的个数(即256个)。302以及303是传送在各PE301进行演算所需要的象素数据的总线R和总线S,304是为各段PE301供给动作时钟的时钟线,305是输入最终段PE301的输出值的比较方法。
在本实施例中,其特征在干上述比较方法305以及时钟线304的构成。图4(b)表示上述比较方法305的内部构成。在该图(b)的比较方法305中,比较器310通过将最终段PE301的输出值A和寄存器311的保存值B以减法来进行比较,当相减结果(A-B)为负值时,保存在寄存器311的内容用最终段PE301的输出值A改写。该寄存器311的写入控制由控制电路312进行。上述控制电路312,根据比较器310输出的MSB(最高位)和由时钟线304供给的时钟信号生成写入控制信号,并将该控制信号输出给寄存器311。
还有,313为减法器,314为保存作为最终段PE301所获得的差分绝对值的累计相加值预先确定的设定值的设定值寄存器。上述减法器313从保存在上述设定值寄存器314的设定值减去保存在寄存器311的最终段PE301实际获得的小值累计相加值,当实际获得的小值累计相加值小于上述设定值时,作为时钟停止信号(停止信号)输出上述相减结果的MSB(最高位)。上述减法器313起信号产生电路的功能。
在图4(a)中,时钟线304上配置有控制电路(控制方法)320。该控制电路320接受从上述减法器313来的时钟停止信号,停止给时钟线304供给时钟信号。因此当上述时钟停止信号产生时,各段PE301以及比较方法305的比较器310和寄存器311将接受不到时钟信号,并停止其动作。另外,不同于本实施例,也可以构成为由减法器313的停止信号停止向各段PE传送象素数据。由上述减法器313以及控制电路320,当保存在寄存器311的值(即最终段PE301实际获得的小值累计相加值)小于上述设定值时构成有停止运动矢量检测装置的整体动作的限制方法。
因此,在本实施例,如果最终段PE301实际获得的小值累计相加值小于上述设定值,将停止这之后的装置整体的动作,具有小于上述设定值的累计相加值的块作为与前图象块足够相关的块,用作检测运动矢量。即是说,如果获得了与前图象块足够相关的块,则可停止对搜索范围504内的其余块进行差分绝对值的累计相加值的计算,因而与现有的那样将搜索范围504内的所有块进行差分绝对值的累计相加值的计算相比,可以达到降低功率消耗的目的。
实施例4
接下来,根据图6和图7说明本发明的实施例4。
图6表示本实施方案的运动矢量检测装置中的处理单元的构成。在该图中,710为差分绝对值运算器,711为加法器,712为配置在上述差分绝对值运算器710前段的寄存器,接受图5的前图象块的象素数据。713为配置在上述差分绝对值运算器710后段的流水线寄存器(寄存器),714为配置在上述加法器711后段的流水线寄存器(寄存器),715为数据传送控制电路,通过数据总线R接受图5的搜索范围504内的各块505、507的象素数据。
在上述各寄存器712、713、714中,下位4比特的保存部分通过写入信号CLK-A,上位4比特的保存部分通过写入信号CLK-B分别独立进行图象数据的写入。上述两种写入信号CLK-A、CLK-B,如图7所示,根据由外部设定的模式信号(切换信号)MODE的值(“0”、“1”)产生,一写入信号CLK-A仅仅在模式信号MODE的值为“0”时产生,另一写入信号CLK-B在模式信号MODE的值为“0”和“1”时都产生。因此,MODE的值为“1”时可以禁止向各寄存器712、713、714的下位4比特的写入。另外,各寄存器712、713、714的下位4比特在启动前清“0”。
还有,上述数据传送控制电路715通过上述模式信号MODE固定下位4比特的值(通常固定为“0”值),上位4比特将数据总线R上的象素数据原样传送给差分绝对值演算器710。
根据以上的构成,各寄存器712、713、714的各上位4比特和下位4比特通过两种写入信号CLK-A、CLK-B独立进行写入控制,同时构成有上述数据传送控制电路715的上位4比特和下位4比特通过模式信号MODE独立传送控制的限制方法30。
处理运动图象压缩规格中的MEPG等自然图象的运动检测中,即使将下位的数比特忽视,可以获得与用所有比特实行时的精度大致相同的精度,对画质的影响很小。在本实施例中,处理自然图象的运动检测时,如果由模式信号MODE停止寄存器712-714以及数据传送控制电路715的各下位4比特的动作,则既可以确保图象良好的画面质量,也可以降低消耗功率。
并且,在本实施例中,寄存器712-714以及数据传送控制电路715的比特列的分割方法采用了分割为下位4比特和上位4比特的方法,如果将分割数增加为3以上,更可以进行细微的控制。
实施例5
最后根据图8说明本发明的实施例5。该图(a)表示本实施方案的运动矢量检测装置的整体构成。图(a)表示一个块内的象素数为256个时的构成。401为级联的256个PE,402以及403为传送在各PE进行运算所需要的数据的总线R以及总线S,404为给各PE401供给动作时钟的时钟线,405为输入最终段PE401的输出值的比较方法。
在本实施方案中,其特征在于各PE401的内部构成。即,各PE401的加法方法(图2的加法器111)的比特数不一样,越到后段的PE401的加法器111比特数越大。即在各PE401中,加法器111向下段的PE传送的数据的动态范围,越到后段的PE设定地越大。
如果没有溢出则动作正常,运算精度在各段PE都可以变更。象素数据为8比特时的各段(i)的加法器111的动态范围D可以由下式表示,
D=log2(255(i+1))i=0,1,2,…,255因此向后段传送的数据所需要的最低限度的比特数通过上述值D获得收尾成整数的值。其结果如图8(b)所示。
在本实施例中,通过如图8(a)所示的级联实现8、9、10、11、12、13、14、15以及16比特的精度输出的九种PE。
依据上述构成,与现有的构成相比,由于减少了在PE内部的加法器以及流水线寄存器(如图2所示的加法器111以及流水线寄存器114)的比特数,因而可以减少电路的规模同时降低消耗的功率。
在本实施例中,与现有的运动矢量检测装置相比,从图8(b)可以判定,各PE401内的加法器111可以按约90%,流水线寄存器114可以按40%的电路规模构成。
还有,以上所说明的各实施例,可以分别独立获得缩减电路规模的效果以及降低消耗功率的效果,也可以将各实施例任意组合,这时,可以更进一步获得缩减电路规模的效果以及降低消耗功率的效果。
如以上所述,本发明的运动矢量检测装置,既可以确保以高压缩效率压缩运动图象,也可以获得降低消耗功率和缩小电路规模的效果。
具体地说,在本发明所述的运动矢量检测装置的各处理单元中,由于缩小设定加法方法的比特数,可以缩小电路规模,同时降低了电路规模缩小部分的消耗功率。
并且,在本发明所述的运动矢量检测装置的各处理单元中,当加法器算出超过设定值的相加结果,可以预测最终的相关性较低时,由于停止了其后的处理单元的差分绝对值的不需要的加法处理,因而可以减少消耗功率。
进一步,在本发明所述的运动矢量检测装置中,如果检测出与前图象块的相关性足够高的块时,依据该块检测出运动矢量,而不需要对比这更高相关性的块的检测,停止这时以后的块的差分绝对值的累计相加值的计算,可以有效地减少计算次数,从而减少消耗功率。
还有,在本发明所述的运动矢量检测装置中,由切换信号强制停止各寄存器以及数据传送控制电路的下位比特的动作,仅用上位比特进行处理,因而可以降低消耗功率。
还有,在本发明所述的运动矢量检测装置中,各处理单元的加法方法的比特数越到后段的处理单元的加法方法设定得越大,与现有那样在所有的加法方法中采用的是最终段的加法方法的比特数相比,有效地减小了电路规模,同时减少电路规模缩小那部分的消耗功率。