半导体装置和图像处理方法.pdf

上传人:a2 文档编号:4756736 上传时间:2018-11-07 格式:PDF 页数:30 大小:903.80KB
返回 下载 相关 举报
摘要
申请专利号:

CN201210529893.X

申请日:

2012.12.07

公开号:

CN103176928A

公开日:

2013.06.26

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||著录事项变更IPC(主分类):G06F 13/18变更事项:申请人变更前:瑞萨电子株式会社变更后:瑞萨电子株式会社变更事项:地址变更前:日本神奈川县变更后:日本东京都|||专利申请权的转移IPC(主分类):G06F 13/18变更事项:申请人变更前权利人:瑞萨移动公司变更后权利人:瑞萨电子株式会社变更事项:地址变更前权利人:日本东京都变更后权利人:日本神奈川县登记生效日:20150309|||实质审查的生效IPC(主分类):G06F 13/18申请日:20121207|||公开

IPC分类号:

G06F13/18

主分类号:

G06F13/18

申请人:

瑞萨移动公司

发明人:

浜崎博幸; 中村淳; 小池学; 城户英彰; 金川信康

地址:

日本东京都

优先权:

2011.12.08 JP 2011-268705

专利代理机构:

北京市金杜律师事务所 11256

代理人:

酆迅;庞淑敏

PDF下载: PDF下载
内容摘要

本发明涉及半导体装置和图像处理方法。根据本发明,一种图像处理设备包括:图像处理单元,其根据一个图像数据计算两种类型的图像数据并且输出计算的图像数据;数据组合单元,其组合从所述图像处理单元提供的两种类型的数据并且向一个端子输出组合数据;输出缓存器,其根据从用于仲裁总线的总线仲裁装置提供的指令,调节所述组合数据的输出定时;以及数据分布单元,其根据外部组合分布指令,以组合数据的形式向所述总线输出从输出缓存器输出的组合数据,或者分布所述组合数据并且将分布的数据输出到所述总线。

权利要求书

权利要求书
1.   一种半导体装置,包括:
图像处理单元,其包括至少两个输出端子;
数据组合单元,其组合来自所述图像处理单元的至少两个输出端子的数据,并且向端子输出组合数据,该端子的数目小于所述图像处理单元的输出端子的数目;
输出缓存器,其根据从用于仲裁总线的总线仲裁装置提供的指令,调节所述组合数据的输出定时;以及
数据分布单元,其根据外部组合分布指令,以所述组合数据的形式向所述总线输出从所述输出缓存器输出的所述组合数据,或者分布所述组合数据并且向所述总线输出所分布的数据。

2.   一种半导体装置,包括:
图像处理单元,其包括至少两个输出端子;
数据组合单元,其输出通过组合来自所述图像处理单元的所述至少两个输出端子的数据而获得的组合数据;
输出缓存器,其根据从用于仲裁总线的总线仲裁装置提供的指令,调节所述组合数据的输出定时,所述输出缓存器的数目小于所述图像处理单元的所述输出端子的数目;以及
数据分布单元,其根据外部组合分布指令,以组合数据的形式向所述总线输出从所述输出缓存器输出的所述组合数据,或者分布该组合数据并且向所述总线输出所分布的数据。

3.   根据权利要求1所述的半导体装置,其中针对所述数据组合单元的每个输出端子提供所述输出缓存器。

4.   根据权利要求1所述的半导体装置,其中所述数据分布单元包括:
数据分割单元,其分割从所述输出缓存器提供的所述组合数据;以及
选择器,其基于所述组合分布指令,选择和输出所述组合数据或者由所述数据分割单元分割的分割数据。

5.   根据权利要求4所述的半导体装置,其中所述数据分布单元还包括地址生成单元,其基于所述组合分布指令,生成所述组合数据或所述分割数据的地址。

6.   根据权利要求4所述的半导体装置,其中所述数据分布单元还包括数据分布调节单元,其将由所述数据分割单元分割的数据调节为预定大小。

7.   根据权利要求5所述的半导体装置,其中所述地址生成单元包括:
基础地址生成单元,其生成基础地址;
偏移赋予单元,其将偏移赋予所述基础地址;以及
第一选择器,其选择和输出由所述基础地址生成单元生成的所述基础地址以及通过在偏移赋予单元中将所述偏移赋予所述基础地址而获得的偏移地址其中之一。

8.   根据权利要求7所述的半导体装置,其中
所述图像处理单元针对一个像素生成至少两个计算结果,以及
所述地址生成单元还包括赋予不同偏移值的多个类型的偏移赋予单元,以及第二选择器,所述第二选择器选择是将所述基础地址和由所述多个偏移赋予单元生成的多个偏移地址作为所述分割数据的分割地址输出,还是将所述基础地址作为所述组合数据的组合地址输出。

9.   一种处理图像的方法,所述方法包括:
图像数据计算步骤,用于通过使用图像处理单元计算至少两种类型的图像数据;
组合步骤,用于组合在所述图像数据计算步骤中计算的所述至少两种类型的图像数据;
缓存步骤,用于向一个输出缓存器提供在所述组合步骤中组合的组合数据,并且缓存所述组合数据直至从总线仲裁装置发出输出许可;以及
数据分布步骤,用于基于组合分布指令,以所述组合数据的形式向总线输出被许可从所述输出缓存器输出的所述组合数据,或者分布所述组合数据并且向所述总线输出所分布的数据。

10.   根据权利要求9所述的方法,其中所述数据分布步骤包括:
数据分割步骤,用于分割从所述输出缓存器提供的组合数据;以及
输出步骤,用于基于所述组合分布指令,选择和输出所述组合数据或者在所述数据分割步骤中分割的分割数据。

11.   根据权利要求10所述的方法,其中所述数据分布步骤包括地址生成步骤,用于基于所述组合分布指令,生成所述组合数据或者所述分割数据的地址。

12.   根据权利要求11所述的方法,其中在所述地址生成步骤中,所述组合数据和所述分割数据的地址通过以下来生成:生成基础地址,通过将偏移赋予所述基础地址来生成偏移地址,以及选择和输出所述基础地址和所述偏移地址其中之一。

13.   根据权利要求12所述的方法,其中在所述地址生成步骤中,
通过将具有不同值的偏移赋予所述基础地址,生成多个类型的偏移地址,以及
根据所述组合分布指令,将所述基础地址和所述多个偏移地址作为所述分割数据的分割地址连续地输出,或者将所述基础地址作为所述组合数据的组合地址输出。

14.   一种信息处理设备,包括:
存储器接口,其连接到外部存储器;
半导体装置,其通过总线连接到所述存储器接口;
总线仲裁单元,其仲裁所述总线;以及
通用运算单元,其控制所述半导体装置,
其中所述半导体装置包括:
图像处理单元,其包括至少两个输出端子;
数据组合单元,其组合来自所述图像处理单元的所述至少两个输出端子的数据,并且向端子输出组合数据,该端子的数目小于所述图像处理单元的输出端子的数目;
输出缓存器,其根据从仲裁所述总线的总线仲裁单元提供的指令,调节所述组合数据的输出定时;以及
数据分布单元,其根据从所述通用运算单元提供的组合分布指令,以所述组合数据的形式向所述总线输出从所述输出缓存器提供的所述组合数据,或者分布所述组合数据并且向所述总线输出所分布的数据。

15.   根据权利要求14所述的信息处理设备,还包括连接到外部图像拾取装置的照相机接口。

说明书

说明书半导体装置和图像处理方法
相关申请的交叉引用
本申请基于在2011年12月8日提交的日本专利申请No.2011‑268705,并且主张该日本专利申请的优先权利益,该日本专利申请的公开内容通过引用全部结合于此。
技术领域
本发明涉及适合于例如汽车导航系统等的半导体装置和图像处理方法。
背景技术
在诸如汽车导航设备(下文中也简单地称为″车辆导航″)的车载信息终端中,期望处理更高质量的多媒体并且展现更高质量的图形性能。结果,安装在车载信息终端的半导体装置,诸如SoC(片上系统),需要具有更高性能图像处理功能,并且因此各式各样的研究和发展正在进行之中。日本未审专利申请公开No.2002‑204347、日本未审专利申请公开No.2005‑11520以及日本专利No.2827258公开了与图像处理有关的技术。
发明内容
本申请的发明人已经发现,在具有图像处理功能的半导体装置的研发中有各种问题有待解决。本申请中公开的每个实施例提供了一种具有高质量图像处理功能的半导体装置以及一种图像处理方法。
通过本说明书和附图的下述描述,将理解更多的细节特征。
本发明的第一方面为一种包括输出缓存器的半导体装置。
本发明的另一方面为一种信息处理设备,其包括:包括输出缓存器的半导体装置;以及总线,其执行此半导体装置和外部或内部存储器之间的数据交换。
本发明能够提供一种具有高质量图像处理功能的半导体装置以及一种图像处理方法。
附图说明
通过结合附图对某些实施例的下述描述,上述及其它方面、优点和特征将更加清楚,在附图中:
图1A为示出根据本发明第一实施例的半导体装置的概念图示;
图1B为示出其上安装有根据本发明第二实施例的半导体装置的系统LSI的框图;
图2为用于说明在针对一个像素计算两个或更多个数据的情况下的存储器映射的图示;
图3示出包括图像处理单元、存储器和通用运算单元的系统LSI的示例;
图4示出数据分布单元104的特定示例;
图5为用于说明数据分割单元111的操作的图示;
图6为示出输出格式为组合输出201格式的情形的时序图;
图7为示出从数据分割单元111到数据分割调节单元112的定时的时序图;
图8示出根据本发明第三实施例的数据分布单元104的细节;
图9为示出数据分布单元104中的信号和缓存器的值的时序图;
图10示出数据组合单元102的配置的示例;
图11示出输出缓存器的配置的示例;
图12为示出输出缓存器的操作的流程图;以及
图13A至13C为用于说明图像处理单元的数据输出方法的图示,并且示出多个数据被输出的情形(分布输出)、多个数据被联合地输出的情形(组合输出)以及可以分别处理分布输出和组合输出的情形。
具体实施方式
在下文中,参考附图来说明应用本发明的特定实施例。在所有附图中,相同的标记被指派给相同的部件,并且为了使说明清晰而适当地省略了对它们的重复说明。
<组合输出(Combination output)和分布输出(Distribution output)>
存在这样的情形,其中期望在针对一个输入图像执行某个处理时,从该一个图像获得多个图像输出。例如,存在这样的情形,其中期望从一个输入图像获得:通过在纵向方向上对输入图像微分获得的一个图像,以及通过在横向方向上对输入图像微分获得的另一个图像。作为另一示例,在哈里斯(Harris)角点检测中(参见Masatoshi OKUTOMI,Masao SHIMIZU等人的″Digital Image Processing″Computer Graphic Arts Society(CG‑ARTS Society))2004),需要获得一个输入图像的三个输出值,这些输出值包括纵向微分的平方,横向微分的平方以及纵向微分和横向微分的乘积作为该计算的中间值。
图2为用于说明在针对一个像素计算两个或更多个数据的情况下存储器映射的图示。在类似于此的情况下,作为如图2所示的输出方案,存在两个可能方案,所述可能方案包括:其中多个输出值″a″和″b″作为一个像素被连续地布置和输出的方案(下文中此输出方案称为″组合输出″(图2中201)),以及其中它们作为不同图像″a″和″b″被输出的方案(下文中此输出方案称为″分布输出″(图2中202))。注意,对于组合输出201的情形,存储器203上的映射变为映射204。另外,对于分布输出202的情形,存储器203上的映射变为映射205和206。
作为在组合输出格式中生成的图像的示例,存在这样的情形,其中像素值的颜色分量按照B(蓝)、G(绿)和R(红)的顺序针对每个像素被存储在存储器上,如同位图图像格式的情形那样。
图2所示的上述组合输出201和分布输出202中的每种具有下述优点和缺点。首先,当多个输出(在此示例中假设输出数据的数目为2)被联合地计算时,组合输出方案是有利的。图3示出包括图像处理单元、存储器和通用运算单元的系统LSI的示例。如图3所示,系统LSI 300包括图像处理硬件301、具有高速缓存器305的通用运算单元302、以及外部存储器303。另外,这些部件共享总线304。
在组合输出中,两个数据被连续地布置。因此,当它们由图3所示的通用运算单元302计算时,高速缓存器305的命中率高并且因而计算效率高。另外,当它们由图像处理硬件301处理时,用于控制输入地址的机制比用于分布输出的机制简单。这是因为两个数据被组合和存储在一个数据区域中。例如,对于图2所示示例的情形,在分布输出中,由于图像数据存储于两个不同地址区域中,需要用于控制地址的两个机制。
另一方面,即使当输出值其中之一被连续地使用,两个输出值通常都被读出,因为这两个输出被连续地布置在存储器空间中。因此,图像处理硬件301或通用运算单元302与存储器303之间的数据传输的效率劣化。输出的数目越大,这个问题变得越严重。然而,如上所述,当期望仅仅处理输出值其中一个时,或者当期望各输出值单独被处理时,分布输出方案是优选的。同时,当期望各输出被联合地处理时,分布输出方案的效率与组合输出方案相比较差。
因此,作为本申请的发明人进行辛勤研究的结果,已经发现一种具有如下图像处理功能的半导体装置,该图像处理功能能够按照可根据用户目的而选择性地使用这两种功能的方式来实现这两种功能。
<图像处理设备(比较示例)>
首先,为了使本发明容易被理解,下文中说明比较示例图像处理设备执行的数据输出方法。在下述说明中,在时间t彼此同步地从图像处理单元输出的两种类型数据用″at″和″bt″表示。
图13A至13C的图示用于说明由图像处理单元执行的数据输出方法,并且示出多个数据被输出的情形(分布输出)、多个数据被联合地输出的情形(组合输出),以及可以分别处理分布输出和组合输出的情形。下述说明是在这样的假设上进行:图像处理单元1301针对一个像素计算两个计算结果(″a″和″b″)。
图13A至13C所示图像处理单元1301针对一个像素计算并且输出例如计算结果″a″和″b″,每个计算结果由8位组成。每个输出缓存器1305、1307和1309连接到具有16位总线宽度的总线,并且在将其布置到16位的传输单元中之后将输出数据输出。
首先,如图13A所示,当图像处理单元1301原样地输出计算结果时,即,对于分布输出的情形,需要准备两个输出缓存器1305和1307来输出这些计算结果。与此不同,如图13B所示,当图像处理单元1301包括数据组合单元1303时,输出数据被数据组合单元1303转换成组合数据(由″a″和″b″组成的16位),并且因而使得可能将输出缓存器的数目减小为1,即1个输出缓存器1309。每个输出缓存器1305、1307和1309均将数据输出到具有16位的相同总线宽度的总线,并且因而它们具有相同存储器容量。也就是说,它们是有相同大小的输出缓存器。
如先前所述,取决于图像处理类型,组合输出在一些情形中会是优选的,而分布输出在另外情形中会是优选的。因此,理想地,图像处理设备应具有这两种输出功能。因此,如图13C所示,该配置被形成为具有数据组合单元1303,并且包括:当图像处理单元1301的两个输出将去往输出缓存器1305和1307时输出它们所通过的数据路径(日本专利No.2827258),以及在其中数据组合单元1303对数据进行组合并且组合数据被输出到输出缓存器1309的数据路径。
也就是说,该配置可以按下述方式形成。为了具有分布输出功能,输出缓存器设于用于每个输出类型(数目)的存储器和硬件之间。另外,为了具有组合输出功能,组合单元设于输出缓存器前面,使得数据被组合并且随后组合数据被输出到输出缓存器。
利用此配置,图像处理设备可以执行分布输出和组合输出二者。然而,此配置需要具有16位的相同总线宽度的三个输出缓存器,并且因而导致存储器容量、电路尺寸和成本增加的问题。
<本发明的第一实施例>
因此,本申请的发明人发现了一种具有如下图像处理功能的半导体装置,该图像功能能够针对组合输出方案或者针对分布输出方案输出处理结果,而不增加输出缓存器的数目。图1A为示出根据本发明第一实施例的半导体装置的示意图。
如图1A所示,半导体装置包括图像处理单元11、数据组合单元12、输出缓存器13和数据分布单元14。类似于上文参考图13A至13C说明的图像处理单元1301,图像处理单元11针对一个像素输出两个8位计算结果″a″和″b″。数据组合单元12组合从图像处理单元的两个输出端子输出的数据″a″和″b″,并且将由总共16位组成的组合数据输出到输出缓存器13。输出缓存器13根据来自用于仲裁总线的总线仲裁装置(未示出)的指令,调节组合数据的输出定时,并且由此在根据来自总线仲裁装置的指令的定时,将组合数据输出到数据分布单元14。数据分布单元14根据外部组合分布指令,将从输出缓存器13提供的组合数据按照原样作为16位数据输出到总线(未示出),或者将组合数据分布(或重新布置)为16位数据并且将分布的数据输出到总线。
以此方式,从图像处理单元(图像处理硬件)11输出的多个输出结果被临时组合(布置)并且传输到随后的输出缓存器13,并且组合数据进一步从输出缓存器13传输到随后的数据分布单元14。随后,该组合数据以组合数据的形式被发送到总线,或者根据用途被再次分割并且作为分布数据发送。因而,有可能将数据调节成有效数据长度。另外,包括组合、缓存和分割的这一系列过程在不使用外部存储器的情况下执行,并且因而不使用总线带宽。
也就是说,在此实施例中,多个数据被临时组合从而被发送到输出缓存器13,而与输出格式为分布输出格式还是组合输出格式无关。另外,用于根据输出格式重新分布(或重新布置)数据的装置设于输出缓存器13之后。结果,有可能在小区域中实施输出缓存器13的机制。另外,通过提供数据分布单元14,有可能以两种输出格式输出处理结果。此外,由于该过程的执行不使用外部存储器,因此可以以组合输出格式或者以分布输出格式执行输出过程,而不增大存储器和图像处理硬件之间的数据传输数量/数据处理时间。
<本发明的第二实施例>
接着说明根据本发明的第二实施例的半导体装置。图1B为示出其上安装有根据本发明的第二实施例的半导体装置的系统LSI的框图。此系统LSI 100例如可以应用到诸如汽车导航系统的图像处理设备。
如图1B所示,在系统LSI 100中,图像处理设备113、通用运算单元115、连接到照相机117的照相机接口单元116、连接到存储器108的外部存储器接口单元107、以及一组其它模块119连接到总线106,使得它们彼此连接。在图1B,图像处理设备113和这组其它模块119通过总线接口单元105连接到总线106,并且它们的数据传输的定时由此被调节。也就是说,总线接口单元105用作总线仲裁装置。
注意,通用运算单元115、照相机接口单元116和外部存储器接口单元107的每一个可包括在该单元与总线106之间的总线仲裁装置,使得它们对存储器108的访问定时也可以被仲裁。
根据此实施例的图像处理设备113包括:图像处理单元101,其包括两个输出端子;数据组合单元102,其组合来自图像处理单元101的两个输出端子的数据,并且将组合数据输出到一个端子;输出缓存器103,其根据从用于仲裁总线的总线仲裁装置(此示例中总线接口单元105)提供的传输许可信号D 118,来调节组合数据的输出定时;以及数据分布单元104,其根据外部组合分布指令,将从输出缓存器103提供的组合数据以组合数据的形式输出到总线106(总线接口单元105),或者分布(或重新布置)该组合数据并且将分布的数据输出到总线106(总线接口单元105)。
注意,图像处理单元101的输出端子的数目,即作为计算结果的数据输出的数目不限于2个,并且可以是3个或更多。数据组合单元102组合从图像处理单元101输出的输出数据并且由此生成组合数据,该组合数据的数目小于图像处理单元101的输出端子的数目。另外,数据组合单元102将组合数据输出到输出缓存器103。输出缓存器103被单独地提供给数据组合单元102的每个输出端子。由于数据组合单元102生成组合数据,所以输出缓存器103的数目可以减少。例如,当图像处理单元101执行复杂操作并且由此针对一个像素的生成四个处理结果时,四个数据被输入数据组合单元102。然而,当这些数据被组合到一个组合数据中时,所需的输出缓存器103的数目为1个。当这些数据被组合到两个组合数据中时,所需的输出缓存器103的数目为2个。另外,当这些数据被组合到三个组合数据中时,所需的输出缓存器103的数目为3个。在这些情形的任何一个中,通过在数据组合单元102处生成组合数据,有可能将输出缓存器103的数目减少到比图像处理单元101的输出小的数目,即小于4的数目。
总线接口单元105除了连接到图像处理设备113之外,还连接到这组其它模块119,并且通过参考每个模块的优先顺序等来执行对向总线的数据传输的仲裁。近年来,通过总线106连接到存储器108的模块的数目正在增大。因此,总线接口单元105执行如下过程,该过程例如用于提高执行需实时执行处理的模块的优先级。
随着近年来模块数目增大,每个模块在执行向存储器108的数据传输之前保持等待的等待时间也变得更长。因此,每个图像处理设备113和这组其它模块119要求输出缓存器容量对于类似于此的等待时间是足够的,并且因而导致电路尺寸变得更大的问题。然而,如上所述,在此实施例中,由于数据组合单元102组合图像处理单元101的输出数据并且将组合数据输出到一个输出端子,因此所需的输出缓存器103的数目为仅仅一个。另外,此组合数据按原样被输出,或者由随后的数据分布单元104作为分布数据输出。因此,可以通过提供仅仅一个输出缓存器103来执行该输出过程,而与输出格式是组合输出格式还是分布输出格式无关。
另外,此实施例不限于图1B所示配置。例如,照相机117可以直接连接到图像处理设备113,或者图像处理设备113可以配备有照相机117。另外,图像处理设备113可以连接到总线而在它们之间没有插入总线接口单元105。在这样情况下,可以提供用于仲裁从每个模块向总线的数据输出定时的仲裁装置。
<图像处理设备113的配置>
接着,说明图像处理设备113的内部配置。图像处理设备113读取存储器108中存储的图像数据,并且在图像处理单元101中执行特定计算。假设在此计算中,图像处理单元101在每个时间单位输出多个计算结果(例如图2中“a1”和“b1”)。此时间单位例如基于图像处理单元101的操作频率来确定。假设操作频率为100MHz并且图像处理单元101可以在每个周期输出计算结果,则时间单位为10ns。然而,根据此实施例的配置,图像处理单元101不一定需要在每个周期输出计算结果。
通过随后的数据组合单元102、输出缓存器103和数据分布单元104,图像处理设备113按照组合输出格式或者按照分布输出格式,选择性地将处理结果输出到存储器108。
<数据组合单元102的配置>
随后的数据组合单元102接收上述多个计算结果并且将这些多个计算结果的群组作为一个传输单元输出到随后的输出缓存器103。例如,假设每个输出由8位组成,数据“a1”和“b1”在时间t=2从图像处理单元101输出。随后,数据组合单元102将这些数据“a1”和“b1”一起放置在16位数据中,并且将该16位数据发送到输出缓存器103。
图10示出数据组合单元102的配置的示例。如图10所示并且如上所述,对于8位数据一起放置在16位数据中并且作为16位数据输出的情形,数据组合单元102可以由两个触发器1001形成。也就是说,多个数据由多个触发器1001接收。随后,它们被一起放置在组合数据中,并且该组合数据被输出到随后的输出缓存器103。
<输出缓存器103的配置>
接着,说明输出缓存器103。根据此实施例的输出缓存器103起到下述两个作用。第一个作用是在总线106拥堵时,采用类似FIFO的配置,并且由此使数据等待被分布。这种情况下,输出缓存器103例如从总线接口单元105接收传输许可信号D118,并且由此将该数据输出到随后的数据分布单元104。第二个作用是将从数据组合单元102接收的数据(下文中也称为″组合数据″)重新布置到用于总线106的数据传输单元中。假设针对总线106的数据传输单元为32位,则输出缓存器103将从数据组合单元102接收的两个组合数据放置在一起,并且将该组合数据发送到随后的数据分布单元104。例如,输出缓存器103将接收的数据{a1,b1}和{a2,b2}一起放置在32位数据{a1,b1,a2,b2}中,并且将该32位组合数据发送到随后的数据分布单元104。
接着,以更详细方式说明输出缓存器103。图11示出以32位数据传输单元发送/接收数据的输出缓存器的配置的示例。此输出缓存器103可以例如由多个FIFO形成。另外,输出缓存器103临时存储从数据组合单元102递送的组合数据1103。随后,当数据长度与用于总线106传输的单元相等并且从总线接口单元105接收到指示传输被许可的传输许可信号D118时,输出缓存器103将数据长度与用于传输的单元相等的数据1104发送到随后的数据分布单元104。
此输出缓存器103通过连接线路连接到总线接口单元105,传输许可信号D118通过该连接线路被接收。另外,在接收到如上所述的传输许可信号D118时,输出缓存器103从读指针1101指示的点读取32位信号,并且将此读取的数据1104发送到随后的数据分布单元104。以此方式,输出缓存器103需要存储从数据组合单元102发送的16位组合数据1103,直至输出缓存器103接收到传输许可信号D118。
因此,输出缓存器103的容量基于下述确定:总线本身的数据传输能力,图像处理设备113相对于其它模块的数据传输优先级,共享总线接口单元105的这组其它模块119所需的数据传输数量,共享总线106的其它模块(位于总线接口单元105的另一侧,包括通用运算单元115、照相机接口单元116和外部存储器接口单元107等)所需的数据传输数量。例如,当需要存储32位×128数据时,输出缓存器103的容量为512字节。
通常,当其它模块119其中之一从存储器108接收或往存储器108发送数据时,输出缓存器103无法访问存储器108。通常,访问许可轮流地被赋予共享存储器108的各模块其中之一。因此,共享总线接口单元105的这组其它模块119的数目越大,输出缓存器103所需的容量越大。另外,共享总线106的其它模块的数目越大,输出缓存器103所需的容量越大。注意,例如当某一模块需要实时地处理数据时,该模块使用总线106的优先级变高。
因而,图11所示输出缓存器103通过使用读指针1101和写指针1102而用作FIFO。当数据1104被发送到随后的数据分布单元104时,读指针1101指示的点移位32位。当从数据组合单元102接收到组合数据1103时,写指针1102指示的点移位16位。当对缓存器的末端点执行读取或写入时,指针1101和1102均返回到起点,并且因此输出缓存器103用作环形缓存器。
图12为示出输出缓存器的操作的流程图。如图12所示,首先,从数据组合单元102接收的组合数据1103被累积(步骤S1201)。随后,当它们被累积到用于输出缓存器103的传输单元时(步骤S1202:是),输出缓存器103等待直至传输许可信号D118被接收。在该时期期间,来自数据组合单元102的组合数据1103被连续地累积。随后,当传输许可信号D118被接收时(步骤S1203:是),输出缓存器103发送数据1104(步骤S1204)。
<数据分布单元104的配置>
接着,以更详细方式说明数据分布单元104的配置。再次参考图1B,数据分布单元104包括地址生成单元109、输出格式指定单元110、数据分割单元111和数据分布调节单元112。此数据分布单元104具有如下机制,其用于根据由输出格式指定单元110指定的输出格式,例如,在此实施例中根据分布输出格式或组合输出格式,布置从输出缓存器103提供的组合数据,以及将布置的数据输出到总线接口单元105。
特别地,数据分布单元104中的数据分割单元111重新分割由数据组合单元102组合的组合数据,并且数据分布调节单元112将该数据重新调节到适合将数据输出到总线106的数据长度以及将重新调节的数据输出到总线接口单元105。
当处理的图像数据从图像处理设备113输出到存储器108时,需要指定输出目的地的存储器地址。对于组合输出格式的情形,需要输出一种类型的地址到总线接口单元105。另外,对于分布输出格式的情形,需要输出两种类型的地址到总线接口单元105。总线接口单元105根据此地址(或这些地址)通过总线106和外部存储器接口单元107将该数据传输到存储器108。
存储器地址(多个)由地址生成单元109生成。对于组合输出格式的情形,地址生成单元109针对连续地发送的输出数据生成一组完全连续地址。对于输出被分布(或重新布置)到两个或更多输出的分布输出方案,地址生成单元109生成两组或更多组完全连续地址。生成两组或更多组地址的方法的示例包括两组或更多组地址由两个或更多个地址生成单元单独地生成的方法,以及其中首先生成一组地址并通过将偏移值(多个)加到该组地址而生成另一组地址的方法。此实施例采用通过使用偏移值(多个)生成另一组地址的后一种方法。
<数据分布单元104的特定示例>
接着详细说明数据分布单元104的示例。图4示出数据分布单元104的示例。注意,在图4的说明中,模块或电路之间的连接线路由具有前缀″D″的标号表示。例如,输出缓存器103和选择器411之间的连接线路表示为″D4121″。另外,在如下假设上进行下述说明,以符号D4121为示例,符号D4121可以指输出缓存器103和选择器411之间的″连接线路″、通过此连接线路流动的″信号″以及通过此连接线路递送的″数据″中的任意一种。
首先,假设输出格式指定单元110指定组合输出格式,从输出缓存器103输出的数据通过连接线路D4121被直接发送到随后的选择器411。
<数据分割单元111的特定示例>
数据分割单元111在其中包括数据跳跃分割单元406。此数据分割单元111是用于分布输出格式的机制。典型地,从数据类型角度来说,数据组合单元102的数据和输出缓存器103布置的数据是处于阶梯石级状态(跳跃状态)。当此数据将被分割为两个输出时,它等效于将输入数据串分割为奇数数据和偶数数据。基于此,在此说明书中,术语″跳跃分割″是指从输出缓存器103收集数据并且根据输出类型分割所收集的数据。
接着说明数据分割单元111的操作。此处说明如下情形,其中如图5的标号501所指示,数据串{a1,b1,a2,b2}作为一个组合单元从输出缓存器103输入到数据跳跃分割单元406。标号501指示的数据为流过连接线路D4121和D4122的数据。出于与数据分布调节单元112(在下文描述)兼容的原因,每个数据a1、b1、a2和b2为8位的数据并且因而它们总共为32位的数据。数据跳跃分割单元406接收此数据串,将输入数据串分割为奇数数据和偶数数据,并且输出数据串{a1,a2}504和数据串{b1,b2}505。这些输出分别流过连接线路D4121和D4122并且分别被输入到缓存器4091和4092以及缓存器4093和4094。
<数据分布调节单元112的特定示例>
接着,说明数据分布调节单元112。数据分布调节单元112用作用于将数据重新布置成针对总线106预定义的位长度并且将重新布置的数据输出到总线接口单元105的装置。假设,如同上述示例那种情形,针对总线106预定义的位长度为32位。每个缓存器4091至4094均存储16位数据。输入输出开关控制单元405将开关控制信号D4081至D4084输出到缓存器4091至4094。
这种情况下,一对开关控制信号D4081和D4083或一对开关控制信号D4082和D4084交替地许可输入到缓存器4091和4092或者输入到缓存器4093和4094。每个缓存器4095和4096均可以存储32位数据。另外,缓存器4095和4096分别临时存储这对缓存器4091和4092的数据以及这对缓存器4093和4094的数据。选择器410选择由缓存器4095和4096保持的值的其中之一作为将被输出的值。此选择是根据输入开关信号D414而作出的。结果,由选择器410选择和输出由缓存器4095和4096保持的值的其中之一。
与针对每个输出数据类型提供输出缓存器的上述配置相比,此实施例仅仅需要用于这一个输出缓存器103的这些附加缓存器4091至4094。因此,需要安装的存储装置的容量小。特别地,假设例如如同上述示例的情形那样,输出缓存器103的容量为512字节,相关技术需要用于组合输出格式和分布输出格式其中每一个的输出缓存器。结果,相关技术需要输出缓存器的容量为1024字节。
与此不同,此实施例仅仅需要容量为512字节的一个输出缓存器103以及附加4个缓存器,每个缓存器由16位组成(总共8个字节)。也就是说,此实施例总共需要520个字节。换言之,此实施例使得有可能在组合方案和分布方案二者中输出数据而不增大作为输出缓存器103所需要的存储装置的容量。
选择器411控制组合输出201和分布输出202中的哪一个将被递送到总线接口单元105。根据输出格式指定单元110的设置执行此控制。也就是说,当输出格式指定单元110指定组合输出格式时,数据D4121被输出到连接线路D413。另外,当指定分布输出格式时,从选择器410发出的数据被输出到连接线路D413。
图6为针对输出格式为组合输出201格式的情形的时序图。行号600代表时间τ。在给定时间τ,从输出缓存器103递送的信号通过使用下标i和j表达,即表达为{ai,bi,aj,bj}(其中i=2τ‑1,j=2τ)。对于组合输出201的情形,从输出缓存器103输出的数据串被原样地输出。信号601代表流过连接线路D4121的数据,并且信号602代表流过连接线路D413的数据。
图7为针对输出格式为分布输出202格式的情形的时序图。标号700代表时间τ。另外,标号701代表流过连接线路D4122的信号(输出缓存器103的输出)。标号702和703分别代表来自数据跳跃分割单元406的输出D4071和D4072。标号704代表从输入输出开关控制单元405传播到缓存器4091的信号(流过连接线路D4081的信号);标号705代表从输入输出开关控制单元405传播到缓存器4092的信号(流过连接线路D4082的信号);标号709代表从输入输出开关控制单元405传播到缓存器4093的信号(流过连接线路D4083的信号);以及标号710代表从输入输出开关控制单元405传播到缓存器4094的信号(流过连接线路D4084的信号)。
当信号处于高电平时,写被许可,而当信号处于低电平时,写不被许可。标号706、707、711和712分别对应于由缓存器4091至4094保持的值。另外,标号708和713分别对应于由缓存器4095和4096保持的值。标号714代表从输入输出开关控制单元405流到选择器410的信号,并且对应于连接线路D414。当信号处于高电平时,缓存器4095的数据被输出到选择器410,而当信号处于低电平时,缓存器4096的数据被输出到选择器410。
在时间τ|[p1]=1时,从输出缓存器103输出的32位信号串{a1,b 1,a2,b2}被数据跳跃分割单元406分割成两个16位信号串{a1,a2}和{b1,b2},并且它们被分别输出到连接线路D4071(见702)和D4072(见703)。数据{a1,a2}被发送到缓存器4091和4092。然而,在此刻,由于输入许可信号通过连接线路D4081从输入输出开关控制单元405仅仅输出到缓存器4091(信号704为高),所以数据{a1,a2}仅仅存储于缓存器4091中。
在图7中,在时间τ=1时,数据{a1,a2}存储于标号706(缓存器4091)并且未反映在标号707中。类似地,数据{b1,b2}被发送到缓存器4093和4094。然而,由于输入仅仅针对标号709(连接线路D4083)被许可(高)而针对标号710(连接线路D4084)未被许可,所以数据仅仅存储于缓存器4093(对应于标号711)中。
在时间τ=2时,数据跳跃分割单元406从输出缓存器103接收数据串{a3,b3,a4,b4}。类似于上述数据串,此数据串被数据跳跃分割单元406分割成数据{a3,a4}和{b3,b4},并且它们分别被输出到连接线路D4071和D4072。至于到缓存器4091至4094的输出,来自输入输出开关控制单元405的信号与上文说明的信号反相。因此,由于流过连接线路D4082和D4084的信号变为高电平,数据{a3,a4}和{b3,b4}分别存储于缓存器4092和4094中。
当这对缓存器4091和4092以及这对缓存器4093和4094均被更新时,缓存器4095和4096也被更新。缓存器4095和4096的值分别由标号708和713代表。数据{a1,a2,a3,a4}和{b1,b2,b3,b4}分别存储于缓存器4095和4096中。
接着,这些对被连续地输出到总线接口单元105。标号714代表从输入输出开关控制单元405到选择器410的信号输入(流过连接线路D414的信号),并且标号715代表从选择器411至总线接口单元105的信号输入(流过连接线路D413的信号)。
对于分布输出202的情形,通过切换从输入输出开关控制单元405提供的信号D414(见714),32位数据{a1,a2,a3,a4}和{b1,b2,b3,b4}通过连接线路D413被连续地输出到总线接口单元(见715)。具体地,当信号D414处于高电平时,缓存器4095的数据从选择器410输出到随后的选择器411,而当信号D414处于低电平时,缓存器4096的数据从选择器410输出到随后的选择器411。
<地址生成单元109的特定示例>
接着,说明地址生成单元109。地址生成单元109根据输出格式指定单元110的设置而改变地址输出。具体地,基于选择器404的选择,当组合输出201格式被选择时,信号(连接线路)D4152被选择和输出。另外,当分布输出202格式被选择时,由输出格式指定单元110选择和输出信号D4151。通过由输入输出开关控制单元405交替地选择和输出信号D4151a和D4151b,生成用于两种格式的地址。
如上所述,在此示例中,通过使用特定的基础地址(下文中称为″基础地址″)和通过将偏移(多个)赋予此基础地址而获得的(多个)地址,实施多个地址输出。例如,假设基础地址为第一输出图像数据的存储器地址。标号402代表基础地址生成单元,并且偏移指定单元401输出将被加到由基础地址生成单元402生成的基础地址的偏移值。此偏移值由加法器411加到基础地址,以生成第二输出图像数据的地址(下文中称为″偏移地址″)。注意,偏移指定单元401和加法器411形成偏移赋予单元。
另一方面,当输出格式指定单元110的设置为组合输出201格式时,来自基础地址生成单元402的地址输出通过选择器404被原样地输出到总线接口单元105,该选择器404用作第二选择器(连接线路D4152)。此地址输出与从数据分布调节单元112的数据输出同步地执行。利用类似于此的配置,在组合输出201格式中,按照图2中标号204指示的映射,通过总线接口单元105和总线106将数据输出到存储器108。
对于分布输出202格式的情形,由用作第一选择器的选择器404交替地选择和输出从基础地址生成单元402输出的基础地址以及偏移地址,其中偏移地址通过将偏移指定单元401指定的偏移值加到基础地址而获得。结果,生成用于两个图像的地址。例如,在上述示例中,对于数据{a1,a2,a3,a4}的输出,基础地址与该数据同步地被输出到总线接口单元105。另外,对于数据{b1,b2,b3,b4}的输出,通过将偏移值加到基础地址而获得的偏移地址与该数据同步地被输出到总线接口单元105。此交替控制由输入输出开关控制单元405执行。利用类似于此的配置,在分布输出202格式中,按照图2中标号205和206指示的映射,通过总线接口单元105和总线106将数据输出到存储器108。
目前为止通过使用针对分布输出202图像处理设备113输出两种类型的数据的示例来说明此实施例。然而,在下述情形下也可以获得与此实施例的有利效果相似的有利效果:在所述情形中,通过采用与其中从图像处理单元101输出的数据被组合并输入到输出缓存器103且在调节输出定时之后将数据重新分布(或重新布置)或者原样地输出的实施例的配置类似的配置,输出类型的数目多于2。
另外,即使在数据分布单元104输出的数据类型的数目多于2的情形中,例如,在存在一个组合数据和两个分割的数据的情形中,通过生成具有不同值的两种类型的偏移值,偏移指定单元401可以生成两种类型的偏移地址,并且因而通过使用与图4所示配置基本类似的配置,使得可能输出多个类型的数据。
<本发明的第三实施例>
接着说明根据本发明的第三实施例。在此实施例中,第二实施例中的数据分布单元104的配置被修改。注意,其它配置类似于第二实施例的配置,并且因此省略对其的说明。
在此实施例中,图4所示第二实施例中的缓存器4091至4096被用于组合输出201格式和分布输出202格式二者。通过针对两种输出格式使用相同缓存器,这些缓存器可以用作总线106中用于数据分布的缓存器。
图8示出根据此实施例的数据分布单元104的细节,并且图9为示出数据分布单元104中缓存器的信号和值的时序图。类似于图4所示第二实施例,如图8所示,数据分布单元104包括数据跳跃分割单元804(对应于第二实施例中的数据跳跃分割单元406)和输入输出开关控制单元801(对应于第二实施例中的输入输出开关控制单元405)。地址生成单元109的配置类似于图4示出的第二实施例的配置。
在此实施例中,数据分割单元111包括数据连续分割单元802。在第二实施例中,对于组合输出201格式的情形,数据原样地从输出缓存器103输出。相比之下,在此实施例中,从输出缓存器103输出的数据被输入到数据连续分割单元802。
标号8061至8064代表选择器,每个所述选择器选择数据连续分割单元802的输出或者数据跳跃分割单元804的输出。在每个选择器8061至8064中,从输出格式指定单元110提供的输出格式指定信号指定将被选择的数据。对于组合输出201格式的情形,数据连续分割单元802的输出被选择和输出。另外,对于分布输出202格式的情形,来自数据跳跃分割单元804的输出被选择和输出。
缓存器8081‑8084分别对应于图4所示的缓存器4091至4094。每个缓存器8081‑8084具有16位的容量。另外,由输入输出开关控制单元801许可针对缓存器8081‑8084的数据输入/输出。当输出格式指定单元110的设置为分布输出202时,执行与上文参考图4说明的控制类似的控制。另外,此实施例中的信号D8071至D8074对应于第二实施例中的信号D4081至D4084。另外,此实施例中的缓存器8085和8086对应于第二实施例中的32位缓存器4095和4096。
选择器809的操作也类似于上文参考图4说明的选择器410的操作。因此,分布输出202格式中的时序图类似于图7所示的时序图。下面为时序图中的每个信号与图8所示的每个信号之间的关系:
701:来自输出缓存器103的信号D810;
702、703:来自数据跳跃分割单元804的输出D8051和D8052;
704、705:从输入输出开关控制单元801到缓存器8081和8082的信号D8071和D8072;
706、707、708:缓存器8081、8082和8085保持的数据;
709、710:从输入输出开关控制单元801到缓存器8083和8084的信号D8073和D8074;
711、712、713:缓存器8083、8084和8086保持的数据;
714:从输入输出开关控制单元801到选择器809的信号D812;以及
715:通过连接线路D811从数据分布单元104流到总线接口单元105的信号。
接着,说明针对组合输出201格式的配置。对于组合输出201格式的情形,使用数据连续分割单元802的输出。例如,数据连续分割单元802将接收为{a1,b1,a2,b2}的数据分割成数据{a1,b1}、{a2,b2},即分割成缓存器8081‑8084的单元(16位)并且将它们发送到缓存器8081‑8084(见902和903)。此示例中的连续分割是指根据其原始数据顺序分割上述数据{a1,b1,a2,b2}。
对于组合输出201格式的情形,从输入输出开关控制单元801发送到缓存器8081‑8084的写许可信号序列不同于分布输出202格式的写许可信号序列。要么针对这对信号D8071和D8072的写许可信号变为高电平,要么针对这对信号D8073和D8074的写许可信号变为高电平。也就是说,在这对信号D8071和D8072中或者在这对信号D8073和D8074中同时考虑来自选择器8061至8064的数据。在缓存器8081和8082均被更新的时刻,缓存器8085保持数据。另外,在缓存器8083和8084均被更新的时刻,缓存器8086保持数据。
图9示出在此实施例中针对组合输出201格式的时序图。下面为图8中的每个信号或缓存器值与图9所示的每个信号或缓存器值之间的关系:
900:时间τ;
901:输出缓存器103的输出信号D810;
902、903:信号D8031和D8032;
904、905:信号D8071和D8072;
909、910:信号D8073和D8074;
906、907、911和912:缓存器8081、8082、8083和8084保持的值;
908、913:缓存器8085和8086保持的值;
914:从输入输出开关控制单元801到选择器809的信号D812;以及
915:从选择器809输出的信号D811。
首先,在时间τ=1,信号{a1,b1,a2,b2}从输出缓存器103发出。该信号被数据连续分割单元802分割成信号{a1,b1}和{a2,b2},并且它们被分别输出连接线路D8031和D8032(见902和903)。
信号{a1,b1}被发送到缓存器8081和8083。然而,由于在从输入输出开关控制单元801提供的信号D8071和D8073中,仅仅信号D8071处于许可状态(见904和905),信号{a1,b1}仅仅被写入缓存器8081(见906的{a1,b1})。
类似地,信号{a2,b3}仅仅被写入缓存器8082。缓存器8081和8082中的数据被读出并且作为32位数据{a1,b1,a2,b2}写入缓存器8085(见908)。在图9中标号908指示的时序图中,对缓存器8085的写入不是在缓存器8081和8082均被更新的时刻开始。然而,这仅仅是因为此时序图被绘制为使得写定时与图7所示的分布输出202格式的定时吻合。因此,该写入可以在两个缓存器均被更新的时刻开始。
在时间τ=2,信号{a3,b3,a4,b4}从输出缓存器103发出。信号同样在数据连续分割单元802中也被分割成信号{a3,b3}和{a4,b4},并且它们被发送到缓存器8081‑8084。然而,在此时间,由于来自输入输出开关控制单元801的信号仅仅许可对缓存器8083和8084写入,缓存器8083和8084的值被更新(见911和912)。
此后,缓存器8083和8084的内容{a3,b3,a4,b4}被写入32位缓存器8086(见913)。在信号D812的控制下,由选择器809选择和输出缓存器8085和8086中保持的数据的其中之一,并且该数据通过连接线路D811被输出到总线接口单元105。标号914代表信号D812并且标号915代表流过连接线路D811流动的数据。当信号D812处于升高状态(在高电平),选择器809选择和输出缓存器8085的数据,而当信号D812处于降低状态(在低电平),选择器809选择和输出缓存器8086的数据。
类似于第一实施例,在此实施例中,当图像处理设备113针对一个图像数据计算多个图像数据时,多个计算结果被组合并且输入到输出缓存器。藉此,如在第一实施例的情形中那样,有可能最小化输出缓存器的数目的增大。另外,例如,数据分布单元14可以设置在输出缓存器后面,以使得组合数据可以被分布(分割)。在这样情况下,可以提供用于分割组合数据的装置、用于将由分割装置分割的数据调节到针对总线的单元的调节装置等。另外,可以由选择器选择输出组合数据还是输出分割的数据。另外,对于用于组合数据和分割数据的地址(多个),可以提供地址生成装置。例如,可以通过将偏移(多个)赋予基础地址而生成偏移地址(多个),并且恰当地选择基础地址或偏移地址,使得可以容易地生成组合数据或分割数据。
注意,在此实施例中说明了图像处理单元101输出两种类型数据的配置。然而,对于图像处理单元101输出三种或更多种类型数据的情形或者对于数据组合单元102输出的数目为1个或更多的情形,也可以应用本申请的构思。通过如此,基于类似构思也可以采用如下配置,其中输出缓存器103的输出被接收,而输出缓存器103的输出的数目小于图像处理单元101的输出的数目。
尽管已经从若干实施例描述了本发明,本领域技术人员将认识到,在所附权利要求书的精神和范围内,可以利用各种修改来实践本发明,并且本发明不限于上述的示例。
另外,权利要求书的范围不受上文描述的实施例限制。
此外注意,申请人的意图在于涵盖所有权利要求要素的等同物,即使随后在审查期间进行了修改。

半导体装置和图像处理方法.pdf_第1页
第1页 / 共30页
半导体装置和图像处理方法.pdf_第2页
第2页 / 共30页
半导体装置和图像处理方法.pdf_第3页
第3页 / 共30页
点击查看更多>>
资源描述

《半导体装置和图像处理方法.pdf》由会员分享,可在线阅读,更多相关《半导体装置和图像处理方法.pdf(30页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103176928 A (43)申请公布日 2013.06.26 CN 103176928 A *CN103176928A* (21)申请号 201210529893.X (22)申请日 2012.12.07 2011-268705 2011.12.08 JP G06F 13/18(2006.01) (71)申请人 瑞萨移动公司 地址 日本东京都 (72)发明人 浜崎博幸 中村淳 小池学 城户英彰 金川信康 (74)专利代理机构 北京市金杜律师事务所 11256 代理人 酆迅 庞淑敏 (54) 发明名称 半导体装置和图像处理方法 (57) 摘要 本发明涉及半导体装置和。

2、图像处理方法。根 据本发明, 一种图像处理设备包括 : 图像处理单 元, 其根据一个图像数据计算两种类型的图像数 据并且输出计算的图像数据 ; 数据组合单元, 其 组合从所述图像处理单元提供的两种类型的数据 并且向一个端子输出组合数据 ; 输出缓存器, 其 根据从用于仲裁总线的总线仲裁装置提供的指 令, 调节所述组合数据的输出定时 ; 以及数据分 布单元, 其根据外部组合分布指令, 以组合数据的 形式向所述总线输出从输出缓存器输出的组合数 据, 或者分布所述组合数据并且将分布的数据输 出到所述总线。 (30)优先权数据 (51)Int.Cl. 权利要求书 2 页 说明书 13 页 附图 14 。

3、页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书13页 附图14页 (10)申请公布号 CN 103176928 A CN 103176928 A *CN103176928A* 1/2 页 2 1. 一种半导体装置, 包括 : 图像处理单元, 其包括至少两个输出端子 ; 数据组合单元, 其组合来自所述图像处理单元的至少两个输出端子的数据, 并且向端 子输出组合数据, 该端子的数目小于所述图像处理单元的输出端子的数目 ; 输出缓存器, 其根据从用于仲裁总线的总线仲裁装置提供的指令, 调节所述组合数据 的输出定时 ; 以及 数据分布单元, 其根据外部组合分布指。

4、令, 以所述组合数据的形式向所述总线输出从 所述输出缓存器输出的所述组合数据, 或者分布所述组合数据并且向所述总线输出所分布 的数据。 2. 一种半导体装置, 包括 : 图像处理单元, 其包括至少两个输出端子 ; 数据组合单元, 其输出通过组合来自所述图像处理单元的所述至少两个输出端子的数 据而获得的组合数据 ; 输出缓存器, 其根据从用于仲裁总线的总线仲裁装置提供的指令, 调节所述组合数据 的输出定时, 所述输出缓存器的数目小于所述图像处理单元的所述输出端子的数目 ; 以及 数据分布单元, 其根据外部组合分布指令, 以组合数据的形式向所述总线输出从所述 输出缓存器输出的所述组合数据, 或者分。

5、布该组合数据并且向所述总线输出所分布的数 据。 3. 根据权利要求 1 所述的半导体装置, 其中针对所述数据组合单元的每个输出端子提 供所述输出缓存器。 4. 根据权利要求 1 所述的半导体装置, 其中所述数据分布单元包括 : 数据分割单元, 其分割从所述输出缓存器提供的所述组合数据 ; 以及 选择器, 其基于所述组合分布指令, 选择和输出所述组合数据或者由所述数据分割单 元分割的分割数据。 5. 根据权利要求 4 所述的半导体装置, 其中所述数据分布单元还包括地址生成单元, 其基于所述组合分布指令, 生成所述组合数据或所述分割数据的地址。 6. 根据权利要求 4 所述的半导体装置, 其中所述。

6、数据分布单元还包括数据分布调节单 元, 其将由所述数据分割单元分割的数据调节为预定大小。 7. 根据权利要求 5 所述的半导体装置, 其中所述地址生成单元包括 : 基础地址生成单元, 其生成基础地址 ; 偏移赋予单元, 其将偏移赋予所述基础地址 ; 以及 第一选择器, 其选择和输出由所述基础地址生成单元生成的所述基础地址以及通过在 偏移赋予单元中将所述偏移赋予所述基础地址而获得的偏移地址其中之一。 8. 根据权利要求 7 所述的半导体装置, 其中 所述图像处理单元针对一个像素生成至少两个计算结果, 以及 所述地址生成单元还包括赋予不同偏移值的多个类型的偏移赋予单元, 以及第二选择 器, 所述第。

7、二选择器选择是将所述基础地址和由所述多个偏移赋予单元生成的多个偏移地 址作为所述分割数据的分割地址输出, 还是将所述基础地址作为所述组合数据的组合地址 输出。 权 利 要 求 书 CN 103176928 A 2 2/2 页 3 9. 一种处理图像的方法, 所述方法包括 : 图像数据计算步骤, 用于通过使用图像处理单元计算至少两种类型的图像数据 ; 组合步骤, 用于组合在所述图像数据计算步骤中计算的所述至少两种类型的图像数 据 ; 缓存步骤, 用于向一个输出缓存器提供在所述组合步骤中组合的组合数据, 并且缓存 所述组合数据直至从总线仲裁装置发出输出许可 ; 以及 数据分布步骤, 用于基于组合分。

8、布指令, 以所述组合数据的形式向总线输出被许可从 所述输出缓存器输出的所述组合数据, 或者分布所述组合数据并且向所述总线输出所分布 的数据。 10. 根据权利要求 9 所述的方法, 其中所述数据分布步骤包括 : 数据分割步骤, 用于分割从所述输出缓存器提供的组合数据 ; 以及 输出步骤, 用于基于所述组合分布指令, 选择和输出所述组合数据或者在所述数据分 割步骤中分割的分割数据。 11. 根据权利要求 10 所述的方法, 其中所述数据分布步骤包括地址生成步骤, 用于基 于所述组合分布指令, 生成所述组合数据或者所述分割数据的地址。 12. 根据权利要求 11 所述的方法, 其中在所述地址生成步。

9、骤中, 所述组合数据和所述 分割数据的地址通过以下来生成 : 生成基础地址, 通过将偏移赋予所述基础地址来生成偏 移地址, 以及选择和输出所述基础地址和所述偏移地址其中之一。 13. 根据权利要求 12 所述的方法, 其中在所述地址生成步骤中, 通过将具有不同值的偏移赋予所述基础地址, 生成多个类型的偏移地址, 以及 根据所述组合分布指令, 将所述基础地址和所述多个偏移地址作为所述分割数据的分 割地址连续地输出, 或者将所述基础地址作为所述组合数据的组合地址输出。 14. 一种信息处理设备, 包括 : 存储器接口, 其连接到外部存储器 ; 半导体装置, 其通过总线连接到所述存储器接口 ; 总线。

10、仲裁单元, 其仲裁所述总线 ; 以及 通用运算单元, 其控制所述半导体装置, 其中所述半导体装置包括 : 图像处理单元, 其包括至少两个输出端子 ; 数据组合单元, 其组合来自所述图像处理单元的所述至少两个输出端子的数据, 并且 向端子输出组合数据, 该端子的数目小于所述图像处理单元的输出端子的数目 ; 输出缓存器, 其根据从仲裁所述总线的总线仲裁单元提供的指令, 调节所述组合数据 的输出定时 ; 以及 数据分布单元, 其根据从所述通用运算单元提供的组合分布指令, 以所述组合数据的 形式向所述总线输出从所述输出缓存器提供的所述组合数据, 或者分布所述组合数据并且 向所述总线输出所分布的数据。 。

11、15. 根据权利要求 14 所述的信息处理设备, 还包括连接到外部图像拾取装置的照相机 接口。 权 利 要 求 书 CN 103176928 A 3 1/13 页 4 半导体装置和图像处理方法 0001 相关申请的交叉引用 0002 本申请基于在 2011 年 12 月 8 日提交的日本专利申请 No.2011-268705, 并且主张 该日本专利申请的优先权利益, 该日本专利申请的公开内容通过引用全部结合于此。 技术领域 0003 本发明涉及适合于例如汽车导航系统等的半导体装置和图像处理方法。 背景技术 0004 在诸如汽车导航设备 ( 下文中也简单地称为车辆导航 ) 的车载信息终端中, 期。

12、望处理更高质量的多媒体并且展现更高质量的图形性能。结果, 安装在车载信息终端的 半导体装置, 诸如 SoC( 片上系统 ), 需要具有更高性能图像处理功能, 并且因此各式各样的 研究和发展正在进行之中。日本未审专利申请公开 No.2002-204347、 日本未审专利申请公 开 No.2005-11520 以及日本专利 No.2827258 公开了与图像处理有关的技术。 发明内容 0005 本申请的发明人已经发现, 在具有图像处理功能的半导体装置的研发中有各种问 题有待解决。 本申请中公开的每个实施例提供了一种具有高质量图像处理功能的半导体装 置以及一种图像处理方法。 0006 通过本说明书和。

13、附图的下述描述, 将理解更多的细节特征。 0007 本发明的第一方面为一种包括输出缓存器的半导体装置。 0008 本发明的另一方面为一种信息处理设备, 其包括 : 包括输出缓存器的半导体装置 ; 以及总线, 其执行此半导体装置和外部或内部存储器之间的数据交换。 0009 本发明能够提供一种具有高质量图像处理功能的半导体装置以及一种图像处理 方法。 附图说明 0010 通过结合附图对某些实施例的下述描述, 上述及其它方面、 优点和特征将更加清 楚, 在附图中 : 0011 图 1A 为示出根据本发明第一实施例的半导体装置的概念图示 ; 0012 图 1B 为示出其上安装有根据本发明第二实施例的半。

14、导体装置的系统 LSI 的框 图 ; 0013 图 2 为用于说明在针对一个像素计算两个或更多个数据的情况下的存储器映射 的图示 ; 0014 图 3 示出包括图像处理单元、 存储器和通用运算单元的系统 LSI 的示例 ; 0015 图 4 示出数据分布单元 104 的特定示例 ; 0016 图 5 为用于说明数据分割单元 111 的操作的图示 ; 说 明 书 CN 103176928 A 4 2/13 页 5 0017 图 6 为示出输出格式为组合输出 201 格式的情形的时序图 ; 0018 图 7 为示出从数据分割单元 111 到数据分割调节单元 112 的定时的时序图 ; 0019 图。

15、 8 示出根据本发明第三实施例的数据分布单元 104 的细节 ; 0020 图 9 为示出数据分布单元 104 中的信号和缓存器的值的时序图 ; 0021 图 10 示出数据组合单元 102 的配置的示例 ; 0022 图 11 示出输出缓存器的配置的示例 ; 0023 图 12 为示出输出缓存器的操作的流程图 ; 以及 0024 图 13A 至 13C 为用于说明图像处理单元的数据输出方法的图示, 并且示出多个数 据被输出的情形(分布输出)、 多个数据被联合地输出的情形(组合输出)以及可以分别处 理分布输出和组合输出的情形。 具体实施方式 0025 在下文中, 参考附图来说明应用本发明的特定。

16、实施例。 在所有附图中, 相同的标记 被指派给相同的部件, 并且为了使说明清晰而适当地省略了对它们的重复说明。 0026 0027 存在这样的情形, 其中期望在针对一个输入图像执行某个处理时, 从该一个图 像获得多个图像输出。例如, 存在这样的情形, 其中期望从一个输入图像获得 : 通过在 纵向方向上对输入图像微分获得的一个图像, 以及通过在横向方向上对输入图像微分 获得的另一个图像。作为另一示例, 在哈里斯 (Harris) 角点检测中 ( 参见 Masatoshi OKUTOMI, Masao SHIMIZU 等人的 Digital Image Processing Computer Gr。

17、aphic Arts Society(CG-ARTS Society)2004), 需要获得一个输入图像的三个输出值, 这些输出值包 括纵向微分的平方, 横向微分的平方以及纵向微分和横向微分的乘积作为该计算的中间 值。 0028 图 2 为用于说明在针对一个像素计算两个或更多个数据的情况下存储器映射的 图示。在类似于此的情况下, 作为如图 2 所示的输出方案, 存在两个可能方案, 所述可能方 案包括 : 其中多个输出值a和b作为一个像素被连续地布置和输出的方案(下文中 此输出方案称为组合输出 ( 图 2 中 201), 以及其中它们作为不同图像 a和 b 被输出的方案 ( 下文中此输出方案称为。

18、分布输出 ( 图 2 中 202)。注意, 对于组合输 出 201 的情形, 存储器 203 上的映射变为映射 204。另外, 对于分布输出 202 的情形, 存储器 203 上的映射变为映射 205 和 206。 0029 作为在组合输出格式中生成的图像的示例, 存在这样的情形, 其中像素值的颜色 分量按照 B( 蓝 )、 G( 绿 ) 和 R( 红 ) 的顺序针对每个像素被存储在存储器上, 如同位图图像 格式的情形那样。 0030 图 2 所示的上述组合输出 201 和分布输出 202 中的每种具有下述优点和缺点。首 先, 当多个输出 ( 在此示例中假设输出数据的数目为 2) 被联合地计算。

19、时, 组合输出方案是 有利的。图 3 示出包括图像处理单元、 存储器和通用运算单元的系统 LSI 的示例。如图 3 所示, 系统 LSI 300 包括图像处理硬件 301、 具有高速缓存器 305 的通用运算单元 302、 以及 外部存储器 303。另外, 这些部件共享总线 304。 0031 在组合输出中, 两个数据被连续地布置。因此, 当它们由图 3 所示的通用运算单元 说 明 书 CN 103176928 A 5 3/13 页 6 302 计算时, 高速缓存器 305 的命中率高并且因而计算效率高。另外, 当它们由图像处理硬 件 301 处理时, 用于控制输入地址的机制比用于分布输出的机。

20、制简单。这是因为两个数据 被组合和存储在一个数据区域中。例如, 对于图 2 所示示例的情形, 在分布输出中, 由于图 像数据存储于两个不同地址区域中, 需要用于控制地址的两个机制。 0032 另一方面, 即使当输出值其中之一被连续地使用, 两个输出值通常都被读出, 因为 这两个输出被连续地布置在存储器空间中。因此, 图像处理硬件 301 或通用运算单元 302 与存储器 303 之间的数据传输的效率劣化。输出的数目越大, 这个问题变得越严重。然而, 如上所述, 当期望仅仅处理输出值其中一个时, 或者当期望各输出值单独被处理时, 分布输 出方案是优选的。 同时, 当期望各输出被联合地处理时, 分。

21、布输出方案的效率与组合输出方 案相比较差。 0033 因此, 作为本申请的发明人进行辛勤研究的结果, 已经发现一种具有如下图像处 理功能的半导体装置, 该图像处理功能能够按照可根据用户目的而选择性地使用这两种功 能的方式来实现这两种功能。 0034 0035 首先, 为了使本发明容易被理解, 下文中说明比较示例图像处理设备执行的数 据输出方法。在下述说明中, 在时间 t 彼此同步地从图像处理单元输出的两种类型数据 用 at和 bt表示。 0036 图 13A 至 13C 的图示用于说明由图像处理单元执行的数据输出方法, 并且示出多 个数据被输出的情形 ( 分布输出 )、 多个数据被联合地输出的。

22、情形 ( 组合输出 ), 以及可以 分别处理分布输出和组合输出的情形。下述说明是在这样的假设上进行 : 图像处理单元 1301 针对一个像素计算两个计算结果 ( a和 b )。 0037 图 13A 至 13C 所示图像处理单元 1301 针对一个像素计算并且输出例如计算结 果 a和 b, 每个计算结果由 8 位组成。每个输出缓存器 1305、 1307 和 1309 连接到 具有 16 位总线宽度的总线, 并且在将其布置到 16 位的传输单元中之后将输出数据输出。 0038 首先, 如图 13A 所示, 当图像处理单元 1301 原样地输出计算结果时, 即, 对于分布 输出的情形, 需要准备。

23、两个输出缓存器 1305 和 1307 来输出这些计算结果。与此不同, 如图 13B 所示, 当图像处理单元 1301 包括数据组合单元 1303 时, 输出数据被数据组合单元 1303 转换成组合数据(由a和b组成的16位), 并且因而使得可能将输出缓存器的数目 减小为 1, 即 1 个输出缓存器 1309。每个输出缓存器 1305、 1307 和 1309 均将数据输出到具 有 16 位的相同总线宽度的总线, 并且因而它们具有相同存储器容量。也就是说, 它们是有 相同大小的输出缓存器。 0039 如先前所述, 取决于图像处理类型, 组合输出在一些情形中会是优选的, 而分布输 出在另外情形中。

24、会是优选的。因此, 理想地, 图像处理设备应具有这两种输出功能。因此, 如图 13C 所示, 该配置被形成为具有数据组合单元 1303, 并且包括 : 当图像处理单元 1301 的两个输出将去往输出缓存器 1305 和 1307 时输出它们所通过的数据路径 ( 日本专利 No.2827258), 以及在其中数据组合单元 1303 对数据进行组合并且组合数据被输出到输出 缓存器 1309 的数据路径。 0040 也就是说, 该配置可以按下述方式形成。 为了具有分布输出功能, 输出缓存器设于 用于每个输出类型 ( 数目 ) 的存储器和硬件之间。另外, 为了具有组合输出功能, 组合单元 说 明 书 。

25、CN 103176928 A 6 4/13 页 7 设于输出缓存器前面, 使得数据被组合并且随后组合数据被输出到输出缓存器。 0041 利用此配置, 图像处理设备可以执行分布输出和组合输出二者。 然而, 此配置需要 具有 16 位的相同总线宽度的三个输出缓存器, 并且因而导致存储器容量、 电路尺寸和成本 增加的问题。 0042 0043 因此, 本申请的发明人发现了一种具有如下图像处理功能的半导体装置, 该图像 功能能够针对组合输出方案或者针对分布输出方案输出处理结果, 而不增加输出缓存器的 数目。图 1A 为示出根据本发明第一实施例的半导体装置的示意图。 0044 如图 1A 所示, 半导体。

26、装置包括图像处理单元 11、 数据组合单元 12、 输出缓存器 13 和数据分布单元 14。类似于上文参考图 13A 至 13C 说明的图像处理单元 1301, 图像处理单 元 11 针对一个像素输出两个 8 位计算结果 a和 b。数据组合单元 12 组合从图像 处理单元的两个输出端子输出的数据 a和 b, 并且将由总共 16 位组成的组合数据 输出到输出缓存器 13。输出缓存器 13 根据来自用于仲裁总线的总线仲裁装置 ( 未示出 ) 的指令, 调节组合数据的输出定时, 并且由此在根据来自总线仲裁装置的指令的定时, 将组 合数据输出到数据分布单元 14。数据分布单元 14 根据外部组合分布指。

27、令, 将从输出缓存 器13提供的组合数据按照原样作为16位数据输出到总线(未示出), 或者将组合数据分布 ( 或重新布置 ) 为 16 位数据并且将分布的数据输出到总线。 0045 以此方式, 从图像处理单元 ( 图像处理硬件 )11 输出的多个输出结果被临时组合 ( 布置 ) 并且传输到随后的输出缓存器 13, 并且组合数据进一步从输出缓存器 13 传输到随 后的数据分布单元14。 随后, 该组合数据以组合数据的形式被发送到总线, 或者根据用途被 再次分割并且作为分布数据发送。因而, 有可能将数据调节成有效数据长度。另外, 包括组 合、 缓存和分割的这一系列过程在不使用外部存储器的情况下执行。

28、, 并且因而不使用总线 带宽。 0046 也就是说, 在此实施例中, 多个数据被临时组合从而被发送到输出缓存器 13, 而与 输出格式为分布输出格式还是组合输出格式无关。另外, 用于根据输出格式重新分布 ( 或 重新布置 ) 数据的装置设于输出缓存器 13 之后。结果, 有可能在小区域中实施输出缓存器 13 的机制。另外, 通过提供数据分布单元 14, 有可能以两种输出格式输出处理结果。此外, 由于该过程的执行不使用外部存储器, 因此可以以组合输出格式或者以分布输出格式执行 输出过程, 而不增大存储器和图像处理硬件之间的数据传输数量 / 数据处理时间。 0047 0048 接着说明根据本发明的。

29、第二实施例的半导体装置。图 1B 为示出其上安装有根据 本发明的第二实施例的半导体装置的系统 LSI 的框图。此系统 LSI 100 例如可以应用到诸 如汽车导航系统的图像处理设备。 0049 如图 1B 所示, 在系统 LSI 100 中, 图像处理设备 113、 通用运算单元 115、 连接到照 相机 117 的照相机接口单元 116、 连接到存储器 108 的外部存储器接口单元 107、 以及一组 其它模块 119 连接到总线 106, 使得它们彼此连接。在图 1B, 图像处理设备 113 和这组其它 模块 119 通过总线接口单元 105 连接到总线 106, 并且它们的数据传输的定时。

30、由此被调节。 也就是说, 总线接口单元 105 用作总线仲裁装置。 0050 注意, 通用运算单元 115、 照相机接口单元 116 和外部存储器接口单元 107 的每一 说 明 书 CN 103176928 A 7 5/13 页 8 个可包括在该单元与总线 106 之间的总线仲裁装置, 使得它们对存储器 108 的访问定时也 可以被仲裁。 0051 根据此实施例的图像处理设备 113 包括 : 图像处理单元 101, 其包括两个输出端 子 ; 数据组合单元 102, 其组合来自图像处理单元 101 的两个输出端子的数据, 并且将组合 数据输出到一个端子 ; 输出缓存器 103, 其根据从用于。

31、仲裁总线的总线仲裁装置 ( 此示例中 总线接口单元 105) 提供的传输许可信号 D 118, 来调节组合数据的输出定时 ; 以及数据分 布单元 104, 其根据外部组合分布指令, 将从输出缓存器 103 提供的组合数据以组合数据的 形式输出到总线106(总线接口单元105), 或者分布(或重新布置)该组合数据并且将分布 的数据输出到总线 106( 总线接口单元 105)。 0052 注意, 图像处理单元 101 的输出端子的数目, 即作为计算结果的数据输出的数目 不限于 2 个, 并且可以是 3 个或更多。数据组合单元 102 组合从图像处理单元 101 输出的 输出数据并且由此生成组合数据。

32、, 该组合数据的数目小于图像处理单元 101 的输出端子的 数目。另外, 数据组合单元 102 将组合数据输出到输出缓存器 103。输出缓存器 103 被单 独地提供给数据组合单元 102 的每个输出端子。由于数据组合单元 102 生成组合数据, 所 以输出缓存器 103 的数目可以减少。例如, 当图像处理单元 101 执行复杂操作并且由此针 对一个像素的生成四个处理结果时, 四个数据被输入数据组合单元 102。然而, 当这些数据 被组合到一个组合数据中时, 所需的输出缓存器 103 的数目为 1 个。当这些数据被组合到 两个组合数据中时, 所需的输出缓存器 103 的数目为 2 个。另外, 。

33、当这些数据被组合到三个 组合数据中时, 所需的输出缓存器 103 的数目为 3 个。在这些情形的任何一个中, 通过在数 据组合单元 102 处生成组合数据, 有可能将输出缓存器 103 的数目减少到比图像处理单元 101 的输出小的数目, 即小于 4 的数目。 0053 总线接口单元 105 除了连接到图像处理设备 113 之外, 还连接到这组其它模块 119, 并且通过参考每个模块的优先顺序等来执行对向总线的数据传输的仲裁。近年来, 通 过总线 106 连接到存储器 108 的模块的数目正在增大。因此, 总线接口单元 105 执行如下 过程, 该过程例如用于提高执行需实时执行处理的模块的优先。

34、级。 0054 随着近年来模块数目增大, 每个模块在执行向存储器 108 的数据传输之前保持等 待的等待时间也变得更长。因此, 每个图像处理设备 113 和这组其它模块 119 要求输出缓 存器容量对于类似于此的等待时间是足够的, 并且因而导致电路尺寸变得更大的问题。然 而, 如上所述, 在此实施例中, 由于数据组合单元 102 组合图像处理单元 101 的输出数据并 且将组合数据输出到一个输出端子, 因此所需的输出缓存器 103 的数目为仅仅一个。另外, 此组合数据按原样被输出, 或者由随后的数据分布单元 104 作为分布数据输出。因此, 可以 通过提供仅仅一个输出缓存器 103 来执行该输。

35、出过程, 而与输出格式是组合输出格式还是 分布输出格式无关。 0055 另外, 此实施例不限于图 1B 所示配置。例如, 照相机 117 可以直接连接到图像处 理设备 113, 或者图像处理设备 113 可以配备有照相机 117。另外, 图像处理设备 113 可以 连接到总线而在它们之间没有插入总线接口单元105。 在这样情况下, 可以提供用于仲裁从 每个模块向总线的数据输出定时的仲裁装置。 0056 0057 接着, 说明图像处理设备 113 的内部配置。图像处理设备 113 读取存储器 108 中 说 明 书 CN 103176928 A 8 6/13 页 9 存储的图像数据, 并且在图像。

36、处理单元 101 中执行特定计算。假设在此计算中, 图像处理单 元 101 在每个时间单位输出多个计算结果 ( 例如图 2 中 “a1” 和 “b1” )。此时间单位例如 基于图像处理单元101的操作频率来确定。 假设操作频率为100MHz并且图像处理单元101 可以在每个周期输出计算结果, 则时间单位为 10ns。然而, 根据此实施例的配置, 图像处理 单元 101 不一定需要在每个周期输出计算结果。 0058 通过随后的数据组合单元 102、 输出缓存器 103 和数据分布单元 104, 图像处理设 备 113 按照组合输出格式或者按照分布输出格式, 选择性地将处理结果输出到存储器 108。

37、。 0059 0060 随后的数据组合单元 102 接收上述多个计算结果并且将这些多个计算结果的群 组作为一个传输单元输出到随后的输出缓存器 103。例如, 假设每个输出由 8 位组成, 数据 “a1” 和 “b1” 在时间 t 2 从图像处理单元 101 输出。随后, 数据组合单元 102 将这些数据 “a1” 和 “b1” 一起放置在 16 位数据中, 并且将该 16 位数据发送到输出缓存器 103。 0061 图 10 示出数据组合单元 102 的配置的示例。如图 10 所示并且如上所述, 对于 8 位数据一起放置在 16 位数据中并且作为 16 位数据输出的情形, 数据组合单元 102。

38、 可以由 两个触发器 1001 形成。也就是说, 多个数据由多个触发器 1001 接收。随后, 它们被一起放 置在组合数据中, 并且该组合数据被输出到随后的输出缓存器 103。 0062 0063 接着, 说明输出缓存器 103。根据此实施例的输出缓存器 103 起到下述两个作用。 第一个作用是在总线 106 拥堵时, 采用类似 FIFO 的配置, 并且由此使数据等待被分布。这 种情况下, 输出缓存器 103 例如从总线接口单元 105 接收传输许可信号 D118, 并且由此将 该数据输出到随后的数据分布单元 104。第二个作用是将从数据组合单元 102 接收的数据 ( 下文中也称为组合数据 。

39、) 重新布置到用于总线 106 的数据传输单元中。假设针对总 线 106 的数据传输单元为 32 位, 则输出缓存器 103 将从数据组合单元 102 接收的两个组 合数据放置在一起, 并且将该组合数据发送到随后的数据分布单元 104。例如, 输出缓存器 103 将接收的数据 a1, b1 和 a2, b2 一起放置在 32 位数据 a1, b1, a2, b2 中, 并且将 该 32 位组合数据发送到随后的数据分布单元 104。 0064 接着, 以更详细方式说明输出缓存器 103。图 11 示出以 32 位数据传输单元发送 / 接收数据的输出缓存器的配置的示例。此输出缓存器 103 可以例。

40、如由多个 FIFO 形成。另 外, 输出缓存器103临时存储从数据组合单元102递送的组合数据1103。 随后, 当数据长度 与用于总线106传输的单元相等并且从总线接口单元105接收到指示传输被许可的传输许 可信号 D118 时, 输出缓存器 103 将数据长度与用于传输的单元相等的数据 1104 发送到随 后的数据分布单元 104。 0065 此输出缓存器 103 通过连接线路连接到总线接口单元 105, 传输许可信号 D118 通 过该连接线路被接收。另外, 在接收到如上所述的传输许可信号 D118 时, 输出缓存器 103 从读指针 1101 指示的点读取 32 位信号, 并且将此读取。

41、的数据 1104 发送到随后的数据分布 单元 104。以此方式, 输出缓存器 103 需要存储从数据组合单元 102 发送的 16 位组合数据 1103, 直至输出缓存器 103 接收到传输许可信号 D118。 0066 因此, 输出缓存器 103 的容量基于下述确定 : 总线本身的数据传输能力, 图像处理 设备 113 相对于其它模块的数据传输优先级, 共享总线接口单元 105 的这组其它模块 119 说 明 书 CN 103176928 A 9 7/13 页 10 所需的数据传输数量, 共享总线 106 的其它模块 ( 位于总线接口单元 105 的另一侧, 包括通 用运算单元 115、 照。

42、相机接口单元 116 和外部存储器接口单元 107 等 ) 所需的数据传输数 量。例如, 当需要存储 32 位 128 数据时, 输出缓存器 103 的容量为 512 字节。 0067 通常, 当其它模块 119 其中之一从存储器 108 接收或往存储器 108 发送数据时, 输 出缓存器103无法访问存储器108。 通常, 访问许可轮流地被赋予共享存储器108的各模块 其中之一。因此, 共享总线接口单元 105 的这组其它模块 119 的数目越大, 输出缓存器 103 所需的容量越大。另外, 共享总线 106 的其它模块的数目越大, 输出缓存器 103 所需的容量 越大。注意, 例如当某一模。

43、块需要实时地处理数据时, 该模块使用总线 106 的优先级变高。 0068 因而, 图11所示输出缓存器103通过使用读指针1101和写指针1102而用作FIFO。 当数据 1104 被发送到随后的数据分布单元 104 时, 读指针 1101 指示的点移位 32 位。当从 数据组合单元 102 接收到组合数据 1103 时, 写指针 1102 指示的点移位 16 位。当对缓存器 的末端点执行读取或写入时, 指针 1101 和 1102 均返回到起点, 并且因此输出缓存器 103 用 作环形缓存器。 0069 图12为示出输出缓存器的操作的流程图。 如图12所示, 首先, 从数据组合单元102 。

44、接收的组合数据 1103 被累积 ( 步骤 S1201)。随后, 当它们被累积到用于输出缓存器 103 的 传输单元时 ( 步骤 S1202 : 是 ), 输出缓存器 103 等待直至传输许可信号 D118 被接收。在该 时期期间, 来自数据组合单元 102 的组合数据 1103 被连续地累积。随后, 当传输许可信号 D118 被接收时 ( 步骤 S1203 : 是 ), 输出缓存器 103 发送数据 1104( 步骤 S1204)。 0070 0071 接着, 以更详细方式说明数据分布单元104的配置。 再次参考图1B, 数据分布单元 104包括地址生成单元109、 输出格式指定单元110、。

45、 数据分割单元111和数据分布调节单元 112。此数据分布单元 104 具有如下机制, 其用于根据由输出格式指定单元 110 指定的输出 格式, 例如, 在此实施例中根据分布输出格式或组合输出格式, 布置从输出缓存器 103 提供 的组合数据, 以及将布置的数据输出到总线接口单元 105。 0072 特别地, 数据分布单元 104 中的数据分割单元 111 重新分割由数据组合单元 102 组合的组合数据, 并且数据分布调节单元 112 将该数据重新调节到适合将数据输出到总线 106 的数据长度以及将重新调节的数据输出到总线接口单元 105。 0073 当处理的图像数据从图像处理设备 113 输。

46、出到存储器 108 时, 需要指定输出目的 地的存储器地址。对于组合输出格式的情形, 需要输出一种类型的地址到总线接口单元 105。 另外, 对于分布输出格式的情形, 需要输出两种类型的地址到总线接口单元105。 总线 接口单元 105 根据此地址 ( 或这些地址 ) 通过总线 106 和外部存储器接口单元 107 将该数 据传输到存储器 108。 0074 存储器地址 ( 多个 ) 由地址生成单元 109 生成。对于组合输出格式的情形, 地址 生成单元 109 针对连续地发送的输出数据生成一组完全连续地址。对于输出被分布 ( 或重 新布置 ) 到两个或更多输出的分布输出方案, 地址生成单元 。

47、109 生成两组或更多组完全连 续地址。 生成两组或更多组地址的方法的示例包括两组或更多组地址由两个或更多个地址 生成单元单独地生成的方法, 以及其中首先生成一组地址并通过将偏移值 ( 多个 ) 加到该 组地址而生成另一组地址的方法。此实施例采用通过使用偏移值 ( 多个 ) 生成另一组地址 的后一种方法。 说 明 书 CN 103176928 A 10 8/13 页 11 0075 0076 接着详细说明数据分布单元 104 的示例。图 4 示出数据分布单元 104 的示例。注 意, 在图4的说明中, 模块或电路之间的连接线路由具有前缀D的标号表示。 例如, 输出 缓存器103和选择器411之。

48、间的连接线路表示为D4121。 另外, 在如下假设上进行下述 说明, 以符号 D4121 为示例, 符号 D4121 可以指输出缓存器 103 和选择器 411 之间的连接 线路、 通过此连接线路流动的信号以及通过此连接线路递送的数据中的任意一 种。 0077 首先, 假设输出格式指定单元110指定组合输出格式, 从输出缓存器103输出的数 据通过连接线路 D4121 被直接发送到随后的选择器 411。 0078 0079 数据分割单元 111 在其中包括数据跳跃分割单元 406。此数据分割单元 111 是用 于分布输出格式的机制。典型地, 从数据类型角度来说, 数据组合单元 102 的数据和。

49、输出缓 存器103布置的数据是处于阶梯石级状态(跳跃状态)。 当此数据将被分割为两个输出时, 它等效于将输入数据串分割为奇数数据和偶数数据。 基于此, 在此说明书中, 术语跳跃分 割是指从输出缓存器 103 收集数据并且根据输出类型分割所收集的数据。 0080 接着说明数据分割单元111的操作。 此处说明如下情形, 其中如图5的标号501所 指示, 数据串 a1, b1, a2, b2 作为一个组合单元从输出缓存器 103 输入到数据跳跃分割单 元 406。标号 501 指示的数据为流过连接线路 D4121 和 D4122 的数据。出于与数据分布调 节单元 112( 在下文描述 ) 兼容的原因, 每个数据 a1、 b1、 a2 和 b2 为 8 位的数据并且因而它 们总共为 32 位的数据。数据跳跃分割单元 406 接收此数据串, 将。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1