图像提取设备和图像提取方法.pdf

上传人:1*** 文档编号:1097297 上传时间:2018-03-31 格式:PDF 页数:20 大小:779.92KB
返回 下载 相关 举报
摘要
申请专利号:

CN200910133711.5

申请日:

2009.04.01

公开号:

CN101557454A

公开日:

2009.10.14

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):H04N 1/387申请日:20090401|||公开

IPC分类号:

H04N1/387; G06T7/00

主分类号:

H04N1/387

申请人:

富士施乐株式会社

发明人:

福永正和

地址:

日本东京

优先权:

2008.4.9 JP 2008-101861

专利代理机构:

北京天昊联合知识产权代理有限公司

代理人:

陈 源;张天舒

PDF下载: PDF下载
内容摘要

本发明涉及一种图像提取设备和图像提取方法。图像提取方法包括:获取扫描图像;生成所获取的扫描图像的二进制图像并检测在生成的二进制图像中的相连像素;为检测到的相连像素设置外接矩形;针对外接矩形的每条边,在垂直于边的方向上进行扫描以检测边缘像素,其中扫描从线上的多个点开始,并且所述线从相连像素与边相接触的接触点向该边的一个顶点延伸;判定检测到的边缘像素是否处于在扫描图像中再现的对象的轮廓部分中;根据被判定为处于对象的轮廓部分中的边缘像素来设置矩形区域;和从所设置的矩形区域中提取图像。

权利要求书

1.  一种图像提取设备,包括:
图像获取部分,其获取通过扫描对象所得到的扫描图像;
检测部分,其生成所获取的扫描图像的二进制图像并检测所生成的二进制图像中的相连像素;
外接矩形设置部分,其为检测部分所检测到的相连像素设置外接矩形;
边缘像素检测部分,其针对外接矩形的每条边,以垂直于边的方向进行扫描以检测边缘像素,其中扫描从线上的多个点开始,所述线从相连像素与边相接触的接触点向该边的一个顶点延伸;
判定部分,其判定由边缘像素检测部分检测到的边缘像素是否处于在扫描图像中再现的对象的轮廓部分中;
矩形区域设置部分,其基于被判定为处于对象的轮廓部分中的边缘像素来设置矩形区域;和
图像提取部分,其从矩形区域设置部分所设置的矩形区域中提取图像。

2.
  如权利要求1所述的图像提取设备,
其中判定部分判定所检测到的边缘像素之中处在超出了外接矩形对角线的位置处的边缘像素没有处于对象的轮廓部分中。

3.
  如权利要求1所述的图像提取设备,
其中判定部分判定所检测到的边缘像素之中与相邻边缘像素的距离大于阈值的边缘像素没有处于对象的轮廓部分中。

4.
  如权利要求1所述的图像提取设备,
其中判定部分判定在所检测到的边缘像素从接触点向一个顶点接近的过程中与边的距离减小的边缘像素没有处于对象的轮廓部分中。

5.
  如权利要求1所述的图像提取设备,
其中所述一个顶点是所述边的顶点中距离接触点更远的顶点。

6.
  如权利要求1所述的图像提取设备,还包括:
倾斜计算部分,其根据作为处于对象轮廓部分中的像素的边缘像素的位置坐标,来计算由作为处于对象轮廓部分中的像素的边缘像素所构成的至少三条或更多线段的倾斜,
其中矩形区域设置部分根据计算出的线段的倾斜的一致性来设置矩形区域。

7.
  如权利要求1所述的图像提取设备,还包括:
另一个倾斜计算部分,其对所检测到的相连像素与外接矩形之间的倾斜进行检测,
其中,当所检测到的倾斜大于预定值时,由边缘像素检测部分、判定部分和矩形区域设置部分执行处理。

8.
  如权利要求1所述的图像提取设备,
其中所述对象是矩形文件图像。

9.
  一种图像提取方法,包括:
获取通过扫描对象所得到的扫描图像;
生成所获取的扫描图像的二进制图像,并检测所生成的二进制图像中的相连像素;
为检测到的相连像素设置外接矩形;
针对外接矩形的每条边,在垂直于边的方向上进行扫描以检测边缘像素,其中扫描从线上的多个点开始,所述线从相连像素与边相接触的接触点向该边的一个顶点延伸;
判定检测到的边缘像素是否处于在扫描图像中再现的对象的轮廓部分中;
基于被判定为处于对象的轮廓部分中的边缘像素来设置矩形区域;和
从所设置的矩形区域中提取图像。

说明书

图像提取设备和图像提取方法
技术领域
本发明涉及图像提取设备和图像提取方法。
背景技术
已经提出了很多技术,用以从通过同时扫描一个或多个文件而得到的扫描图像中分离并提取每个文件图像。例如,专利文献1(专利号为7,058,22的美国专利)公开了这样一种技术,其在通过霍夫变换得到的备选线组合的基础上设置矩形区域,然后从矩形区域中提取每个文件的图像。另外,专利文献2(专利号为6,298,157的美国专利)公开了一种沿着从扫描图像检测到的边缘搜索矩形区域并随后从搜索到的矩形区域提取文件图像的技术。
不过,在上述相关技术中,在某些情况下,如扫描图像中文件轮廓部分的边缘丢失以及在对齐边缘时出现不规则部分之类的噪声导致对再现文件图像的矩形区域进行提取的精度降低。
本发明是考虑了上述问题而设计的。本发明的一个目的是提供在从扫描图像提取矩形图像时使容噪度得到改进的图像提取设备和图像提取方法。
发明内容
(1)根据本发明的一个方面,一种图像提取设备包括图像获取部分、检测部分、外接矩形设置部分、边缘像素检测部分、判定部分和矩形区域设置部分。图像获取部分获取一个通过扫描对象所获得的扫描图像。检测部分生成所获取的扫描图像的二进制图像并检测所生成的二进制图像中的相连像素。外接矩形设置部分为检测部分检测到的相连像素设置外接矩形。边缘像素检测部分针对外接矩形的每条边以垂直于边的方向进行扫描以检测边缘像素。扫描从线上的多个点开始,并且所述线从相连像素与边相接触的接触点向该边的一个顶点延伸。判定部分判定由边缘像素检测部分检测到的边缘像素是否处于在扫描图像中再现的对象的轮廓部分中。矩形区域设置部分根据被判定为处于对象的轮廓部分中的边缘像素来设置矩形区域。图像提取部分从矩形区域设置部分所设置的矩形区域中提取图像。
(2)根据(1)的图像提取设备,判定部分判定在所检测到的边缘像素之中处在超出了外接矩形对角线的位置处的边缘像素没有处于对象的轮廓部分中。
(3)根据(1)的图像提取设备,判定部分判定在所检测到的边缘像素之中与相邻边缘像素的距离大于阈值的边缘像素没有处于对象的轮廓部分中。
(4)根据(1)的图像提取设备,判定部分判定在所检测到的边缘像素从接触点向一个顶点接近的过程中与边的距离减小的边缘像素没有处于对象的轮廓部分中。
(5)根据(1)的图像提取设备,所述一个顶点在所述边的顶点之中距离接触点更远。
(6)根据(1)的图像提取设备,该图像提取设备还包括倾斜计算部分,其根据作为处于对象轮廓部分中的像素的边缘像素的位置坐标,来计算由作为处于对象轮廓部分中的像素的边缘像素所构成的至少三条或更多线段的倾斜。矩形区域设置部分根据计算出的线段的倾斜的一致性来设置矩形区域。
(7)根据(1)的图像提取设备,该图像提取设备还包括另一个倾斜计算部分,其对所检测到的相连像素与外接矩形之间的倾斜进行检测。当所检测到的倾斜大于预定值时,由边缘像素检测部分、判定部分和矩形区域设置部分来执行处理。
(8)根据(1)的图像提取设备,所述对象是矩形文件图像。
(9)根据本发明的另一个方面,一种图像提取方法包括:获取通过扫描对象而得到的扫描图像;生成所获取的扫描图像的二进制图像,并检测所生成的二进制图像中的相连像素;为检测到的相连像素设置外接矩形;针对外接矩形的每条边,在垂直于边的方向上进行扫描以检测边缘像素,其中扫描从线上的多个点开始,并且所述线从相连像素与边相接触的接触点向该边的一个顶点延伸;判定检测到的边缘像素是否处于在扫描图像中再现的对象的轮廓部分中;根据被判定为处于对象的轮廓部分中的边缘像素来设置矩形区域;和从设置的矩形区域提取图像。
根据(1),改善了对在扫描图像中再现的对象的图像进行提取时的容噪度。
根据(2),剔除了不构成对象图像轮廓部分边缘的像素从而改善了对在扫描图像中再现的对象的图像进行提取时的容噪度。
根据(3),剔除了不构成对象图像轮廓部分边缘的像素从而改善了对在扫描图像中再现的对象的图像进行提取时的容噪度。
根据(4),剔除了不构成对象图像轮廓部分边缘的像素从而改善了对在扫描图像中再现的对象的图像进行提取时的容噪度。
根据(5),要检测的边缘像素的数量增加。这即便在扫描图像中包含噪声时也能减轻对图像提取的不利影响。
根据(6),根据由边缘像素构成的各条边的倾斜来执行在期望再现对象的部分中设置矩形区域。这提高了从扫描图像提取对象图像的精度。
根据(7),专门地选定相对于扫描图像倾斜的对象作为处理目标。这避免了不必要的处理。
根据(8),可以准确地提取扫描图像中再现的矩形文件图像。
根据(9),改善了对在扫描图像中再现的对象的图像进行提取时的容噪度。
附图说明
将按照以下附图来详细描述本发明的示例实施例,其中:
图1是示出根据本发明示例实施例的图像提取设备10的功能框图;
图2是示出针对包含在二进制图像中的各自相连像素组所设置的外接矩形的示例的示图;
图3是示出文件图像是否倾斜的判定标准示例的示图;
图4是示出相连像素和外接矩形的示例的示图;
图5A到图5C是说明在识别文件图像的区域时容噪度得到改进的示图;
图6A和图6B是示出设置扩展的被提取图像区域的处理的示图;
图7是示出由图像提取设备10执行的图像提取处理的流程的流程图。
具体实施方式
下面参照附图说明实现发明的示例实施例。
图1是示出根据本示例实施例的图像提取设备10的功能框图。根据本示例实施例的图像提取设备10应用于具有扫描功能的多功能打印机(组合机器)。不过,还可以将该设备应用到如连接了扫描仪的个人计算机之类的信息处理设备上。在本示例实施例中,图像提取设备10执行从通过同时扫描一张或多张文件页面(比如名片和信件)而得到的扫描图像中提取每个文件的图像的处理。下面描述图像提取设备10中配备的功能的细节。
如图1所示,图像提取设备10包括扫描部分12、图像获取部分14、二进制化处理部分16、外接矩形设置部分18、文件倾斜判定部分20、边缘像素检测部分22、有效边缘判定部分24、边倾斜计算部分26、提取图像区域设置部分28和图像提取部分30。当通过介质读取器(未示出)将存储在计算机可读信息存储介质中的图像提取程序读入以计算机系统的形式构成的图像提取设备10中,并随后由图像提取设备10执行该程序时,可以实现各个部分的功能。不过,与将程序从信息存储介质提供到图像提取设备10的这个示例相对比,还可以经由如互联网之类的数据通信网络从远程站点将图像提取程序下载到图像提取设备10中。
扫描部分12包括光学读取器,并通过对放置在光学读取器的预定图像读取位置处的文件进行光学处理来扫描,以生成该文件的扫描图像。在扫描图像中包含的文件页面的数量可以是单张也可以是多张。
图像获取部分14获取由扫描部分12生成的扫描图像。当将扫描部分12构造为外部装置时,图像获取部分14经由USB类型的接口或类似接口来获取扫描图像。
二进制化处理部分16对由图像获取部分14所获取的扫描图像执行二进制化处理,以生成该扫描图像的二进制图像。在二进制化处理部分16中,执行用于加强扫描图像中的边缘的二进制化处理以便能够更容易地提取扫描图像中包含的文件的轮廓部分。
外接矩形设置部分18对由二进制处理部分16生成的二进制图像中所包含的每一组黑色的相连像素都分配一个标签(贴标签处理),然后对分配了标签的每组相连像素设置外接矩形。下面参照图2详细描述外接矩形设置部分18所执行的处理。
图2是由外接矩形设置部分18针对在扫描图像的二进制图像中包含的各组相连像素来设置的外接矩形的示例。在图2所示的示例中,二进制图像40包含三个文件图像。这里,外接矩形设置部分18对表示二进制图像40中所包含的文件图像轮廓边缘的相连像素组42、44和46分别地设置了外接矩形52、54和56。
文件倾斜判定部分20对由外接矩形设置部分18针对每个相连像素组所设置的外接矩形的区域内所包含的相连像素(文件图像)相对于所设置的外接矩形是否倾斜进行判定。对于被文件倾斜判定部分20判定为相对于外接矩形没有倾斜的文件图像,将该外接矩形的区域设置为包含该文件图像的图像区域。另一方面,对于被判定为相对于外接矩形倾斜的文件图像,如下文所述,在外接矩形中检测出文件图像轮廓部分,然后将由该文件图像轮廓所围绕的区域设置为该文件图像的所提取图像区域。下面描述对倾斜的文件图像设置所提取的图像区域的这种处理的细节。
现在,在下文中参照图3来描述在文件倾斜判定部分20中使用的文件图像倾斜与否的判定标准的示例。如图3所示,在外接矩形52的每条边中,当从外接矩形52的边到与该边接近的相连像素42所构成的边的距离处于预定值(Th)之内时,文件倾斜判定部分20判定包含在外接矩形中的文件图像没有倾斜。当不满足上述条件时,则判定文件图像以倾斜状态包含在扫描图像中。可以预先对每个边长值设置上述值Th。
按照由外接矩形设置部分18所设置的每个外接矩形内的图像区域,边缘像素检测部分22根据下述规则来检测文件图像的边缘像素。即,边缘像素检测部分22首先选择一条外接矩形的边作为处理对象。然后,在从该边上与相连像素接触的点延伸到较远的顶点的这条线段上的多个点中的每一个开始,边缘像素检测部分22以垂直于该边的方向进行扫描,并随后将所检测到的第一个像素识别为边缘像素。上面所述的多个点可以例如取该线段上的每个像素,或者作为另一种可选方式以预定间隔来取得。
下面参照图4详细说明由边缘像素检测部分22执行的处理。边缘像素检测部分22首先从与相连像素44接触的点44-A开始向距44-A更远的顶点(即向顶点54-B)来对外接矩形54的上部的边54-1执行以下处理。首先,边缘像素检测部分22对接触点相对于作为原点的接触点44-A的位置坐标进行记录,然后在向着54-B的方向上移动了预定数目的像素(例如1个像素)之后,在垂直于上部的边54-1的方向上从该点处开始进行扫描以检测黑色像素,然后记录所检测到的黑色像素的位置坐标。如此检测到的黑色像素用作边缘像素。边缘像素检测部分22从接触点44-A到顶点54-B重复地执行上述处理。然后,对每条边54-2、54-3和54-4也执行类似处理,从而对每条边都得到边缘像素的位置坐标。这里,由于在一些情况下扫描图像中可能包含噪声,因此上述检测到的边缘像素不是总构成文件图像的轮廓部分。因此,在本示例实施例中,提供下面描述的功能以通过从这些边缘像素中选择具有较高可能性构成轮廓部分的边缘像素来提高图像提取精度。
有效边缘判定部分24判定由边缘像素检测部分22检测到的边缘像素是否处于文件图像的轮廓部分中。将有效边缘判定部分24判定为处于文件图像轮廓部分中的边缘像素用作有效边缘像素。有效边缘判定部分24判定,当一个边缘像素满足下列三个判定标准中任一个时,该边缘没有处在文件图像的轮廓部分中,即该边缘像素不是有效边缘像素。相反,不满足所述判定标准中任一个的边缘像素就被判定为有效边缘像素。
第一判定标准为,在相对用作扫描起点的外接矩形边超出了外接矩形对角线的位置处检测到的边缘像素不用作有效边缘像素。这是因为当在扫描图像中适当地再现了矩形文件图像的四条边时,在超出对角线的位置上不能检测到该文件图像的边。另外,该对角线与外接矩形的距接触点更远的顶点相对。例如,包括顶点54-A和54-C的对角线与距接触点44-A更远的顶点54-B相对。
第二判定标准为,与相邻边缘像素的位置差大于预定正值的边缘像素不用作有效边缘像素。这是因为在本示例实施例中,外接矩形和文件图像的各条边是平滑倾斜的一对的关系。因此,当检测到一个突然的位置差时,认为有很大可能性是噪声。
第三判定标准为,当一个边缘像素比接触点一侧的相邻边缘像素更接近于外接矩形的边时,该边缘像素不用作有效边缘像素。这是因为在本示例实施例中,当从外接矩形的边上的接触点向顶点移动时,检测到的边缘像素应当远离外接矩形的边。与之相反,接近于外接矩形的边的边缘像素被判定为很大可能性是噪声。
下面参照图5A到图5C所示例子来描述当扫描图像中包含各种类型的噪声时上述判定标准的每一个在识别文件图像区域方面提高了容噪度的情形。
在图5A所示的示例中,假设丢失了文件图像的上部的边缘。此时,对应于外接矩形上部的边所检测到的边缘像素是60-A和60-B。然而,检测到60-A的边缘像素处在超出对角线61的位置上,因此根据第一判定标准不将其判定为有效边缘像素。边缘像素60-B在向顶点56-A接近时靠近上部的边,因此根据第三判定标准不将其判定为有效边缘像素。
在图5B所示的示例中,假设将突出48-A和48-B作为噪声添加在文件图像的一条边的一部分中。此时,分别将突出48-A和48-B检测为边缘像素。然而,每个突出48-A和48-B具有与相邻边缘像素的较大位置差,而且与在接触点46-A一侧检测到的边缘像素相比更接近上部的边。因此,根据第二或第三判定标准不将它们判定为有效边缘像素。
在图5C所示的例子中,假设要采用文件图像的在内的部分作为二进制化处理的边缘。此时,深入到文件图像内部的边缘像素的一部分具有大的位置波动,而且在向顶点56-A接近时靠近上部的边。因此,根据第二或第三判定标准不将它们判定为有效边缘像素。
如上所述,根据上述第一到第三标准,将没有处于文件图像轮廓部分中的边缘像素从被检测为边缘像素的那些像素中剔除。这样,可以专门地将处于文件图像轮廓部分中的边缘像素选作有效边缘像素。
根据由有效边缘判定部分24判定为有效边缘像素的黑色像素的位置坐标,边倾斜计算部分26计算出通过这些有效边缘像素构成的每条边的倾斜。边倾斜计算部分26将与外接矩形对应地获取的有效边缘像素识别为一组,然后通过最小二乘法之类的方法为每个组指定一条线段,并随后计算每条指定线段相对于外接矩形的对应边的倾斜。
根据由有效边缘像素构成的边的坐标和由边倾斜计算部分26所计算出的由有效边像素构成的各条边的倾斜的一致性,提取图像区域设置部分28设置一个提取图像区域,它是一个再现了文件图像的矩形区域。这里,提取图像区域并不局限在由外接矩形设置部分18所设置的外接矩形的内部,而可以甚至延伸到外接矩形的外部。现在,下文参照图6A到图6B描述对上述延伸的提取图像区域进行设置的处理。
图6A示出针对丢失了一部分轮廓的二进制图像(通过连接顶点70-A、70-B、70-C、70-D、70-E形成的相连像素)来设置外接矩形(由顶点72-A、72-B、72-C、72-D表示的矩形)的情形。这里,对外接矩形图像执行上述处理从而获取有效边缘像素。这里,当确认了各条边的倾斜的一致性时,如图6B所示将相连像素延伸以使对边的长度与较长的边的长度一致。结果,设置了提取图像区域(通过连接顶点70-A、70-B、70-F、70-D获得的矩形区域)。
图像提取部分30从提取图像区域设置部分28所设置的矩形区域中提取图像。
接下来,参照图7所示流程图来描述根据本示例实施例的由图像提取设备10执行的图像提取处理的流程。
如图7所示,图像提取设备10对放置在图像读取部分上的一个或多个文件页面进行读取,以生成并获取扫描图像(S101)。图像提取设备10执行二进制化处理来对所获取的扫描图像加强边缘,从而生成二进制图像(S102)。图像提取设备10对包含在所生成的二进制图像中的每个相连像素组分配标签(S103),随后为分配了标签的每个相连像素组设置外接矩形(S104)。
对于每个设置的外接矩形,图像提取设备10判定包含在外接矩形中的相连像素是否相对于外接矩形倾斜(S105)。这里,对于判定为没有倾斜的外接矩形,将该外接矩形设置为提取图像区域(S109)。另一方面,对于判定为有倾斜的外接矩形,执行以下处理。
图像提取设备10针对每条外接矩形的边,从与相连像素的点向距该接触点较远的顶点延伸的线上的每个点开始,以垂直于该边的方向进行扫描,以检测边缘像素(S106)。图像提取设备10从所检测到的边缘像素中选择构成文件图像的轮廓部分的有效边缘像素(S107)。
图像提取设备10对每条外接矩形的边执行上述有效边缘像素的检测处理,然后计算由得到的有效边缘像素构成的每条边的倾斜(S108)。然后,图像提取设备10根据有效边缘像素构成的边与针对各条边计算的倾斜之间的一致性来设置矩形的提取图像区域(S109)。图像提取设备10对每个外接矩形进行上述处理来提取每个所设置的矩形区域中的图像(S110)。结果,提取出在扫描图像中再现的各个文件图像。
如上所述,根据在本示例实施例中描述的图像提取设备10,在提取矩形图像比如来自扫描图像的矩形文件时改进了容噪度。
这里,本发明不限于上述示例实施例。即,显然的是具有本领域普通知识的本领域技术人员能够做出各种变化、修改和替代。
已经提供了上述本发明的示例实施例用于解释和说明。并不意在穷举或将本发明限制于所公开的明确形式。显然,对于所属领域的从业者将很明白许多改型和变型。选择和描述的实施例是为了更好地说明本发明的原理及其实际应用,从而使其它从业人员更理解本发明的各种实施例并以各种修改来适当地用于所考虑的特定应用。本发明的范围由权利要求及其等同物定义。

图像提取设备和图像提取方法.pdf_第1页
第1页 / 共20页
图像提取设备和图像提取方法.pdf_第2页
第2页 / 共20页
图像提取设备和图像提取方法.pdf_第3页
第3页 / 共20页
点击查看更多>>
资源描述

《图像提取设备和图像提取方法.pdf》由会员分享,可在线阅读,更多相关《图像提取设备和图像提取方法.pdf(20页珍藏版)》请在专利查询网上搜索。

本发明涉及一种图像提取设备和图像提取方法。图像提取方法包括:获取扫描图像;生成所获取的扫描图像的二进制图像并检测在生成的二进制图像中的相连像素;为检测到的相连像素设置外接矩形;针对外接矩形的每条边,在垂直于边的方向上进行扫描以检测边缘像素,其中扫描从线上的多个点开始,并且所述线从相连像素与边相接触的接触点向该边的一个顶点延伸;判定检测到的边缘像素是否处于在扫描图像中再现的对象的轮廓部分中;根据被判。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1