对像素数据进行二进制化的方法和装置.pdf

摘要
申请专利号：	CN95192294.7	申请日：	1995.03.31
公开号：	CN1144587A	公开日：	1997.03.05
当前法律状态：	撤回	有效性：	无权
法律详情：	发明专利申请公布后的视为撤回\|\|\|地址法兰克福慕尼黑\|\|\|申请人利森蒂亚专利管理有限公司西门子公司\|\|\|\|\|\|公开
IPC分类号：	H04N1/403; G06K9/38	主分类号：	H04N1/403; G06K9/38
申请人：	利森蒂亚专利管理有限公司;
发明人：	沃尔夫冈·韦伯; 埃伯哈德·罗哈姆; 安杰斯·巴豪泽; 沃尔特·黑塞
地址：	联邦德国法兰克福
优先权：	1994.03.31 DE P4411248.3
专利代理机构：	中国国际贸易促进委员会专利商标事务所	代理人：	王以平
PDF下载：	PDF下载

内容摘要

本发明公开了一种像素数据二进制化的方法和装置，从像素灰度值数据记录中分别应用不同灵敏度的二进制化特性构成多个黑—白二进制图像。对每一个这样的二进制图像计算数值S=FS/，其中FS为图像中黑点的数目，表示黑白过渡点的数目。最大的S值所对应的图像即为最优二进制化的图像。

权利要求书

1：像素数据二进制化的方法，其特征在于，从像素灰度值数据的记录中分别应用不同灵敏度的二进制化特性构成多个黑白二进制图像。对每一个这样的二进制图像计算数值 S = FS U . . , ]]> 其中FS为图像中黑点的数目，表示黑白过渡点的数目。最大的S值所对应的图像即为最优二进制化的图像。
2：根据权利要求1的方法，其特征在于，数值S的计算和对每一图像的相应选择只对二进制择图像点的一个或数个预定的部分(ROI)进行。
3：根据权利要求2的方法，其特征在于，按照不同的标准给出数个预定部分(ROI)。
4：根据权利要求2或3的方法，其特征在于，按照一预定的标准二进制化特性将上述预定部分(ROI)剪辑，和相应的剩余图像组合成一个整图像。
5：根据权利要求1至4之一的方法，其特征在于，作为参数的量化特性值有：中间值，最小值，最大值，对比度，以及用于降低像素灰度值数据的噪声的预定的噪声阈值。
6：带有一个二进制数据源(1)的对像素数据二进制化的装置，其特征在于，二进制数据源(1)由像素灰度值的记录中分别以不同的灵敏度的量化特性提供数个黑白二进制图像；安置一分析装置 (8)，用以对n个二进制数据图像中的每一个计算数值 S = FS U . . , ]]> 其中FS表示黑二进制像点的数目，而表示黑-白过渡点的数目；安置一评估装置(10)，用于从大量二进制数据图像中选出具有最大S值的那幅图像。
7：根据权利要求6的装置，其特征在于，安置一图像存储器(7)，用于暂时存储n个二进制数据，这些数据由该存储器传送至分析装置 (8)。
8：按照权利要求6或7的装置，其特征在于，安置有探测器模块 (2)，用于二进制数据像点的预定部分(ROI)的选择。

说明书

对像素数据进行二进制化的方法和装置
    本发明涉及对像素数据进行二进制化的方法和装置。

    本发明涉及自动字符识别系统的图像准备领域。字符识别系统大致分为两个子系统，其中第一个子系统的任务是图像的准备，而第二个子系统的任务是真正的识别。在图像准备时，使用测量技术获得识别的文件，即所谓的原件。为形成原件的一个图像，准备出文字段落、行及单个字符，并清除由明显可见的干扰所引起的字符图像。被识别的字符首先置于有光区域，并必须转换以利于进一步的处理。这将通过一扫描器(目前最好是集成的半导体扫描器)来进行。为了进一步的处理，连续测得的原件的灰度一般在扫描后直接转换为黑-白判断(schwarz-weiβ-Entscheidung)。由扫描器提供的模拟信号最好首先通过一个A/D转换器转换为分立的信号，接着产生一个为字符识别能足以重现原图像内容地灰度图像原件的二进制图像。字符区域的背景亮度和灰度可能会有很大的起伏。在原件的子区域中人们可以得到较小的背景亮度的起伏，但字符区域的灰度却经常随不同的字符甚至在一个字符之内发生变化。因此，背景亮度的区别可以对一个较大的图像段落采用相同的规则来处理，而字符灰度的不同则采用只在局部起作用的规则来平衡。

    按照二进制化特性的黑白判断的局部控制是采用差分运算(differenzierende Operation)，为确定一像素的灰度，该运算不仅考虑该点的灰度值，而且也考虑其周围的灰度值。这里周围区域大小的选取必须与需辨认的符号的大小相符。最简单的方法是：首先确定周围区域的中间灰度值，如果一个像素比该中间灰度值黑则被认为是黑色，否则，被认为是白色。此外，为降低背景区域和符号黑色区域的噪声，可应用二进制化特性曲线，在中间灰度值较低的区域提高阈值Q，而在中间灰度值较高的区域降低该阈值。在符号对比度变化较大的情况下这样是有益的：按照在一个较大周围区域观察到的对比度控制二进制化特性曲线，并且对印刷较深的符号应用与对印刷较浅的符号不同的二进制化特性曲线。

    在上述的图像准备的二进制化阶段为所有后续处理步骤产生有效信息。因此，在该阶段损失的信息将影响所有的进一步的处理步骤，并限制了整个系统的效率。

    二进制化时遇到的一个问题是：对于灵敏的二进制化的图像，图像的处理采用按印刷较浅的字符设置的二进制化特性，这样对比度较小的字符能很好地被辨认，但是干扰结构和图案也能清晰地显现出。与此相反，对于非灵敏的二进制化图像，对比度较高的字符能被很好地辨认，而干扰信息和背景噪声被抑制。在对地址区域字符的识别中这一问题变得尤其突出；地址区域通常有一个背景结构，在这种情况下从对灰色图像的周围的局部观察很难判断某一灰度值究竟涉及书写的字迹还是干扰的背景图案。

    本发明的任务是，提供一种这样的方法和装置，从用不同的二进制化特性构成的多个二进制图像中选择一个最优二进制化的图像。

    本发明的任务这样来完成，从像素灰度值数据的记录中分别应用不同灵敏度的二进制化特性构成多个黑白二进制图像。对每一个这样的二进制图像计算数据S=FSU..,]]>其中FS为图像中黑点的数目，表示黑白过渡点的数目。最大的S值所对应的图像即为最优二进制化的图像。

    下面结合附图详细解释本发明。

    图1表示按照本发明的装置框图。

    图2表示提供几个黑白二进制图像的二进制数据源的框图。

    图3表示二进制化判断图。

    图4为一动态噪声阈值图。

    图5表示一封信中识别区(ROI)的一个例子。

    图6表示确定黑白过渡点的计数方向。

    图7为一分析曲线。

    图8为一系列不同的二进制化的图像。

    图9表示另一个按照本发明的装置的框图。

    图1所示的按照本发明的装置的框图包括一个二进制数据源1和一个ROI探测器模块2，用以提供二进制图像点的给定部分，即识别区(ROI-region of interest)。如图2所示，在二进制数据源1中，并行地产生n个(典型取为4至6)二进制图像。二进制数据源1由图中未详细表示出的灰度-像素数据源，即从图像输入装置3(例如扫描仪)，获取灰度图像的像素值。从原理上讲，在按照本发明的装置中也可以顺序地产生n个二进制图像。

    这n个二进制图像分别具有不同的二进制化特性。如已知的那样，为对灰度图像二进制化，在每一像素的周围局部区域进行中间值计算4。周围局部区域的选取是可随参数变化的。从经验可知，对信件的地址区域中的字体，合适的周围局部区域的大小为1mm2。中间值最好由周围局部区域中典型点的算术平均灰度值来构成，这里，需进行二进制化的图像点位于该周围局部区域的中点。

    最好在相对于需二进制化的图象点对称的一个扩大的周围环境区域内计算出最大值、最小值和对比度5，作为进行二进制化的其他测量值。这里，扩展的周围环境区域中最黑的灰度值被赋予最小值MIN。而最大值MAXabs最好为扩展周围环境区域中的绝对最亮的灰度值。对比度最好由次最大值的最小值MAXk来计算(例如在3×3扩展周围区域中由三列次最大值计算)。

    对比度由下式决定K=MAXk-MINMAXk]]>通过MAXk来定义K的方法使得图像的最大灰度值对对比度，从而对二进制化结果的影响不是很灵敏。否则，灰度图像中的非正常亮点，以及过渡边缘区域(如标记或信封上的透明窗口)将导致较大的对比度改变。对比度的明显改变只有通过字迹本身引起。

    灰度图像的每一个像点暂时存储在像素存储器6中，直至计算出相对于每一像点的中间值，最小值，MAXk和对比度。

    测量值中间值、最小值、最大值和对比度最好由n个图像一起计算。在这一情况下，二进制图像的区别只在于下面将要说明的判断图3中的其他参量。

    在判断图中，横座标为每一需二进制化的像素Pi的实际中间值，纵座标为实际的像素值。图3中划出了三条不同的特性曲线，二进制化的灵敏度随着这些特性曲线直线部分斜率的增加而增大。若一个由给定中间值和给定像素所确定的点位于特性曲线之上则被赋予值“白”，相反，若在其下则被赋予值“黑”。通常情况下，当对比度较小时选择灵敏度较高的特性曲线，而当对比度较大时选取灵敏度较低的特性曲线。

    为降低噪声在图3中引入了不同的阈值：

    白色阈值WS根据MAXk给出，白色阈值的典型大小范围为MAXk的70-85％。若实际像素值Pi大于该阈值，则被赋予白色，与特性曲线无关。

    绝对黑色阈值SSW的作用是：当像素值Pi小于该绝对阈值时被置为黑色。

    因为在通常情况下，黑的地址区域比白的地址区域更容易引起较强的白色噪声，所以最好引入一个与像素最大值MAXk有关的动态的白色噪声阈WS＝f(MAXk)，它较强或较弱地降低白色噪声。图4给出了这种动态白色阈值的一个例子，其中灰度值的值域取为8位。

    按照本发明，为实现二进制化，应用n个不同的，最好按灵敏度排列的特性曲线，来完成n个不同的二进制化的二进制图像。这n个图像被存入图像存储器7中，识别区ROI的数据供分析装置8使用，而整个图像则供剪辑装置(Montierwerk)9使用。

    图5表示含有一地址块12的识别区11的原样的一个例子。从原理上讲，可用不同探测器获得识别区的信息，例如，窗口探测器，在带有透明窗口的信件上，从光泽图像中确定座标，这个图像是用一个专用扫描器获得的；探测地址标签的标签探测器；使用一定的算法寻找行结构并将典型的地址结构标志为识别子区的地址块探测器；通过颜色分析确定识别子区的颜色信息探测器；或通过预定的座标确定识别子区的固定区域探测器。

    在分析装置8中，对1至n的每一个二进制图像分别计算出相对于由ROI探测器模块2确定的识别区的数值S1，S2，…，Sn。

    为计算数值S必须计算黑像点的数目FS和黑-白或白-黑过渡点的数目。

    过渡像点数目可以在列方向，或行方向，或在两个方向上逐个像素地数出。图6表示了确定过渡像点列方向、行方向和列方向与行方向的计数方向。

    数值S与二进制化的二进制图像的关系如图7的曲线所示，图像是按二进制化特性灵敏度逐渐降低的顺序排列。当使用灵敏度很高的二进制化特性时，S的值很大。它对应的二进制图像实际上很黑，只有相对较少的黑-白过渡像点。随着灵敏度的降低，黑-白过渡像点急剧增加，从而导致S的下降。二进制化特性的灵敏灵进一步减小，S值再次增加，在这种情况下，字迹信息清晰。随着二进制化特性的灵敏度的进一步减小，二进制化图像中的符号继续分解(zerfallen)，使得数值S再次下降。结果得到一个S曲线，其相对最大值对应于最优识别的图像。

    图8表示了一地址区域的分别以不同的灵敏度形成的四个不同的图像及其相应的数值S。图中表明，具有最大S值(S＝1.87)的图像(C)是最清晰的。

    由分析装置8提供的数值S1至Sn在评估装置10中进一步被处理，即由数值S1至Sn中确定相对最大值，并这样来控制剪辑装置9，即在识别的子区域中输出具有最大S的二进制图像，并对该图像其余部分输出标准图像。n个二进制图像中的与等候的原样表面相适应的一个图像用作为标准图像。也可以舍弃剪辑装置9中的剪辑步骤，在这种情况下可以用导致S取最大值的二进制化特性进行整个二进制图像的输出，这对专业人员来说是显而易见的。但是应该对原样进行划分和剪辑，因为识别子区通常与整个原样表面具有不同的光学特性。

    对于具有数个识别子区ROI的原样，如具有数个透明窗口的信或带有标记的平面，可以运用本发明的一个扩展。当有K个识别子区时最好使用K个分析装置，图9表示了具有K个分析装置8的本发明的一个实施例，从它们的每一个输出以上述方式计算出的n个S1至Sn的数值。然后对每一个识别子区在其所属的分析装置中进行独立的分析。这样，对每一个识别子区找到一个最优识别的二进制图像，并被输出剪辑。图9表示，数据由ROI探测器模块2，传送给控制装置10’，传送给分析装置8’进行分析。剪辑装置9’由控制装置10’控制。由不同的ROI探测器探测到的子区的重叠，通过不同ROI探测器的优化被消除，这样对于分析装置和剪辑只存在明确、单一的子区。