可手写的数字图形编码及其识别方法 数字,是人类使用最多的一种信息。许多民族都创造了数字符号,如阿拉伯数字0、1、2、3、4、5、6、7、8、9,中文一、二、三、四、五、六、七、八、九,中文壹、贰、叁、肆、伍、陆、柒、捌、玖等。数字符号的出现,对人类社会进步起了极其重要的作用。
随着社会的高速发展,尤其是有了电子计算机以后,原有的数字符号不能满足人们的需要了。商业、物流、工业生产、办公自动化……大量的数据需要及时处理,这就必须对数据进行自动采集和识别。阿拉伯数字容易书写,可读性好,是世界上使用最广泛的数字符号,人们发明了多种光电字符阅读机(OCR)识别它。然而由于手写阿拉伯数字的不规范性及复杂性,加上干扰等影响,实施自动识别的成本高而识别率低,可靠性差,因而使得很多领域不能使用自动识别技术。条码是为自动识别而发明的一种图形码,这种已经公开的专利技术,由于方法简便,成本低,可靠性高,现在已被大量使用,获得了极大的经济效益。不过条码的应用也有其局限性。它只能使用在数字固定不变的场合,如商品的标签。它必须由激光或喷墨印字机印制,而不能由人即时书写。这使得它不能在大量随机产生数据的场合使用,如各种财务报表等。由于条码还有其不足之处,条码是由宽窄不一,黑白相间的线条组成,对印刷质量要求严格,污染和干扰容易影响其识别地正确率。加之它不直观,可读性差,这也进一步影响了它的使用范围。
为了实现机器自动读取数据的需要,能不能有一种数字符号,它即简单,人人都可以手写,而且又直观、规范、可读性好,并且抗干扰能力强,适宜于自动识别,有很高的可靠性呢?本发明正是为了满足这些要求,创造了Guo-数字图形编码及其识别方法。
Guo-数字图形编码,简称Guo-数字符号,由骨架和笔画二部分组成。骨架形如h,是Guo-数字符号的固定组成部分。它的左侧是一垂直线段,由该线段的中点向右是一水平线段,水平线段的右端点向下是一垂直线段,长度等于左侧垂直线段的一半。笔画是一垂直线段。它的长度等于左侧骨架垂直线段的一半,或者与左侧骨架垂直线段相等。h型骨架决定了字符的大小,其中水平线段将字符图形分为上区和下区两部分,若把两条垂线间的距离分为四等分,在水平线段上得到三个等分点,从垂直线段长的一边到垂直线段短的一边依次为D1、D2、D3点,以D1、D2、D3点为中,将两垂线间分为3个区域。点D1、D2、D3上面和下面的6个区域是笔画的特定区域。Guo-数字符号的骨架和3个区域如图1所示。
Guo-数字图形编码是按如下方法进行编码的。1-9的9个字符都由一个垂直笔画和骨架组成,其中D1、D2、D3的上面区域有笔画分别为数字1、2、3的图形编码,D1、D2、D3的下面区域有笔画分别为数字4、5、6的图形编码,D1、D2、D3区有贯穿上下区域的笔画分别为数字7、8、9的图形编码,只有骨架而无笔画是数字0的图形编码。0-9的数字图形编码如图2所示。
从图2可以看出,本发明Guo-数字图形编码的一个显著特点是直观、规范、可读性好,人人都可以书写。除0以外,每个数字都只有一个笔画,按照″先上后下,从左到右″的规则,依次为数字1、2、3、4、5、6、7、8、9,即使一个不会写甚至不认识阿拉伯数字的人,也很容易学会识别Guo-数字符号,并能书写它,因为它们简单到只需画一直笔。
本发明Guo-数字符号的另一个显著特点是容易自动识别,抗干扰能力强,有很高的可靠性,机器自动识别可以达到100%的正确率。一般供机器自动读取的Guo-数字符号的骨架由印字机印出。为了进一步增加可靠性,可以采取把书写笔画的地方用光电阅读机不能感知的其它颜色印刷,或者在应该书写笔画的外端加印标志点,这样书写时会更加规范。图3是印有笔画标志点及手写的0-9Guo-数字符号。对书写的要求不高,笔画粗细不限,允许用斜笔,只要不出其所在的区域即可。Guo-数字符号只所以抗干扰能力强,是因为它与笔画的粗细无关,在它的上下半区都最多只能有一笔。如果有干扰点,只要干扰点的面积大小不超过笔画的面积,识别就不会发生错误。Guo-数字符号的识别很简单,识别时首先根据h型骨架计算各区域,然后逐个区域判定有无笔画存在,只要确定了笔画的位置,数字即可得到确认。Guo-数字符号的识别框图如图4所示。
Guo-数字符号的另一个显著特点是它不仅有上面所说的抗干扰能力,而且即使将符号旋转一个任意角度,甚至以镜象出现,也能获得正确的识别。这是因为h型骨架具有定向作用,识别时可以先找到骨架,旋转使它成为垂直,然后从骨架垂线长的一侧向短的一侧分D1、D2、D3区,上下区的确定是根据两侧的垂线,上区只有一侧有垂线,而下区的两侧都有垂线,显然,识别可以绝对正确。
上面介绍的Guo-数字符号笔画是垂直的,我们把它称为垂直型Guo-数字符号。由于各民族书写习惯的不同,或应用环境的不同,Guo-数字符号也可以使用水平笔画,为此设计了水平型Guo-数字符号。水平型0-9的数字图形编码如图5所示。实际上,它是由垂直型Guo-数字符号的镜象再旋转一个角度后得到的。
有些时候,并不需要用到0-9的全部数字符号。这时可以使用以下简易的Guo-数字符号,使得编码图形更简单,自动识别更快速。将h型骨架两垂线间作为一个区域或分为二个区域,按照上面所述相同的编码方法,可以组成0-3共4个数字,或0-6共7个数字的图形编码。分别称为简易4数字Guo-数字符号和简易7数字Guo-数字符号。这些简易Guo-数字图形编码如图6所示。某些从几种事件中选择其一的统计报表常会用到这种简易的Guo-数字符号,如考卷中的单选题等。
附图说明如下:
图1是本发明Guo-数字图形编码的骨架和3个笔画区域。
图2是本发明0-9数字的图形编码。
图3是本发明印有笔画标志点及手写的0-9Guo-数字符号。
图4是本发明Guo-数字符号的识别框图。
图5是本发明水平型0-9数字的图形编码。
图6是本发明简易4数字和7数字Guo-数字图形编码。
下面是本发明的一个实施例。这是一个财务自动核查系统。财务表中有用Guo-数字符号逐项填写的单项金额,同时在表格的最下一栏有用Guo-数字符号填写的总金额。自动核查系统通过扫描获取图象,图象经过处理、切分后得到每个数据的一组Guo-数字符号图象,然后利用上述的识别方法识别每一个Guo-数字符号,得到一个个单项数据。系统累加单项金额数据,并与表中的总金额数据进行对比,如果相同则通过,如果发现不相同,则说明该报表有问题。所有这一切都是自动进行的。该系统速度快,可靠性高,可排除人工输入时精神不集中造成的差错,大大降低脑力劳动强度。