一种手写汉字笔画识别方法.pdf

上传人:e2 文档编号:6131992 上传时间:2019-04-17 格式:PDF 页数:15 大小:1.44MB
返回 下载 相关 举报
摘要
申请专利号:

CN201410003668.1

申请日:

2014.01.03

公开号:

CN103810506A

公开日:

2014.05.21

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06K 9/68申请日:20140103|||公开

IPC分类号:

G06K9/68

主分类号:

G06K9/68

申请人:

南京师范大学

发明人:

白晓东; 姜杰; 黄峰; 仇宏斌; 李艺

地址:

210046 江苏省南京市亚东新城区文苑路1号

优先权:

专利代理机构:

南京知识律师事务所 32207

代理人:

李媛媛

PDF下载: PDF下载
内容摘要

本发明公开一种手写汉字笔画的识别方法。具体步骤为:建立标准汉字笔画、位置关系、相交关系的特征集;记录手写汉字笔画书写特征,建立手写汉字特征集;分离笔画类型唯一性笔画,与标准汉字进行匹配;建立手写汉字外包矩形,并将矩形等分为若干个子格,确定每个笔画所处的子格,根据绝对位置关系与标准汉字进行匹配;抽取手写汉字中与已确定对应关系笔画具有相交特征的笔画,根据相交关系与标准汉字进行匹配;计算同类笔画的相对位置关系,根据相对位置相似性与标准汉字进行匹配;对剩余笔画进行综合相似性判断,最终完成所有笔画对应关系的建立。本发明的方法,实现了用户手写汉字与标准汉字笔画一一对应关系的建立,具有重要的应用价值。

权利要求书

1.一种手写汉字笔画的识别方法,其特征在于:包括如下步骤:
(1)建立作为标准的每个汉字笔画类型、绝对位置和相交关系的特征集;
(2)记录手写汉字笔画书写特征,建立手写汉字特征集;
(3)将标准汉字特征集与手写汉字特征集进行比对处理,建立标准汉字笔画与手写汉字
笔画的一一对应关系;比对处理包含:笔画类型唯一性判断、绝对位置唯一性判断、相交特征
唯一性判断和相对位置相似性判断;
A、笔画类型唯一性判断为分离手写汉字中的唯一性笔画,与标准汉字笔画特征进行匹配;
B、绝对位置唯一性判断为建立手写汉字外包矩形,并将矩形等分为若干子格,确定每个
笔画所处的子格,与标准汉字绝对位置特征进行匹配;
C、相交特征唯一性判断为抽取手写汉字中与已确定对应关系笔画具有相交特征的笔画,
根据相交关系与标准汉字相交关系特征进行匹配;
D、相对位置相似性判断为将未完成匹配的笔画按笔画类型进行聚类,若某种笔画类型集
合中包含的未完成匹配笔画数与标准汉字该笔画类型未完成匹配的笔画数一致,则计算该类型
笔画中各笔画与外包矩形顶点的相对位置,根据相对位置关系与标准汉字进行匹配;
(4)对于通过上述步骤仍未完成对应关系建立的笔画进行综合相似性判断,实现手写汉
字中所有笔画与标准汉字对应关系的建立。
2.根据权利要求1所述的一种手写汉字笔画的识别方法,其特征在于,所述步骤(1)中,建
立标准汉字特征集的方法如下:
(1)根据汉字笔画规范,将作为标准汉字径迹切分为由若干笔画组成的集合,按笔画类
型进行聚类,建立标准汉字笔画特征集;
(2)遍历上述标准汉字径迹点集,获取其中X坐标最小值xmin及最大值xmax,Y坐标最小
值ymin及最大值ymax,,以(xmin,ymin),(xmin,ymax),(xmax,ymin),(xmax,ymax)四个点为顶点构建
矩形,该矩形即为此标准汉字的外包矩形,将外包矩形等分为若干子格,确定各笔画在所处的
子格,建立绝对位置关系标准特征集;
(3)遍历标准汉字笔画特征集,判断单个笔画内部是否存在折点,如存在,则将此笔画
从折点断开,拆分为若干个走向独立的笔段,如不存在折点,则将此笔画做为一个笔段处理,
根据不同笔画间笔段的相交关系判断笔画是否相交,建立标准汉字相交关系特征集。
3.根据权利要求1所述的一种手写汉字笔画的识别方法,其特征在于,所述步骤(2)的具体
步骤如下:
根据用户在平台上手写某个汉字的笔迹移动情况,获取该手写汉字点集,将用户书写过程
中从下笔到起笔所形成的点集定义为一个笔画;遍历笔画中的所有点,对原始点集进行降噪处
理,并对笔画进行冗余化归类,将相近笔画同归为某一类进行处理。
4.根据权利要求1所述的一种手写汉字笔画的识别方法,其特征在于,所述步骤(3)中比对
处理的具体方法包含:
(1)笔画类型唯一性判断:遍历用户手写汉字笔画类型特征集,统计组成该汉字的所有笔
画中各类型笔画的数量,获取其中在某种笔画类型中数量等于1的笔画,与标准汉字笔画类型
特征集进行比对,确定该类唯一性笔画的对应关系;
(2)绝对位置唯一性判断:遍历用户手写汉字的特征点集合,获取其中X坐标最小值xmin
及最大值xmax,Y坐标最小值ymin及最大值ymax,,以(xmin,ymin),(xmin,ymax),(xmax,ymin),(xmax,
ymax)四个点为顶点构建矩形,该矩形即为此标准汉字的外包矩形,,将外包矩形等分为与标准
汉字拆分方法一致的若干子格,判断用户手写汉字每个笔画所处的子格,若某笔画在其所属的
笔画类型中与子格的位置关系存在唯一性,即某个子格内只存在一个未实现与标准汉字笔画对
应关系匹配的某种类型笔画,则分离该笔画与标准汉字笔画绝对位置特征集进行比对,确定该
笔画的对应关系;
(3)相交特征唯一性判断:遍历用户手写汉字笔画特征集,判断各个笔画间是否存在相
交关系。提取用户手写汉字中已经完成与标准汉字对应的笔画或笔段,通过判断其相交情况确
定未知笔画与标准汉字笔画的对应关系;
(4)相对位置相似性判断:抽取用户手写汉字中未完成匹配的笔画,并按笔画类型进行
聚类,判断手写汉字与标准汉字相同笔画类型集中包含的未完成匹配笔画数量是否一致,若数
量一致,则分别计算该类型笔画中用户手写汉字及标准汉字各笔画与外包矩形各顶点的相对位
置,根据相对位置相似性建立用户手写汉字笔画与标准汉字笔画的对应关系。
5.根据权利要求1所述的一种手写汉字笔画的识别方法,其特征在于,所述步骤(4)中综合
相似性判断方法如下:
对于通过步骤(1)-(3)仍未完成对应关系建立的用户手写汉字笔画,分别计算其与标
准汉字中未完成对应关系建立笔画的笔画类型相似度、绝对位置关系相似度、相对位置关系相
似度,并将三种相似度进行综合处理,根据综合相似性建立用户手写汉字笔画与标准汉字笔画
的对应关系。

说明书

一种手写汉字笔画识别方法

技术领域

本发明涉及利用计算机对汉字书写进行评价的技术领域,尤其涉及一种手写汉字笔画识别
方法。

背景技术

文字是记录、传递语言信息的社会性符号系统,汉字作为中华民族的一种文字更是承载着
我们民族的历史、文化与气质,它是五千年中华文明最直接的传承者。而伴随着电脑的普及,
人们对电脑打字越来越依赖,手写汉字的机会则越来越少。手写汉字的关注程度和练习强度被
大大弱化,如何提升国人汉字书写能力的已成为一个亟待解决的问题。

目前手写汉字书写自动评价方法主要有以下几种:

1、通过记录书写笔迹、笔画数、判断笔画相交关系来进行评价,如中国发明专利“手写
汉字笔画相交离的规范性判定方法和装置”(公开号:CN101320422A)公开了一种通过判断手
写汉字笔画相交离关系判断手写汉字书写是否规范的方法;

2、通过对人工给定的汉字样本进行机器学习,然后使用图像处理与人工智能的方法对手
写汉字进行相似度模糊判断,如中国发明专利“一种汉字书写美观度的计算机评估方法”(公
开号:CN101295371A);

3、通过判断手写汉字的横向、纵向比例关系、结构特征以及手写汉字各点在书写空间内
的分布关系进行评价,如中国发明专利书写汉字结构规范性评价的方法和装置(公开号
“CN101251891A”)。

上述方法虽然能在某些方面对于手写汉字书写质量进行评价,但这些方法都没有实现笔画
关系的一一对应,因而无法对每一笔画的正确性进行判断,无法实现笔顺正确性判断、结构合
理性判断以及整体书写质量评价。

发明内容

本发明提供一种手写汉字笔画的识别方法,该方法是通过笔画类型判断、位置关系判断、
相交关系判断、综合相似性判断等步骤建立手写汉字各笔画与给定的标准汉字各笔画的对应关
系,实现对于手写汉字笔画的识别。

本发明采用的技术方案如下:

一种手写汉字笔画识别方法,具体包括如下步骤:

(1)建立作为标准的每个汉字笔画类型、绝对位置和相交关系的特征集;

(2)记录手写汉字笔画书写特征,建立手写汉字特征集;

(3)将标准汉字特征集与手写汉字特征集进行比对处理,建立标准汉字笔画与手写汉字
笔画的一一对应关系;比对处理包含:笔画类型唯一性判断、绝对位置唯一性判断、相交特征
唯一性判断和相对位置相似性判断;

A、笔画类型唯一性判断为分离手写汉字中的唯一性笔画,与标准汉字笔画特征进行匹配;

B、绝对位置唯一性判断为建立手写汉字外包矩形,并将矩形等分为若干子格,确定每个
笔画所处的子格,与标准汉字绝对位置特征进行匹配;

C、相交特征唯一性判断为抽取手写汉字中与已确定对应关系笔画具有相交特征的笔画,
根据相交关系与标准汉字相交关系特征进行匹配;

D、相对位置相似性判断为将未完成匹配的笔画按笔画类型进行聚类,若某种笔画类型集
合中包含的未完成匹配笔画数与标准汉字该笔画类型未完成匹配的笔画数一致,则计算该类型
笔画中各笔画与外包矩形顶点的相对位置,根据相对位置关系与标准汉字进行匹配;

(4)对于通过上述步骤仍未完成对应关系建立的笔画进行综合相似性判断,实现手写汉
字中所有笔画与标准汉字对应关系的建立。

所述步骤(1)中,建立标准汉字特征集的方法如下:1)根据汉字笔画规范,将作为标准
汉字径迹切分为由若干笔画组成的集合,按笔画类型进行聚类,建立标准汉字笔画特征集;2)
遍历上述标准汉字径迹点集,获取其中X坐标最小值xmin及最大值xmax,Y坐标最小值ymin及最
大值ymax,,以(xmin,ymin),(xmin,ymax),(xmax,ymin),(xmax,ymax)四个点为顶点构建矩形,该矩
形即为此标准汉字的外包矩形,将外包矩形等分为若干子格,确定各笔画在所处的子格,建立
绝对位置关系标准特征集;3)遍历标准汉字笔画特征集,判断单个笔画内部是否存在折点,
如存在,则将此笔画从折点断开,拆分为若干个走向独立的笔段,如不存在折点,则将此笔画
做为一个笔段处理,根据不同笔画间笔段的相交关系判断笔画是否相交,建立标准汉字相交关
系特征集。

所述步骤(2)的具体步骤如下:根据用户在平台上手写某个汉字的笔迹移动情况,获取
该手写汉字点集,将用户书写过程中从下笔到起笔所形成的点集定义为一个笔画;遍历笔画中
的所有点,对原始点集进行降噪处理,并对笔画进行冗余化归类,将相近笔画同归为某一类进
行处理。

所述步骤(3)中比对处理的具体方法包含:1)笔画类型唯一性判断:遍历用户手写汉字
笔画类型特征集,统计组成该汉字的所有笔画中各类型笔画的数量,获取其中在某种笔画类型
中数量等于1的笔画,与标准汉字笔画类型特征集进行比对,确定该类唯一性笔画的对应关系;
2)绝对位置唯一性判断:遍历用户手写汉字的特征点集合,获取其中X坐标最小值xmin及最
大值xmax,Y坐标最小值ymin及最大值ymax,,以(xmin,ymin),(xmin,ymax),(xmax,ymin),(xmax,ymax)
四个点为顶点构建矩形,该矩形即为此标准汉字的外包矩形,,将外包矩形等分为与标准汉字
拆分方法一致的若干子格,判断用户手写汉字每个笔画所处的子格,若某笔画在其所属的笔画
类型中与子格的位置关系存在唯一性,即某个子格内只存在一个未实现与标准汉字笔画对应关
系匹配的某种类型笔画,则分离该笔画与标准汉字笔画绝对位置特征集进行比对,确定该笔画
的对应关系;3)相交特征唯一性判断:遍历用户手写汉字笔画特征集,判断各个笔画间是否
存在相交关系。提取用户手写汉字中已经完成与标准汉字对应的笔画或笔段,通过判断其相交
情况确定未知笔画与标准汉字笔画的对应关系;4)相对位置相似性判断:抽取用户手写汉字
中未完成匹配的笔画,并按笔画类型进行聚类,判断手写汉字与标准汉字相同笔画类型集中包
含的未完成匹配笔画数量是否一致,若数量一致,则分别计算该类型笔画中用户手写汉字及标
准汉字各笔画与外包矩形各顶点的相对位置,根据相对位置相似性建立用户手写汉字笔画与标
准汉字笔画的对应关系。

所述步骤(4)中综合相似性判断方法如下:对于通过步骤(1)-(3)仍未完成对应关系
建立的用户手写汉字笔画,分别计算其与标准汉字中未完成对应关系建立笔画的笔画类型相似
度、绝对位置关系相似度、相对位置关系相似度,并将三种相似度进行综合处理,根据综合相
似性建立用户手写汉字笔画与标准汉字笔画的对应关系。

本发明与现有技术相比的有益效果:

(1)本方法通过计算机自动建立手写汉字笔画与标准汉字笔画的对应关系,完成手写汉
字笔画的识别,在书写单字完成以后即可完成识别,具有客观、高效、时效性强的优点。

(2)本方法实现了手写汉字与标准汉字笔画一一对应关系的建立,使得解决无监督情况
下手写汉字练习过程中笔顺正确性判断、结构合理性判断以及整体书写质量的评价成为可能,
具有重要的应用价值。

附图说明

图1是本发明的流程图;

图2是本发明所描述外包矩形等分为四个子格示意图;

图3是通过笔画唯一性确定笔画对应关系的示意图;

图4是通过笔画唯一性、绝对位置关系确定笔画对应关系的示意图;

图5是通过笔画唯一性、绝对位置关系、相交特征确定笔画对应关系的示意图;

图6是通过笔画唯一性、绝对位置关系、相对位置相似性确定笔画对应关系的示意图。

具体实施方式

下面结合附图,对本发明做详细说明。

如图1,一种手写汉字笔画的识别方法,其具体实施步骤如下:

1、建立汉字笔画、位置、相交关系的标准特征集;

(1)根据汉字笔画规范,将标准汉字径迹人工切分为由若干笔画组成的集合,按笔画类
型进行聚类,建立笔画标准特征集;

(2)遍历构成标准汉字的特征点集合,获取其中X坐标最小值及最大值xmin、xmax,Y坐标
最小值及最大值ymin、ymax,以(xmin,ymin),(xmin,ymax),(xmax,ymin),(xmax,ymax)四个点为顶点
构建矩形,该矩形即为此标准汉字的外包矩形,将外包矩形等分为若干子格,确定各笔画在所
处的子格,建立绝对位置关系标准特征集,如图2所示,本实施例采用的是将外包矩形等分为
四格;

(3)遍历标准汉字笔画特征集,判断单个笔画内部是否存在折点,如存在,则将此笔画
从折点断开,拆分为若干个走向独立的笔段,如不存在折点,则将此笔画做为一个笔段处理。
判断不同笔画的笔段间是否存在相交的特征,取不同笔画间两个笔段端点的坐标p1(x1,y1),
p2(x2,y2),p3(x3,y3),p4(x4,y4),根据笔段1的起点p1,终点p2,计算获得该笔段的直线方程
F1,根据笔段2的起点p3,终点p4,计算获得该笔段的直线方程F2,计算两个方程是否存在共
同解,若无,则这两个笔段不相交,若有共同解,判断此解是否同时落在笔段1与笔段2上,
若同时落在两个笔段上,则这两个笔段相交,否则不相交。若存在相交的笔段,则认为这两个
笔画具有相交特征,根据判断结果建立相交关系标准特征集。

将标准汉字笔画径迹点集合、绝对位置关系特征、相交关系特征以XML的方式存储。

2、记录用户笔画书写特征,建立用户手写汉字特征集。

根据用户在平台上手写某个汉字的笔迹移动情况,获取该手写汉字点集,并将点集表示为
P={Pk(xk,yk),k=1..n},n为用户书写某个汉字所获得的特征点数量,将用户书写过程中下笔
到起笔所形成的点集定义为一个笔画,笔画集表示为O={Oi(p1,p2..pj),i=1..m},其中m为
该手写汉字笔画的数量,j表示某一笔画中包含的点集数量。遍历笔画中的所有点,对原始点
集进行降噪处理,降噪处理的实现方式为:计算相邻点之间的距离L

L i = ( x i - x i + 1 ) 2 + ( y i - y i + 1 ) 2 - - - ( a ) ]]>

求L的最大值Lmax,若相邻两点pi,pi+1的距离Li<0.2*Lmax,则去掉点pi+1,同时使Li+1=Li+
Li+1o,遍历手写汉字的所有笔画,形成新的笔画集S={Si(p1,p2..pk),i=1..m},其中m为该
手写汉字笔画的数量,k表示某一笔画中包含的点集数量。

对笔画进行冗余化归类,用户在书写过程中,由于设备、习惯等原因,可能书写笔画并不
能严格对应汉字笔画规范,因此本步操作对笔画进行冗余化归类,将相近笔画同归为某一类进
行处理。

3、将标准汉字特征集与用户手写汉字特征集进行比对处理,建立标准汉字笔画与手写汉
字各笔画的一一对应关系。

(1)笔画类型唯一性判断:分离用户手写汉字中的唯一性笔画,与标准汉字笔画特征进行
匹配;

遍历手写汉字笔画集S,统计组成该汉字的所有笔画中各类型笔画的数量,获取其中在某
种笔画类型中数量等于1的笔画,与标准汉字笔画集进行比对,确定该类唯一性笔画的对应关
系。

以“大”为例,该字由三个笔画组成,其笔画类型分别为“横”,“撇”,“捺”,且在该汉
字中每个笔画类型只包含一个笔画,因此通过分离唯一性笔画与标准汉字笔画集比对,即可确
定该汉字每个笔画的对应关系,完成匹配。

再以“王”为例,该字由四个笔画组成,其笔画类型分别为“横”,“竖”,其中有三个笔
画为“横”,一个笔画为“竖”,通过分离唯一性笔画与标准汉字笔画集比对,可确定“竖”的
对应关系,“横”因为笔画数量不唯一此处无法实现对应,留待后续进一步处理,如图3所示。

(2)绝对位置唯一性判断:建立用户手写汉字外包矩形,并将矩形等分为与标准汉字相
同的子格,确定每个笔画所处的子格,与标准汉字绝对位置特征进行匹配;

遍历用户手写汉字点集P={Pk(xk,yk),k=1..n},获取其中X坐标最小值及最大值xmin、xmax,
Y坐标最小值及最大值ymin、ymax,以(xmin,ymin),(xmin,ymax),(xmax,ymin),(xmax,ymax)四个点为
顶点构建矩形,该矩形即为此标准汉字的外包矩形,并将矩形等分为与标准汉字相同的子格,
本实施例将外包矩形等分为四个子格,判断每个笔画所处的子格,方法如下:

A、获取该笔画包含的点集P={Pk(xk,yk),k=1..n},n为该笔画包含的点集数;

B、去除k≤0.15*n或者k≥0.85*n的点,获得新的点集P′={Pk′(xk,yk),k=1..m},m为去
除首尾点集后该笔画包含的点集数;

C、遍历P′,确定每个点所处的子格;

D、计算每个子格中包含该笔画点的数量N={N1,N2,N3,...,Ni},若Ni<0.2*m,m为去除首尾
点集后该笔画包含的点集数,则认为该笔画不处于格子i中;

E、对于所有未实现与标准汉字笔画建立对应关系的笔画重复A-D的操作,获取每个笔画
所处的子格。

遍历所有未实现匹配的笔画,若某笔画在其所属的笔画类型中与所处子格存在唯一性,即
某个子格内只存在一个未实现匹配的某种类型笔画,则分离该笔画与标准汉字笔画绝对位置特
征集进行比对,确定该笔画的对应关系。

以“你”为例,“竖”、“横折钩”、“竖弯钩”、“捺”可以通过笔画类型唯一性判断实现对
应,左下角的“撇”虽然笔画类型不唯一,但因为在其所处的子格内只有一个撇,所以可以通
过绝对位置关系唯一性实现对应,左上角的两“撇”在同一子格内笔画类型不唯一,因为无法
实现通过笔画类型唯一性以及绝对位置关系特征实现对应,如图4。

(3)相交特征唯一性判断:抽取用户手写汉字中与已确定对应关系笔画具有相交特征的
笔画,根据相交关系与标准汉字相交关系特征进行匹配;

A、遍历手写汉字点集S,判断单个笔画内部是否存在折点,如存在,则将此笔画从折点
断开,将一个笔画拆分为若干个具有独立走向的笔段,如不存在折点,则将此笔画做为一个笔
段处理;

B、判断不同笔画的笔段间是否存在相交的特征,取不同笔画间两个笔段端点的坐标
p1(x1,y1),p2(x2,y2),p3(x3,y3),p4(x4,y4),根据笔段1的起点p1,终点p2,计算获得该笔段
的直线方程F1,根据笔段2的起点p3,终点p4,计算获得该笔段的直线方程F2,计算两个方
程是否存在共同解,若无,则这两个笔段不相交,若有共同解,判断此解是否同时落在笔段1
与笔段2上,若同时落在两个笔段上,则这两个笔段相交,否则不相交。若不同笔画存在相交
的笔段,则认为这两个不同笔画具有相交特征;

C、提取用户手写汉字中已经完成与标准汉字对应的笔画Si,判断是否有仍未确定对应关
系的笔画Sk与其相交,若满足相交且Sk在所有与Si相交的笔画中,其笔画类型具有唯一性,
则分离该笔画与标准汉字笔画集进行比对,确定其对应关系。若Sk与Si满足相交,但不满足
所有与Si相交的笔画中笔画类型唯一的条件,则判断与Si相交的各同类笔画,其自身与其他
类型笔画的相交关系,根据相交关系与标准汉字笔画集进行比对,确定其对应关系。

以“你”为例,“竖”、“横折钩”、“竖弯钩”、“捺”可以通过笔画类型唯一性判断实现对
应,左下角的“撇”虽然笔画类型不唯一,但因为在其所处的子格内只有一个撇,所以可以通
过绝对位置关系唯一性实现对应,左上角的两“撇”虽然在同一格子内,且笔画类型不唯一,
但通过相交唯一性判断,左边一“撇”与“竖”相交,右边一“撇”与“横折钩”相交,因此
可通过相交特征唯一性判断实现这两“撇”的对应,如图5。

(4)相对位置相似性判断:将未完成匹配的笔画按笔画类型进行聚类,若某种笔画类型
集合中包含的未完成匹配笔画数与标准汉字该笔画类型未完成匹配的笔画数一致,则计算该类
型笔画中各笔画与外包矩形顶点的相对位置,根据相对位置关系与标准汉字笔画进行匹配;

A、将未完成匹配的笔画按笔画类型进行聚类操作,获得新的笔画集S,S={{s11,s12,…,s1k},
{s21,s22,…,s2k},…,{sn1,sn2,…,snk}},其中n为未完成匹配的笔画类型数量,k为某种笔画类
型下未完成匹配的笔画数量;

B、若某种笔画类型集合中包含的未完成匹配笔画数与标准汉字该笔画类型未完成匹配的
笔画数一致,则计算该类型笔画中各笔画与外包矩形顶点的相对位置,计算方法为:获得笔画
S中心坐标其中m为笔画S包含点的数量,计算外包矩
形顶点(x,y)与P的距离H

H = ( x - x ) 2 + ( y - y ) 2 - - - ( b ) ]]>

依次计算同类笔画中用户手写汉字笔画及标准汉字笔画与左上角点距离,并按距离值分别
对该类型下的用户手写笔画集与标准笔画集进行排序,如在排序过程中某一集合出现相同值的
H,则按顺时针方向分别重新计算所有点与右上角点、右下角点、左下角点的距离,直到获得不
一样的H值,根据排序后笔画在该类笔画集中所处的位置与标准汉字笔画集中标准笔画所处的
位置完成笔画对应关系的建立。

以“汉”为例,左边“三点水”中的“提”、右边“又”中的“横撇”可以通过笔画类型
唯一性判断实现对应,右边“又”中的“捺”可以通过绝对位置关系唯一性特征实现对应,而
左边“三点水”中的前面两“撇”,因为笔画类型不唯一,且在同一个子格内,且与已知笔画
没有相交关系,无法通过笔画类型唯一性、绝对位置关系唯一性以及相交特征唯一性实现判断,
但通过本步描述相对位置关系相似性,可计算出两点的中心距离与左上角顶点位置关系存在差
异,因此可通过相对位置相似性判断实现对应,如图6。

4、对于通过上述步骤仍未完成对应关系建立的笔画进行综合相似性判断,实现用户手写
汉字中所有笔画与标准字笔画对应关系的建立。

A、计算笔画类型相似度方法:笔画Si和笔画S′i笔画类型相似度,即为两个笔画所包含各
个笔段相似度的乘积。从Si和S′i的第一个笔段开始比较,根据其对应笔段之间的角度差,计
算获得一个0到1之间的相似度得分,然后对所有笔段的相似度进行累乘。如果Si与S′i多笔
段数量不一致,则每差异一个笔段,累乘的结果再乘0.5,累乘结果即为笔画Si和笔画S′i的相
似度Di,遍历计算用户手写汉字中每个未建立对应关系的笔画与标准笔画中未建立对应关系
笔画的相似度,获得笔画类型相似度集合D,并按相似度值的高低对每个子集进行降序排列,
D={{d11,d12,…,d1j},{d21,d22,…,d2j},…,{di1,di2,…,dij}},其中i为用户手写汉字未实现匹配
笔画的数量,j为标准汉字未实现匹配笔画的数量,对相似度集合D内的每个子集进行归一化
处理,d′in=1-n/j,其中n为该相似度din在其子集中排序后所处位置,j为标准汉字未实现匹
配笔画的数量,获得新的相似度集合D1;

B、计算绝对位置关系相似度方法:提取绝对位置关系唯一性判断计算结果,获得用户手
写汉字及标准汉字未实现匹配笔画所处的子格信息,计算每个手写笔画与标准笔画的绝对位置
关系相似度,其中m为用户手写笔画与标准笔画所处位置相同的子格数量,n为
手写笔画与标准笔画所处位置不同的子格数量,j为手写笔画与标准笔画所处的子格总数,对
相似度计算结果进行归一化处理,获得相对位置相似度集合D2;

C、计算相对位置相似度方法:分别计算用户手写汉字及标准汉字未完成匹配的笔画与外
包矩形顶点的相对位置,计算笔画Si相对位置的方法为:获得笔画Si中心坐标其
中m为笔画Si包含点的数量,根据公式(b)计算外包矩形顶点(x,
y)与P的距离H;

依次计算所有未实现匹配的用户手写汉字笔画及标准汉字笔画与左上角点距离,并按距离
值分别对该类型下的用户手写笔画集与标准笔画集进行排序,如在排序过程中某一集合出现相
同值的H,则按顺时针方向分别重新计算相同值的点与右上角点、右下角点、左下角点的距离,
直到获得不一样的H值,对排序后的子集进行归一化处理,其中n为用户手
写汉字笔画Si在用户手写汉字未完成匹配笔画相对位置排序集合中所处位置,m为标准汉字笔
画S′i在标准汉字未完成匹配笔画相对位置排序集合中所处的位置,j为标准汉字未实现匹配笔
画的数量,获得相对位置相似度集合D3;

D、计算综合相似性方法:

综合相似度D=D1+D2+D3,其中D1为笔画类型相似度,D3为绝对位置关系相似度,D3为相对
位置相似度,对于用户手写汉字未完成匹配的笔画,取相似度值D最大的标准笔画与其进行匹
配,进而实现所有用户手写汉字笔画与标准汉字笔画的一一对应的建立。

以上实施方式仅为体现本发明内容的较佳实施例,依据本发明的思想,在具体实施过程中
实施流程会有改变之处,本说明书内容不应理解为对本发明的限制。

一种手写汉字笔画识别方法.pdf_第1页
第1页 / 共15页
一种手写汉字笔画识别方法.pdf_第2页
第2页 / 共15页
一种手写汉字笔画识别方法.pdf_第3页
第3页 / 共15页
点击查看更多>>
资源描述

《一种手写汉字笔画识别方法.pdf》由会员分享,可在线阅读,更多相关《一种手写汉字笔画识别方法.pdf(15页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103810506 A (43)申请公布日 2014.05.21 CN 103810506 A (21)申请号 201410003668.1 (22)申请日 2014.01.03 G06K 9/68(2006.01) (71)申请人 南京师范大学 地址 210046 江苏省南京市亚东新城区文苑 路 1 号 (72)发明人 白晓东 姜杰 黄峰 仇宏斌 李艺 (74)专利代理机构 南京知识律师事务所 32207 代理人 李媛媛 (54) 发明名称 一种手写汉字笔画识别方法 (57) 摘要 本发明公开一种手写汉字笔画的识别方法。 具体步骤为 : 建立标准汉字笔画、 位置关系。

2、、 相交 关系的特征集 ; 记录手写汉字笔画书写特征, 建 立手写汉字特征集 ; 分离笔画类型唯一性笔画, 与标准汉字进行匹配 ; 建立手写汉字外包矩形, 并将矩形等分为若干个子格, 确定每个笔画所处 的子格, 根据绝对位置关系与标准汉字进行匹配 ; 抽取手写汉字中与已确定对应关系笔画具有相交 特征的笔画, 根据相交关系与标准汉字进行匹配 ; 计算同类笔画的相对位置关系, 根据相对位置相 似性与标准汉字进行匹配 ; 对剩余笔画进行综合 相似性判断, 最终完成所有笔画对应关系的建立。 本发明的方法, 实现了用户手写汉字与标准汉字 笔画一一对应关系的建立, 具有重要的应用价值。 (51)Int.C。

3、l. 权利要求书 2 页 说明书 7 页 附图 5 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书7页 附图5页 (10)申请公布号 CN 103810506 A CN 103810506 A 1/2 页 2 1. 一种手写汉字笔画的识别方法, 其特征在于 : 包括如下步骤 : (1) 建立作为标准的每个汉字笔画类型、 绝对位置和相交关系的特征集 ; (2) 记录手写汉字笔画书写特征, 建立手写汉字特征集 ; (3) 将标准汉字特征集与手写汉字特征集进行比对处理, 建立标准汉字笔画与手写汉 字笔画的一一对应关系 ; 比对处理包含 : 笔画类型唯一性判断、。

4、 绝对位置唯一性判断、 相交 特征唯一性判断和相对位置相似性判断 ; A、 笔画类型唯一性判断为分离手写汉字中的唯一性笔画, 与标准汉字笔画特征进行匹 配 ; B、 绝对位置唯一性判断为建立手写汉字外包矩形, 并将矩形等分为若干子格, 确定每 个笔画所处的子格, 与标准汉字绝对位置特征进行匹配 ; C、 相交特征唯一性判断为抽取手写汉字中与已确定对应关系笔画具有相交特征的笔 画, 根据相交关系与标准汉字相交关系特征进行匹配 ; D、 相对位置相似性判断为将未完成匹配的笔画按笔画类型进行聚类, 若某种笔画类 型集合中包含的未完成匹配笔画数与标准汉字该笔画类型未完成匹配的笔画数一致, 则计 算该类。

5、型笔画中各笔画与外包矩形顶点的相对位置, 根据相对位置关系与标准汉字进行匹 配 ; (4) 对于通过上述步骤仍未完成对应关系建立的笔画进行综合相似性判断, 实现手写 汉字中所有笔画与标准汉字对应关系的建立。 2. 根据权利要求 1 所述的一种手写汉字笔画的识别方法, 其特征在于, 所述步骤 (1) 中, 建立标准汉字特征集的方法如下 : (1) 根据汉字笔画规范, 将作为标准汉字径迹切分为由若干笔画组成的集合, 按笔画类 型进行聚类, 建立标准汉字笔画特征集 ; (2) 遍历上述标准汉字径迹点集, 获取其中 X 坐标最小值 xmin及最大值 xmax, Y 坐标最小 值 ymin及最大值 ym。

6、ax,, 以 (xmin, ymin) ,(xmin, ymax) ,(xmax, ymin) ,(xmax, ymax) 四个点为顶点构建矩 形, 该矩形即为此标准汉字的外包矩形, 将外包矩形等分为若干子格, 确定各笔画在所处的 子格, 建立绝对位置关系标准特征集 ; (3) 遍历标准汉字笔画特征集, 判断单个笔画内部是否存在折点, 如存在, 则将此笔画 从折点断开, 拆分为若干个走向独立的笔段, 如不存在折点, 则将此笔画做为一个笔段处 理, 根据不同笔画间笔段的相交关系判断笔画是否相交, 建立标准汉字相交关系特征集。 3. 根据权利要求 1 所述的一种手写汉字笔画的识别方法, 其特征在于。

7、, 所述步骤 (2) 的 具体步骤如下 : 根据用户在平台上手写某个汉字的笔迹移动情况, 获取该手写汉字点集, 将用户书写 过程中从下笔到起笔所形成的点集定义为一个笔画 ; 遍历笔画中的所有点, 对原始点集进 行降噪处理, 并对笔画进行冗余化归类, 将相近笔画同归为某一类进行处理。 4. 根据权利要求 1 所述的一种手写汉字笔画的识别方法, 其特征在于, 所述步骤 (3) 中 比对处理的具体方法包含 : (1) 笔画类型唯一性判断 : 遍历用户手写汉字笔画类型特征集, 统计组成该汉字的所 有笔画中各类型笔画的数量, 获取其中在某种笔画类型中数量等于 1 的笔画, 与标准汉字 笔画类型特征集进行。

8、比对, 确定该类唯一性笔画的对应关系 ; 权 利 要 求 书 CN 103810506 A 2 2/2 页 3 (2) 绝对位置唯一性判断 : 遍历用户手写汉字的特征点集合, 获取其中 X 坐标最小值 xmin及最大值 xmax, Y 坐标最小值 ymin及最大值 ymax,, 以 (xmin, ymin) ,(xmin, ymax) ,(xmax, ymin) , (xmax, ymax) 四个点为顶点构建矩形, 该矩形即为此标准汉字的外包矩形, , 将外包矩形等分 为与标准汉字拆分方法一致的若干子格, 判断用户手写汉字每个笔画所处的子格, 若某笔 画在其所属的笔画类型中与子格的位置关系存在。

9、唯一性, 即某个子格内只存在一个未实现 与标准汉字笔画对应关系匹配的某种类型笔画, 则分离该笔画与标准汉字笔画绝对位置特 征集进行比对, 确定该笔画的对应关系 ; (3) 相交特征唯一性判断 : 遍历用户手写汉字笔画特征集, 判断各个笔画间是否存在相 交关系。提取用户手写汉字中已经完成与标准汉字对应的笔画或笔段, 通过判断其相交情 况确定未知笔画与标准汉字笔画的对应关系 ; (4) 相对位置相似性判断 : 抽取用户手写汉字中未完成匹配的笔画, 并按笔画类型进行 聚类, 判断手写汉字与标准汉字相同笔画类型集中包含的未完成匹配笔画数量是否一致, 若数量一致, 则分别计算该类型笔画中用户手写汉字及标。

10、准汉字各笔画与外包矩形各顶点 的相对位置, 根据相对位置相似性建立用户手写汉字笔画与标准汉字笔画的对应关系。 5. 根据权利要求 1 所述的一种手写汉字笔画的识别方法, 其特征在于, 所述步骤 (4) 中 综合相似性判断方法如下 : 对于通过步骤 (1) -(3) 仍未完成对应关系建立的用户手写汉字笔画, 分别计算其与标 准汉字中未完成对应关系建立笔画的笔画类型相似度、 绝对位置关系相似度、 相对位置关 系相似度, 并将三种相似度进行综合处理, 根据综合相似性建立用户手写汉字笔画与标准 汉字笔画的对应关系。 权 利 要 求 书 CN 103810506 A 3 1/7 页 4 一种手写汉字笔画。

11、识别方法 技术领域 0001 本发明涉及利用计算机对汉字书写进行评价的技术领域, 尤其涉及一种手写汉字 笔画识别方法。 背景技术 0002 文字是记录、 传递语言信息的社会性符号系统, 汉字作为中华民族的一种文字更 是承载着我们民族的历史、 文化与气质, 它是五千年中华文明最直接的传承者。 而伴随着电 脑的普及, 人们对电脑打字越来越依赖, 手写汉字的机会则越来越少。 手写汉字的关注程度 和练习强度被大大弱化, 如何提升国人汉字书写能力的已成为一个亟待解决的问题。 0003 目前手写汉字书写自动评价方法主要有以下几种 : 0004 1、 通过记录书写笔迹、 笔画数、 判断笔画相交关系来进行评价。

12、, 如中国发明专利 “手写汉字笔画相交离的规范性判定方法和装置” (公开号 : CN101320422A) 公开了一种通过 判断手写汉字笔画相交离关系判断手写汉字书写是否规范的方法 ; 0005 2、 通过对人工给定的汉字样本进行机器学习, 然后使用图像处理与人工智能的方 法对手写汉字进行相似度模糊判断, 如中国发明专利 “一种汉字书写美观度的计算机评估 方法” ( 公开号 :CN101295371A) ; 0006 3、 通过判断手写汉字的横向、 纵向比例关系、 结构特征以及手写汉字各点在书写 空间内的分布关系进行评价, 如中国发明专利书写汉字结构规范性评价的方法和装置 (公 开号 “CN1。

13、01251891A” ) 。 0007 上述方法虽然能在某些方面对于手写汉字书写质量进行评价, 但这些方法都没有 实现笔画关系的一一对应, 因而无法对每一笔画的正确性进行判断, 无法实现笔顺正确性 判断、 结构合理性判断以及整体书写质量评价。 发明内容 0008 本发明提供一种手写汉字笔画的识别方法, 该方法是通过笔画类型判断、 位置关 系判断、 相交关系判断、 综合相似性判断等步骤建立手写汉字各笔画与给定的标准汉字各 笔画的对应关系, 实现对于手写汉字笔画的识别。 0009 本发明采用的技术方案如下 : 0010 一种手写汉字笔画识别方法, 具体包括如下步骤 : 0011 (1) 建立作为标。

14、准的每个汉字笔画类型、 绝对位置和相交关系的特征集 ; 0012 (2) 记录手写汉字笔画书写特征, 建立手写汉字特征集 ; 0013 (3) 将标准汉字特征集与手写汉字特征集进行比对处理, 建立标准汉字笔画与手 写汉字笔画的一一对应关系 ; 比对处理包含 : 笔画类型唯一性判断、 绝对位置唯一性判断、 相交特征唯一性判断和相对位置相似性判断 ; 0014 A、 笔画类型唯一性判断为分离手写汉字中的唯一性笔画, 与标准汉字笔画特征进 行匹配 ; 说 明 书 CN 103810506 A 4 2/7 页 5 0015 B、 绝对位置唯一性判断为建立手写汉字外包矩形, 并将矩形等分为若干子格, 确。

15、 定每个笔画所处的子格, 与标准汉字绝对位置特征进行匹配 ; 0016 C、 相交特征唯一性判断为抽取手写汉字中与已确定对应关系笔画具有相交特征 的笔画, 根据相交关系与标准汉字相交关系特征进行匹配 ; 0017 D、 相对位置相似性判断为将未完成匹配的笔画按笔画类型进行聚类, 若某种笔画 类型集合中包含的未完成匹配笔画数与标准汉字该笔画类型未完成匹配的笔画数一致, 则 计算该类型笔画中各笔画与外包矩形顶点的相对位置, 根据相对位置关系与标准汉字进行 匹配 ; 0018 (4) 对于通过上述步骤仍未完成对应关系建立的笔画进行综合相似性判断, 实现 手写汉字中所有笔画与标准汉字对应关系的建立。 。

16、0019 所述步骤 (1) 中, 建立标准汉字特征集的方法如下 : 1) 根据汉字笔画规范, 将作为 标准汉字径迹切分为由若干笔画组成的集合, 按笔画类型进行聚类, 建立标准汉字笔画特 征集 ; 2) 遍历上述标准汉字径迹点集, 获取其中 X 坐标最小值 xmin及最大值 xmax, Y 坐标最小 值 ymin及最大值 ymax,, 以 (xmin, ymin) ,(xmin, ymax) ,(xmax, ymin) ,(xmax, ymax) 四个点为顶点构建矩 形, 该矩形即为此标准汉字的外包矩形, 将外包矩形等分为若干子格, 确定各笔画在所处的 子格, 建立绝对位置关系标准特征集 ; 3。

17、) 遍历标准汉字笔画特征集, 判断单个笔画内部是否 存在折点, 如存在, 则将此笔画从折点断开, 拆分为若干个走向独立的笔段, 如不存在折点, 则将此笔画做为一个笔段处理, 根据不同笔画间笔段的相交关系判断笔画是否相交, 建立 标准汉字相交关系特征集。 0020 所述步骤 (2) 的具体步骤如下 : 根据用户在平台上手写某个汉字的笔迹移动情 况, 获取该手写汉字点集, 将用户书写过程中从下笔到起笔所形成的点集定义为一个笔画 ; 遍历笔画中的所有点, 对原始点集进行降噪处理, 并对笔画进行冗余化归类, 将相近笔画同 归为某一类进行处理。 0021 所述步骤 (3) 中比对处理的具体方法包含 : 。

18、1) 笔画类型唯一性判断 : 遍历用户手 写汉字笔画类型特征集, 统计组成该汉字的所有笔画中各类型笔画的数量, 获取其中在某 种笔画类型中数量等于 1 的笔画, 与标准汉字笔画类型特征集进行比对, 确定该类唯一性 笔画的对应关系 ; 2) 绝对位置唯一性判断 : 遍历用户手写汉字的特征点集合, 获取其中 X 坐 标最小值xmin及最大值xmax, Y坐标最小值ymin及最大值ymax,, 以 (xmin, ymin) ,(xmin, ymax) ,(xmax, ymin) ,(xmax, ymax) 四个点为顶点构建矩形, 该矩形即为此标准汉字的外包矩形, , 将外包矩形 等分为与标准汉字拆分。

19、方法一致的若干子格, 判断用户手写汉字每个笔画所处的子格, 若 某笔画在其所属的笔画类型中与子格的位置关系存在唯一性, 即某个子格内只存在一个未 实现与标准汉字笔画对应关系匹配的某种类型笔画, 则分离该笔画与标准汉字笔画绝对位 置特征集进行比对, 确定该笔画的对应关系 ; 3) 相交特征唯一性判断 : 遍历用户手写汉字 笔画特征集, 判断各个笔画间是否存在相交关系。提取用户手写汉字中已经完成与标准汉 字对应的笔画或笔段, 通过判断其相交情况确定未知笔画与标准汉字笔画的对应关系 ; 4) 相对位置相似性判断 : 抽取用户手写汉字中未完成匹配的笔画, 并按笔画类型进行聚类, 判 断手写汉字与标准汉。

20、字相同笔画类型集中包含的未完成匹配笔画数量是否一致, 若数量一 致, 则分别计算该类型笔画中用户手写汉字及标准汉字各笔画与外包矩形各顶点的相对位 置, 根据相对位置相似性建立用户手写汉字笔画与标准汉字笔画的对应关系。 说 明 书 CN 103810506 A 5 3/7 页 6 0022 所述步骤 (4) 中综合相似性判断方法如下 : 对于通过步骤 (1) -(3) 仍未完成对应 关系建立的用户手写汉字笔画, 分别计算其与标准汉字中未完成对应关系建立笔画的笔画 类型相似度、 绝对位置关系相似度、 相对位置关系相似度, 并将三种相似度进行综合处理, 根据综合相似性建立用户手写汉字笔画与标准汉字笔。

21、画的对应关系。 0023 本发明与现有技术相比的有益效果 : 0024 (1) 本方法通过计算机自动建立手写汉字笔画与标准汉字笔画的对应关系, 完成 手写汉字笔画的识别, 在书写单字完成以后即可完成识别, 具有客观、 高效、 时效性强的优 点。 0025 (2) 本方法实现了手写汉字与标准汉字笔画一一对应关系的建立, 使得解决无监 督情况下手写汉字练习过程中笔顺正确性判断、 结构合理性判断以及整体书写质量的评价 成为可能, 具有重要的应用价值。 附图说明 0026 图 1 是本发明的流程图 ; 0027 图 2 是本发明所描述外包矩形等分为四个子格示意图 ; 0028 图 3 是通过笔画唯一性。

22、确定笔画对应关系的示意图 ; 0029 图 4 是通过笔画唯一性、 绝对位置关系确定笔画对应关系的示意图 ; 0030 图 5 是通过笔画唯一性、 绝对位置关系、 相交特征确定笔画对应关系的示意图 ; 0031 图 6 是通过笔画唯一性、 绝对位置关系、 相对位置相似性确定笔画对应关系的示 意图。 具体实施方式 0032 下面结合附图, 对本发明做详细说明。 0033 如图 1, 一种手写汉字笔画的识别方法, 其具体实施步骤如下 : 0034 1、 建立汉字笔画、 位置、 相交关系的标准特征集 ; 0035 (1) 根据汉字笔画规范, 将标准汉字径迹人工切分为由若干笔画组成的集合, 按笔 画类。

23、型进行聚类, 建立笔画标准特征集 ; 0036 (2) 遍历构成标准汉字的特征点集合, 获取其中 X 坐标最小值及最大值 xmin、 xmax, Y 坐标最小值及最大值 ymin、 ymax, 以 (xmin, ymin) ,(xmin, ymax) ,(xmax, ymin) ,(xmax, ymax) 四个点为 顶点构建矩形, 该矩形即为此标准汉字的外包矩形, 将外包矩形等分为若干子格, 确定各笔 画在所处的子格, 建立绝对位置关系标准特征集, 如图 2 所示, 本实施例采用的是将外包矩 形等分为四格 ; 0037 (3) 遍历标准汉字笔画特征集, 判断单个笔画内部是否存在折点, 如存在,。

24、 则将此 笔画从折点断开, 拆分为若干个走向独立的笔段, 如不存在折点, 则将此笔画做为一个笔段 处理。判断不同笔画的笔段间是否存在相交的特征, 取不同笔画间两个笔段端点的坐标 p1 (x1,y1),p2(x2,y2),p3(x3,y3),p4(x4,y4), 根据笔段 1 的起点 p1, 终点 p2, 计算获得该笔段的直 线方程 F1, 根据笔段 2 的起点 p3, 终点 p4, 计算获得该笔段的直线方程 F2, 计算两个方程是 否存在共同解, 若无, 则这两个笔段不相交, 若有共同解, 判断此解是否同时落在笔段 1 与 笔段 2 上, 若同时落在两个笔段上, 则这两个笔段相交, 否则不相交。

25、。若存在相交的笔段, 则 说 明 书 CN 103810506 A 6 4/7 页 7 认为这两个笔画具有相交特征, 根据判断结果建立相交关系标准特征集。 0038 将标准汉字笔画径迹点集合、 绝对位置关系特征、 相交关系特征以 XML 的方式存 储。 0039 2、 记录用户笔画书写特征, 建立用户手写汉字特征集。 0040 根据用户在平台上手写某个汉字的笔迹移动情况, 获取该手写汉字点集, 并将点 集表示为 P=Pk(xk,yk) , k=1n, n 为用户书写某个汉字所获得的特征点数量, 将用户书写 过程中下笔到起笔所形成的点集定义为一个笔画, 笔画集表示为 O=Oi(p1,p2pj) 。

26、, i=1 m, 其中 m 为该手写汉字笔画的数量, j 表示某一笔画中包含的点集数量。遍历笔画中的所 有点, 对原始点集进行降噪处理, 降噪处理的实现方式为 : 计算相邻点之间的距离 L 0041 0042 求 L 的最大值 Lmax, 若相邻两点 pi,pi+1的距离 Li0.2*Lmax, 则去掉点 pi+1, 同时使 Li+1=Li+Li+1o, 遍历手写汉字的所有笔画, 形成新的笔画集 S=Si(p1,p2pk) , i=1m, 其中 m 为该手写汉字笔画的数量, k 表示某一笔画中包含的点集数量。 0043 对笔画进行冗余化归类, 用户在书写过程中, 由于设备、 习惯等原因, 可能。

27、书写笔 画并不能严格对应汉字笔画规范, 因此本步操作对笔画进行冗余化归类, 将相近笔画同归 为某一类进行处理。 0044 3、 将标准汉字特征集与用户手写汉字特征集进行比对处理, 建立标准汉字笔画与 手写汉字各笔画的一一对应关系。 0045 (1) 笔画类型唯一性判断 : 分离用户手写汉字中的唯一性笔画, 与标准汉字笔画 特征进行匹配 ; 0046 遍历手写汉字笔画集 S, 统计组成该汉字的所有笔画中各类型笔画的数量, 获取其 中在某种笔画类型中数量等于 1 的笔画, 与标准汉字笔画集进行比对, 确定该类唯一性笔 画的对应关系。 0047 以 “大” 为例, 该字由三个笔画组成, 其笔画类型分。

28、别为 “横” ,“撇” ,“捺” , 且在该汉 字中每个笔画类型只包含一个笔画, 因此通过分离唯一性笔画与标准汉字笔画集比对, 即 可确定该汉字每个笔画的对应关系, 完成匹配。 0048 再以 “王” 为例, 该字由四个笔画组成, 其笔画类型分别为 “横” ,“竖” , 其中有三个 笔画为 “横” , 一个笔画为 “竖” , 通过分离唯一性笔画与标准汉字笔画集比对, 可确定 “竖” 的 对应关系,“横” 因为笔画数量不唯一此处无法实现对应, 留待后续进一步处理, 如图3所示。 0049 (2) 绝对位置唯一性判断 : 建立用户手写汉字外包矩形, 并将矩形等分为与标准汉 字相同的子格, 确定每个。

29、笔画所处的子格, 与标准汉字绝对位置特征进行匹配 ; 0050 遍历用户手写汉字点集 P=Pk(xk,yk) , k=1n, 获取其中 X 坐标最小值及最大值 xmin、 xmax, Y 坐标最小值及最大值 ymin、 ymax, 以 (xmin, ymin) ,(xmin, ymax) ,(xmax, ymin) ,(xmax, ymax) 四个点为顶点构建矩形, 该矩形即为此标准汉字的外包矩形, 并将矩形等分为与标准汉字 相同的子格, 本实施例将外包矩形等分为四个子格, 判断每个笔画所处的子格, 方法如下 : 0051 A、 获取该笔画包含的点集 P=Pk(xk,yk) , k=1n,n 。

30、为该笔画包含的点集数 ; 0052 B、 去除k0.15*n或者k0.85*n的点, 获得新的点集P=Pk (xk,yk) , k=1 m,m 为去除首尾点集后该笔画包含的点集数 ; 说 明 书 CN 103810506 A 7 5/7 页 8 0053 C、 遍历 P, 确定每个点所处的子格 ; 0054 D、 计算每个子格中包含该笔画点的数量N=N1,N2,N3,.,Ni,若Ni0.2*m, m为去 除首尾点集后该笔画包含的点集数, 则认为该笔画不处于格子 i 中 ; 0055 E、 对于所有未实现与标准汉字笔画建立对应关系的笔画重复 A-D 的操作, 获取每 个笔画所处的子格。 0056。

31、 遍历所有未实现匹配的笔画, 若某笔画在其所属的笔画类型中与所处子格存在唯 一性, 即某个子格内只存在一个未实现匹配的某种类型笔画, 则分离该笔画与标准汉字笔 画绝对位置特征集进行比对, 确定该笔画的对应关系。 0057 以 “你” 为例,“竖” 、“横折钩” 、“竖弯钩” 、“捺” 可以通过笔画类型唯一性判断实现 对应, 左下角的 “撇” 虽然笔画类型不唯一, 但因为在其所处的子格内只有一个撇, 所以可以 通过绝对位置关系唯一性实现对应, 左上角的两 “撇” 在同一子格内笔画类型不唯一, 因为 无法实现通过笔画类型唯一性以及绝对位置关系特征实现对应, 如图 4。 0058 (3) 相交特征唯。

32、一性判断 : 抽取用户手写汉字中与已确定对应关系笔画具有相交 特征的笔画, 根据相交关系与标准汉字相交关系特征进行匹配 ; 0059 A、 遍历手写汉字点集 S, 判断单个笔画内部是否存在折点, 如存在, 则将此笔画从 折点断开, 将一个笔画拆分为若干个具有独立走向的笔段, 如不存在折点, 则将此笔画做为 一个笔段处理 ; 0060 B、 判断不同笔画的笔段间是否存在相交的特征, 取不同笔画间两个笔段端点的坐 标 p1(x1,y1),p2(x2,y2),p3(x3,y3),p4(x4,y4), 根据笔段 1 的起点 p1, 终点 p2, 计算获得该笔段 的直线方程 F1, 根据笔段 2 的起点。

33、 p3, 终点 p4, 计算获得该笔段的直线方程 F2, 计算两个方 程是否存在共同解, 若无, 则这两个笔段不相交, 若有共同解, 判断此解是否同时落在笔段 1 与笔段 2 上, 若同时落在两个笔段上, 则这两个笔段相交, 否则不相交。若不同笔画存在相 交的笔段, 则认为这两个不同笔画具有相交特征 ; 0061 C、 提取用户手写汉字中已经完成与标准汉字对应的笔画 Si, 判断是否有仍未确定 对应关系的笔画 Sk与其相交, 若满足相交且 Sk在所有与 Si相交的笔画中, 其笔画类型具有 唯一性, 则分离该笔画与标准汉字笔画集进行比对, 确定其对应关系。若 Sk与 Si满足相交, 但不满足所有。

34、与 Si相交的笔画中笔画类型唯一的条件, 则判断与 Si相交的各同类笔画, 其 自身与其他类型笔画的相交关系, 根据相交关系与标准汉字笔画集进行比对, 确定其对应 关系。 0062 以 “你” 为例,“竖” 、“横折钩” 、“竖弯钩” 、“捺” 可以通过笔画类型唯一性判断实现 对应, 左下角的 “撇” 虽然笔画类型不唯一, 但因为在其所处的子格内只有一个撇, 所以可以 通过绝对位置关系唯一性实现对应, 左上角的两 “撇” 虽然在同一格子内, 且笔画类型不唯 一, 但通过相交唯一性判断, 左边一 “撇” 与 “竖” 相交, 右边一 “撇” 与 “横折钩” 相交, 因此 可通过相交特征唯一性判断实。

35、现这两 “撇” 的对应, 如图 5。 0063 (4) 相对位置相似性判断 : 将未完成匹配的笔画按笔画类型进行聚类, 若某种笔画 类型集合中包含的未完成匹配笔画数与标准汉字该笔画类型未完成匹配的笔画数一致, 则 计算该类型笔画中各笔画与外包矩形顶点的相对位置, 根据相对位置关系与标准汉字笔画 进行匹配 ; 0064 A、 将未完成匹配的笔画按笔画类型进行聚类操作, 获得新的笔画集 S, 说 明 书 CN 103810506 A 8 6/7 页 9 S=s11,s12,,s1k, s21,s22,,s2k,sn1,sn2,,snk, 其中 n 为未完成匹配的笔 画类型数量, k 为某种笔画类型。

36、下未完成匹配的笔画数量 ; 0065 B、 若某种笔画类型集合中包含的未完成匹配笔画数与标准汉字该笔画类型未完 成匹配的笔画数一致, 则计算该类型笔画中各笔画与外包矩形顶点的相对位置, 计算方法 为 : 获得笔画 S 中心坐标其中m 为笔画 S 包含点的数 量, 计算外包矩形顶点 (x, y) 与 P 的距离 H 0066 0067 依次计算同类笔画中用户手写汉字笔画及标准汉字笔画与左上角点距离, 并按距 离值分别对该类型下的用户手写笔画集与标准笔画集进行排序, 如在排序过程中某一集合 出现相同值的 H, 则按顺时针方向分别重新计算所有点与右上角点、 右下角点、 左下角点的 距离, 直到获得不。

37、一样的 H 值, 根据排序后笔画在该类笔画集中所处的位置与标准汉字笔 画集中标准笔画所处的位置完成笔画对应关系的建立。 0068 以 “汉” 为例, 左边 “三点水” 中的 “提” 、 右边 “又” 中的 “横撇” 可以通过笔画类型唯 一性判断实现对应, 右边 “又” 中的 “捺” 可以通过绝对位置关系唯一性特征实现对应, 而左 边 “三点水” 中的前面两 “撇” , 因为笔画类型不唯一, 且在同一个子格内, 且与已知笔画没有 相交关系, 无法通过笔画类型唯一性、 绝对位置关系唯一性以及相交特征唯一性实现判断, 但通过本步描述相对位置关系相似性, 可计算出两点的中心距离与左上角顶点位置关系存 。

38、在差异, 因此可通过相对位置相似性判断实现对应, 如图 6。 0069 4、 对于通过上述步骤仍未完成对应关系建立的笔画进行综合相似性判断, 实现用 户手写汉字中所有笔画与标准字笔画对应关系的建立。 0070 A、 计算笔画类型相似度方法 : 笔画 Si和笔画 S i笔画类型相似度, 即为两个笔画 所包含各个笔段相似度的乘积。 从Si和Si的第一个笔段开始比较, 根据其对应笔段之间 的角度差, 计算获得一个 0 到 1 之间的相似度得分, 然后对所有笔段的相似度进行累乘。如 果Si与Si多笔段数量不一致, 则每差异一个笔段, 累乘的结果再乘0.5, 累乘结果即为笔 画Si和笔画Si的相似度Di。

39、, 遍历计算用户手写汉字中每个未建立对应关系的笔画与标准 笔画中未建立对应关系笔画的相似度, 获得笔画类型相似度集合 D, 并按相似度值的高低 对每个子集进行降序排列, D=d11,d12,,d1j, d21,d22,,d2j,di1,di2,,dij, 其中 i 为用户手写汉字未实现匹配笔画的数量, j 为标准汉字未实现匹配笔画的数量, 对相 似度集合 D 内的每个子集进行归一化处理, din=1-n/j, 其中 n 为该相似度 din在其子集中 排序后所处位置, j 为标准汉字未实现匹配笔画的数量 , 获得新的相似度集合 D1; 0071 B、 计算绝对位置关系相似度方法 : 提取绝对位置。

40、关系唯一性判断计算结果, 获得 用户手写汉字及标准汉字未实现匹配笔画所处的子格信息, 计算每个手写笔画与标准笔画 的绝对位置关系相似度,其中 m 为用户手写笔画与标准笔画所处位置相同的子 格数量, n 为手写笔画与标准笔画所处位置不同的子格数量, j 为手写笔画与标准笔画所处 的子格总数, 对相似度计算结果进行归一化处理,获得相对位置相似度集 说 明 书 CN 103810506 A 9 7/7 页 10 合 D2; 0072 C、 计算相对位置相似度方法 : 分别计算用户手写汉字及标准汉字未完成匹配的 笔画与外包矩形顶点的相对位置, 计算笔画 Si相对位置的方法为 : 获得笔画 Si中心坐标。

41、 其中m为笔画Si包含点的数量, 根据公式 (b) 计算外包 矩形顶点 (x, y) 与 P 的距离 H ; 0073 依次计算所有未实现匹配的用户手写汉字笔画及标准汉字笔画与左上角点距 离, 并按距离值分别对该类型下的用户手写笔画集与标准笔画集进行排序, 如在排序过 程中某一集合出现相同值的 H, 则按顺时针方向分别重新计算相同值的点与右上角点、 右下角点、 左下角点的距离, 直到获得不一样的 H 值, 对排序后的子集进行归一化处理, 其中n为用户手写汉字笔画Si在用户手写汉字未完成匹配笔画相对位置排 序集合中所处位置, m 为标准汉字笔画 Si在标准汉字未完成匹配笔画相对位置排序集合 中所。

42、处的位置 ,j 为标准汉字未实现匹配笔画的数量 , 获得相对位置相似度集合 D3; 0074 D、 计算综合相似性方法 : 0075 综合相似度 D=D1+D2+D3, 其中 D1为笔画类型相似度, D3为绝对位置关系相似度, D3 为相对位置相似度, 对于用户手写汉字未完成匹配的笔画, 取相似度值 D 最大的标准笔画 与其进行匹配, 进而实现所有用户手写汉字笔画与标准汉字笔画的一一对应的建立。 0076 以上实施方式仅为体现本发明内容的较佳实施例, 依据本发明的思想, 在具体实 施过程中实施流程会有改变之处, 本说明书内容不应理解为对本发明的限制。 说 明 书 CN 103810506 A 10 1/5 页 11 图 1 说 明 书 附 图 CN 103810506 A 11 2/5 页 12 图 2 说 明 书 附 图 CN 103810506 A 12 3/5 页 13 图 3 说 明 书 附 图 CN 103810506 A 13 4/5 页 14 图 4 图 5 说 明 书 附 图 CN 103810506 A 14 5/5 页 15 图 6 说 明 书 附 图 CN 103810506 A 15 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1