图片文字识别方法.pdf

上传人:a3 文档编号:6018999 上传时间:2019-04-03 格式:PDF 页数:4 大小:199.14KB
返回 下载 相关 举报
摘要
申请专利号:

CN201611166407.7

申请日:

2016.12.16

公开号:

CN106778727A

公开日:

2017.05.31

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06K 9/20申请日:20161216|||公开

IPC分类号:

G06K9/20

主分类号:

G06K9/20

申请人:

高格(天津)信息科技发展有限公司

发明人:

刘洋

地址:

300384 天津市南开区天津市滨海高新区华苑产业区(环外)海泰发展六道3号星企一号园区研发楼316

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

本发明提供一种图片文字识别方法,该图片文字识别方法如下:将用户框选的图片上的文本区域以当前图片形式读取;对框选文本区域中的各个图元文字分别进行选取;将框选文本区域中的第一个图元文字与各种常规字体对应的字模库中的各个字模文字作对比,找到相似度最近的字模文字;并记录该相似度最高的字模文字所在的字模库,定义为标准字模库,此后,将所述框选文本区域中第一个图元文字后面的各图元文字只与所述标准字模库中的各字模文字作比较,在标准字模库中分别找到相似度最高的字模文字,并以可编辑文字的形式输出。该方法可以准确而高效地识别图片中的文字信息。

权利要求书

1.一种图片文字识别方法,其特征在于:该图片文字识别方法如下:将用户框选的图片
上的文本区域以当前图片形式读取;对框选文本区域中的各个图元文字分别进行选取;将
框选文本区域中的第一个图元文字与各种常规字体对应的字模库中的各个字模文字作对
比,找到相似度最近的字模文字;并记录该相似度最高的字模文字所在的字模库,定义为标
准字模库,此后,将所述框选文本区域中第一个图元文字后面的各图元文字只与所述标准
字模库中的各字模文字作比较,在标准字模库中分别找到相似度最高的字模文字,并以可
编辑文字的形式输出。
2.根据权利要求1所述的图片文字识别方法,其特征在于:所述常规字体对应的字模库
包括宋体、仿宋、黑体、楷体、行楷、隶书对应的字模库。
3.根据权利要求1所述的图片文字识别方法,其特征在于:在分别选取所述框选文本区
域中的各个图元文字时,采用矩形框的形式,所述矩形框的框线与各图元文字的最上端、最
左端、最下端、最右端相切。
4.根据权利要求1所述的图片文字识别方法,其特征在于:在将图元文字与字模文字作
对比时,首先将字模文字进行缩放,使之与欲作对比的图元文字大小相同,然后,将缩放好
的字模文字转换成字模图元,与所述图元文字作布尔差运算,然后以布尔差之后剩下的文
字颜色的多少来衡量相似度,即剩下的文字颜色越少,则相似度越高。

说明书

图片文字识别方法

技术领域

本发明涉及图文软件领域,特别地,是一种图片文字识别方法。

背景技术

对于图片上的文字,在较多情况下需要进行大段地复制使用,因此,必须要首先通
过软件方法先将图片形式的文字转换成可编辑文字;在此过程中,目前使用的方法是,采用
一套字模库,将图片中截取的每一个图元文字与字模库中的各个字模文字进行对比,并将
相似度最高的字模文字以可编辑文字的形式输出,从而使用户获得所需的可编辑文本。

然而,由于各种图片形式的文本通常采用不同的字体,而目前在将图元文字与字
模文字相对比时,通常只采用一套字模库,因此,倘若图元文字的字体与字模库中的字体不
同时,则文字识别的准确性并不高;若采用多套字模库,则按一套字模库的逐字对比的方
式,每个图元文字将需要与多套字模库中的各字模文字相对比,其工作量十分巨大。

发明内容

针对上述问题,本发明的目的在于提供一种图片文字识别方法,该方法可以准确
而高效地识别图片中的文字信息。

本发明解决其技术问题所采用的技术方案是:该图片文字识别方法如下:将用户
框选的图片上的文本区域以当前图片形式读取;对框选文本区域中的各个图元文字分别进
行选取;将框选文本区域中的第一个图元文字与各种常规字体对应的字模库中的各个字模
文字作对比,找到相似度最近的字模文字;并记录该相似度最高的字模文字所在的字模库,
定义为标准字模库,此后,将所述框选文本区域中第一个图元文字后面的各图元文字只与
所述标准字模库中的各字模文字作比较,在标准字模库中分别找到相似度最高的字模文
字,并以可编辑文字的形式输出。

作为优选,所述常规字体对应的字模库包括宋体、仿宋、黑体、楷体、行楷、隶书对
应的字模库。

作为优选,在分别选取所述框选文本区域中的各个图元文字时,采用矩形框的形
式,所述矩形框的框线与各图元文字的最上端、最左端、最下端、最右端相切。

作为优选,在将图元文字与字模文字作对比时,首先将字模文字进行缩放,使之与
欲作对比的图元文字大小相同,然后,将缩放好的字模文字转换成字模图元,与所述图元文
字作布尔差运算,然后以布尔差之后剩下的文字颜色的多少来衡量相似度,即剩下的文字
颜色越少,则相似度越高。

本发明的有益效果在于:在将图元文字与字模文字作对比时,由于采用了多种字
模库,因此,使得识别的准确性得到了很大程度的提高,而由于本方法在对于所述框选文本
区域中的第一个图元文字作对比的过程中,就可以确定框选文本区域中的第一个图元文字
的字体,从而推出该框选文本区域中所有图元文字的字体,这就可以使得后面的图元文字
仅与一种字模库中的字模文字进行对比,不仅对比工作量小,且不失准确性。

具体实施方式

下面对本发明进一步说明:

本发明提供的图片文字识别方法如下:将用户框选的图片上的文本区域以当前图
片形式读取,如,当前图片为允8格式的,那么用户在当前图片上框选部分文本后,将用户框
选的文本区域视为一张待处理的允8图片;然后,对待处理的允8图片中的各个图元文字分
别进行选取,选取时,采用矩形框的形式,以从上至下、从左到右的顺序逐个选取图元文字,
所述矩形框的框线与各图元文字的最上端、最左端、最下端、最右端相切;当选取所述框选
文本区域中的第一个图元文字后,将其与各种常规字体对应的字模库中的各个字模文字作
对比,找到相似度最近的字模文字,将该字模文字以可编辑文字形式输出,同时,记录该相
似度最高的字模文字所在的字模库,定义为标准字模库;此后,将所述框选文本区域中第一
个图元文字后面的各图元文字只与所述标准字模库中的各字模文字作比较,在标准字模库
中分别找到相似度最高的字模文字,并以可编辑文字的形式输出。

为了满足绝大部分图元文字的字体需求,所述常规字体对应的字模库包括宋体、
仿宋、黑体、楷体、行楷、隶书对应的字模库。

另外,在将图元文字与字模文字作对比时,首先将字模文字进行缩放,使之与欲作
对比的图元文字大小相同,然后,将缩放好的字模文字转换成字模图元,与所述图元文字作
布尔差运算,然后以布尔差之后剩下的文字颜色的多少来衡量相似度,即剩下的文字颜色
越少,则相似度越高;如,通常情况下,文字颜色为黑色,则将所述字模图元与图元文字作布
尔差运算后,它们相重合部分的黑色被消除了,由背景色替代,那么如果字模图元和图元文
字完全一样,则布尔差运算之后,则黑色的剩余量为零,而相似度越低,则黑色的剩余量就
越大。

本发明提供的图片文字识别方法在将图元文字与字模文字作对比时,由于采用了
多种字模库,因此,使得识别的准确性得到了很大程度的提高,而由于本方法在对于所述框
选文本区域中的第一个图元文字作对比的过程中,就可以确定框选文本区域中的第一个图
元文字的字体,从而推出该框选文本区域中所有图元文字的字体,这就可以使得后面的图
元文字仅与一种字模库中的字模文字进行对比,不仅对比工作量小,且不失准确性。

图片文字识别方法.pdf_第1页
第1页 / 共4页
图片文字识别方法.pdf_第2页
第2页 / 共4页
图片文字识别方法.pdf_第3页
第3页 / 共4页
点击查看更多>>
资源描述

《图片文字识别方法.pdf》由会员分享,可在线阅读,更多相关《图片文字识别方法.pdf(4页珍藏版)》请在专利查询网上搜索。

本发明提供一种图片文字识别方法,该图片文字识别方法如下:将用户框选的图片上的文本区域以当前图片形式读取;对框选文本区域中的各个图元文字分别进行选取;将框选文本区域中的第一个图元文字与各种常规字体对应的字模库中的各个字模文字作对比,找到相似度最近的字模文字;并记录该相似度最高的字模文字所在的字模库,定义为标准字模库,此后,将所述框选文本区域中第一个图元文字后面的各图元文字只与所述标准字模库中的各字模。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1