《表格图像识别编辑方法及装置.pdf》由会员分享,可在线阅读,更多相关《表格图像识别编辑方法及装置.pdf(8页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 (43)申请公布日 (21)申请号 201410773904.8(22)申请日 2014.12.16G06F 17/24(2006.01)(71)申请人 上海合合信息科技发展有限公司地址 200433 上海市杨浦区国定路 335 号 3号楼7楼B区(72)发明人 沈东辉 陈鹏渊 郑显军(54) 发明名称表格图像识别编辑方法及装置(57) 摘要本发明公开了一种表格图像识别编辑方法,包括:获取所述表格图像,所述表格图像上包含有表格;根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条 ;对一个或多个编辑。
2、单元内的图像进行一次或多次的编辑操作,并根据编辑操作的结果,生成新的表格图像。本发明还公开了一种实现上述表格图像识别编辑方法所采用的表格图像识别编辑装置。本发明通过采用上述技术方案,能够使用户方便的对表格图像进行文字识别和编辑操作,从而高效简便的对表格图像进行处理。(51)Int.Cl.(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书1页 说明书3页 附图3页(10)申请公布号 CN 104462044 A(43)申请公布日 2015.03.25CN 104462044 A1/1 页21.一种表格图像识别编辑方法,其特征在于,包括以下步骤 :步骤一,获取所述表格图像,所述表格。
3、图像上包含有表格 ;步骤二,根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条 ;步骤三,对一个或多个编辑单元内的图像进行一次或多次的编辑操作,并根据辑操作的结果,生成新的表格图像。2.根据权利要求 1 所述的表格图像识别编辑方法,其特征在于,所述步骤一之后,还包括对所述表格图像进行图像处理步骤,所述图像处理包括以下两种中的至少一种 :对表格图像进行拉伸,使得拉伸后的表格的形状为矩形 ;对表格的线条进行处理,将与水平基准的夹角小于某一预设范围的线条的方向拟合为水平方向,将与垂直基准的夹角小于某一预设范围的线条的方向拟。
4、合为垂直方向。3.根据权利要求 1 所述的表格图像识别编辑方法,其特征在于,所述编辑操作包括以下几种中的至少一种 :对所述编辑单元内的文字进行 OCR 识别,并对识别得到的文本进行文本编辑操作 ;将没有包含文字的编辑单元作为文字编辑区域,由用户在所述文字编辑区域中进行文本编辑操作 ;调整一根或多根所述表格的线条的位置,以被调整的线条为边界的编辑单元根据该线条的新位置而重新划分区域 ;删除一根或多根所述表格的线条,以被调整的线条为边界的多个编辑单元被合并 ;增加一根或多根所述表格的线条,该线条穿过的编辑单元以该线条为边界被分成新的编辑单元。4.一种实现如权利要求 1-3 中任意一项所述的表格图像。
5、识别编辑方法所采用的表格图像识别编辑装置,其特征在于,基于计算机系统,包括 :表格图像获取部件,获取所述表格图像,所述表格图像上包含有表格 ;划分部件,根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条 ;编辑部件,对一个或多个编辑单元内的图像进行一次或多次的编辑操作,并根据操作的结果,生成新的表格图像。5.根据权利要求 4 所述的表格图像识别编辑装置,其特征在于,还包括表格图像处理部件,对所述表格图像进行图像处理,所述图像处理包括以下两种中的至少一种 :对表格图像进行拉伸,使得拉伸后的表格的形状为矩形 ;对表格的线。
6、条进行处理,将与水平基准的夹角小于某一预设范围的线条的方向拟合为水平方向,将与垂直基准的夹角小于某一预设范围的线条的方向拟合为垂直方向。权 利 要 求 书CN 104462044 A1/3 页3表格图像识别编辑方法及装置技术领域0001 本发明涉及一种图像处理方法,尤其是一种表格图像识别编辑方法。本发明还涉及一种图像处理装置,尤其是一种表格图像识别编辑装置。背景技术0002 现在,人们已经越来越多的使用电子文档以取代纸质文档。例如,用户可以用智能手机拍摄纸质文档的图像,然后将图像发送给别人以完成信息的传递。但是,以拍摄或扫描得到的电子文档都是以图片格式进行存储的,因此对于上面的文字是难以进行编。
7、辑的。现在,随着 OCR 技术的发展,已有很多软件可以对这些图像上的文字进行识别,供用户进行文本编辑,但是使用起来确不是很方便,尤其是对于包含有表格的文件,由于表格的多样性,图像中的表格不但不能被识别,有时还能造成文字识别的错误,影响识别率,给用户的使用带来了很大的不便。此外,如果发现表格的填写存在错误,用户对图像进行修改也很麻烦。发明内容0003 本发明所要解决的技术问题是提供一种表格图像识别编辑方法,以及实现这种表格图像识别编辑方法所采用的表格图像识别编辑装置,能够方便的对表格图像进行文字识别和编辑,使用户高效简便的对表格图像进行处理。0004 为解决上述技术问题,本发明表格图像识别编辑方。
8、法的技术方案是,包括以下步骤:步骤一,获取所述表格图像,所述表格图像上包含有表格 ;步骤二,根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条 ;步骤三,对一个或多个编辑单元内的图像进行一次或多次的编辑操作,并根据辑操作的结果,生成新的表格图像。0005 本发明还公开了一种实现上述表格图像识别编辑方法所采用的表格图像识别编辑装置,其技术方案是,基于计算机系统,包括 :表格图像获取部件,获取所述表格图像,所述表格图像上包含有表格 ;划分部件,根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格。
9、的线条为边界,且每个编辑单元内不再有所述表格的线条 ;编辑部件,对一个或多个编辑单元内的图像进行一次或多次的编辑操作,并根据操作的结果,生成新的表格图像。0006 本发明通过采用上述技术方案,能够使用户方便的对表格图像进行文字识别和编辑操作,从而高效简便的对表格图像进行处理。附图说明0007 下面结合附图和实施例对本发明作进一步详细的说明 :说 明 书CN 104462044 A2/3 页4图 1 和图 2 为本发明表格图像识别编辑方法实施例的示意图 ;图 3 为本发明表格图像识别编辑装置的示意图。具体实施方式0008 本发明公开了一种表格图像识别编辑方法,包括以下步骤 :步骤一,获取所述表格。
10、图像,所述表格图像上包含有表格 ;步骤二,根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条 ;步骤三,对一个或多个编辑单元内的图像进行一次或多次的编辑操作,并根据辑操作的结果,生成新的表格图像。0009 如图 1 和图 2 所示,用户获取表格图像,获取表格图像的方式可以是拍摄表格图像,也可以是打开包含有表格图像的图片文件。该表格图像上有如图 1 所示的表格 ABCD。由于拍摄的角度问题,原本矩形的表格会在图像上显示为一个如图 1 所示的四边形 ABCD。为了还原这种失真,在获取表格图像之后,本发明表格图像识别编辑方。
11、法还包括对所述表格图像进行图像处理步骤,所述图像处理包括以下两种中的至少一种 :1. 对表格图像进行拉伸,使得拉伸后的表格的形状为矩形。0010 2. 对表格的线条进行处理,将与水平基准的夹角小于某一预设范围的线条的方向拟合为水平方向,将与垂直基准的夹角小于某一预设范围的线条的方向拟合为垂直方向。0011 在进行上述图像处理之后,图 1 中的四边形表格 ABCD 就会被调整为图 2 中的矩形表格 ABCD,并且表格中的线条,例如线条 EF 和线条 GK 也被调整为水平方向和垂直方向,从而消除了拍摄对表格形状造成的失真。0012 根据所述表格的线条,例如线条 EF 和线条 GK,将所述表格图像划。
12、分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条 ;如图 1 和图 2 所示,表格 ABCD 被划分为编辑单元 AGHE、GBFH、EHKD 和 HFCK。0013 然后,对所述编辑单元内的图像进行编辑操作,该编辑操作可以是对所述编辑单元内的图像进行修改、替换等传统的图像编辑操作,也可以是以下几种中的至少一种 :1. 对所述编辑单元内的文字进行 OCR 识别,并对识别得到的文本进行文本编辑操作,例如,图 1 的编辑单元 EHKD 中有手写体的“文字 2”,对该编辑单元的文字进行 OCR 识别,得到如图 2 中编辑单元 EHKC 中的印刷体的“文字 2。
13、”,如果识别结果有误,用户可以进行手动修改。0014 2. 将没有包含文字的编辑单元作为文字编辑区域,由用户在所述文字编辑区域中进行文本编辑操作,例如在图 1 和图 2 的编辑单元 GBFH 中,由用户在其中进行文本编辑操作。0015 3. 调整一根或多根所述表格的线条的位置,以被调整的线条为边界的编辑单元根据该线条的新位置而重新划分区域,例如对图 1 和图 2 中的线条 EF 或 GK 进行调整,以重新划分各编辑单元。0016 4. 删除一根或多根所述表格的线条,以被调整的线条为边界的多个编辑单元被合并,例如如果删除图1和图2中的线条HK,则编辑单元EHKD与编辑单元HFCK就合并成编辑单元。
14、 EFCD。说 明 书CN 104462044 A3/3 页50017 5. 增加一根或多根所述表格的线条,该线条穿过的编辑单元以该线条为边界被分成新的编辑单元。0018 以往的技术中,用户如果需要以电子形式传递纸件的表格文件,需要在拍摄表格文件后,将表格图片发送出去。如果要发送的是需要填写的表格,用户还要事先将表格填好,并且这样发送的表格也是用户手写填写的,此外,表格中如果发现有错误也无法进行修改,除非用户采用 OFFICE 等编辑软件对表格重新进行编辑排版,非常的不方便。但是,在采用本发明表格图像识别编辑方法之后,用户可以方便的对表格图像进行编辑修改,例如用户手写填写的表格,经过识别后可以。
15、变成标准的印刷体,如果发现纸件表格上存在错误,可以在拍摄之后方便的使用本发明进行修改,用户还可以在拍摄空白表格之后使用本发明在电子版本的表格上填写内容。0019 本发明还公开了一种实现上述表格图像识别编辑方法所采用的表格图像识别编辑装置,如图 3 所示,基于计算机系统,所述计算机系统可以包括个人电脑、智能手机、平板电脑等具有计算机硬件和相应的操作软件的系统。0020 本发明表格图像识别编辑装置包括 :表格图像获取部件,获取所述表格图像,所述表格图像上包含有表格 ;划分部件,根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格。
16、的线条 ;编辑部件,对一个或多个编辑单元内的图像进行一次或多次的编辑操作,并根据操作的结果,生成新的表格图像。0021 本发明表格图像识别编辑装置还包括表格图像处理部件,对所述表格图像进行图像处理,所述图像处理包括以下两种中的至少一种 :对表格图像进行拉伸,使得拉伸后的表格的形状为矩形 ;对表格的线条进行处理,将与水平基准的夹角小于某一预设范围的线条的方向拟合为水平方向,将与垂直基准的夹角小于某一预设范围的线条的方向拟合为垂直方向。0022 本发明通过采用上述技术方案,能够使用户方便的对表格图像进行文字识别和编辑操作,从而高效简便的对表格图像进行处理。0023 以上所述仅为本发明的较佳实施例而已,并非用以限定本发明的实质技术内容范围,本发明的实质技术内容是广义的定义于申请的权利要求范围中,任何他人完成的技术实体或方法,若是与申请的权利要求范围所定义的完全相同,也或是一种等效的变更,均将被视为涵盖于该权利要求范围之中。说 明 书CN 104462044 A1/3 页6图1说 明 书 附 图CN 104462044 A2/3 页7图2说 明 书 附 图CN 104462044 A3/3 页8图3说 明 书 附 图CN 104462044 A。