表单处理系统、OCR装置、表单制作装置及其处理方法.pdf

上传人:a3 文档编号:1036451 上传时间:2018-03-27 格式:PDF 页数:25 大小:725.93KB
返回 下载 相关 举报
摘要
申请专利号:

CN201110136450.X

申请日:

2011.05.24

公开号:

CN102331914A

公开日:

2012.01.25

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):G06F 3/12申请公布日:20120125|||实质审查的生效IPC(主分类):G06F 3/12申请日:20110524|||公开

IPC分类号:

G06F3/12; G06K9/20

主分类号:

G06F3/12

申请人:

株式会社PFU

发明人:

萩泽章一; 道场乡; 杉田敏彦; 桑村良则

地址:

日本石川县

优先权:

2010.05.24 JP 2010-118807; 2010.10.12 JP 2010-230109

专利代理机构:

北京林达刘知识产权代理事务所(普通合伙) 11277

代理人:

刘新宇

PDF下载: PDF下载
内容摘要

提供一种表单处理系统、OCR装置、表单制作装置及其处理方法,提高表单的OCR处理精度。本发明的表单处理系统(100)包括表单制作装置(110)和OCR装置(120),表单制作装置具有布局生成部(160)和布局发送部(170),该布局生成部(160)生成表示表单(152)布局的布局信息,该布局发送部(170)将所生成的布局信息发送给OCR装置,OCR装置具有布局获取部(220)和OCR处理部(226),该布局获取部(220)获取从表单制作装置发送过来的布局信息,该OCR处理部(226)根据获取到的布局信息对扫描仪(140)读取到的表单的图像数据进行OCR处理。

权利要求书

1: 一种表单处理系统, 包括表单制作装置和 OCR 装置, 上述表单制作装置具有 : 布局生成部, 其生成表示表单布局的布局信息 ; 以及 布局发送部, 其将所生成的上述布局信息发送给上述 OCR 装置, 其中, 上述 OCR 装置具有 : 布局获取部, 其获取从上述表单制作装置发送过来的布局信息 ; 以及 OCR 处理部, 其根据获取到的上述布局信息对扫描仪所读取出的表单的图像数据进行 OCR 处理。
2: 根据权利要求 1 所述的表单处理系统, 其特征在于, 上述 OCR 装置还具有 : 辅助生成部, 其生成用于辅助生成上述布局信息的辅助信息 ; 以及 辅助发送部, 其将上述辅助信息发送给上述表单制作装置, 其中, 上述表单制作装置还具有辅助获取部, 该辅助获取部获取发送过来的上述辅助 信息, 上述布局生成部根据所获取到的上述辅助信息来生成上述布局信息。
3: 根据权利要求 2 所述的表单处理系统, 其特征在于, 在上述辅助信息中包含与使用于上述 OCR 装置的 OCR 处理部的算法有关的算法信息。
4: 根据权利要求 2 或者 3 所述的表单处理系统, 其特征在于, 上述辅助生成部根据上述 OCR 处理的结果来生成表示所获取到的上述布局信息的改 进点的改进信息, 在上述辅助信息中包含上述改进信息。
5: 根据权利要求 4 所述的表单处理系统, 其特征在于, 上述表单制作装置还具有基准生成部, 该基准生成部根据所生成的上述布局信息来生 成基准数据, 该基准数据为与上述 OCR 处理的结果进行比较的基准, 上述布局发送部将上述基准数据发送给上述 OCR 装置, 上述 OCR 装置还具有基准获取部, 该基准获取部获取发送过来的上述基准数据, 上述辅助生成部根据所获取到的上述基准数据和上述 OCR 处理的结果来生成上述改 进信息。
6: 根据权利要求 1 至 5 中的任一项所述的表单处理系统, 其特征在于, 上述表单制作装置还具有数据输出部, 该数据输出部将所生成的上述布局信息输出到 打印机, 在所生成的上述布局信息中包含用于定义可变表单的可变信息, 该可变表单是表单中 的输入区域可变的表单, 当上述数据输出部将已确定上述可变信息中的输入区域的布局信息输出到上述打印 机时, 上述布局发送部将已确定上述输入区域的布局信息发送给上述 OCR 装置。
7: 根据权利要求 1 所述的表单处理系统, 其特征在于, 还包括打印机和图像读取装置, 上述表单制作装置还具有 : 输出控制部, 其在上述打印机印刷表单的情况下, 控制打印机以使其在预先确定的印 2 刷条件下进行印刷 ; 以及 读取控制部, 其在由上述图像读取装置读取表单的情况下, 指定图像读取装置的动作 方法。
8: 根据权利要求 1 至 7 中的任一项所述的表单处理系统, 其特征在于, 上述表单制作装置还具有 : 不使用要素决定部, 其决定上述布局信息中的不使用的图像要素 ; 以及 参考用图像生成部, 其根据上述布局信息来生成已排除由上述不使用要素决定部决定 为不使用的图像要素而得到的参考用图像数据, 其中, 上述布局发送部将上述布局信息或者上述参考用图像数据发送给上述 OCR 装 置, 上述 OCR 装置还具有图像校正部, 该图像校正部在接收到上述参考用图像数据的情况 下根据该参考用图像数据来校正上述扫描仪所读取出的表单的图像数据。
9: 根据权利要求 1 至 7 中的任一项所述的表单处理系统, 其特征在于, 上述 OCR 装置还具有 : 不使用要素决定部, 其决定上述布局信息中的不使用的图像要素 ; 参考用图像生成部, 其根据上述布局信息来生成已排除由上述不使用要素决定部决定 为不使用的图像要素而得到的参考用图像数据 ; 以及 图像校正部, 其根据上述参考用图像数据来校正上述扫描仪所读取出的表单的图像数 据。
10: 根据权利要求 8 或者 9 所述的表单处理系统, 其特征在于, 在由上述不使用要素决定部决定为不使用的图像要素中包含可变的字符串或者数字 串、 点线、 虚线、 包含灰色的彩色填充、 阴影、 条形码的图案图像、 包含灰色的彩色图像要素、 比预先确定的预定值细的线、 或者比预先确定的预定值小的字符。
11: 根据权利要求 8 至 10 中的任一项所述的表单处理系统, 其特征在于, 上述参考用图像生成部对从上述布局信息中排除由上述不使用要素决定部决定为不 使用的图像要素而得到的图像要素进行栅格化处理。
12: 一种 OCR 装置, 具有 : 布局获取部, 其获取从制作表单的表单制作装置发送过来的表示表单布局的布局信 息; 以及 OCR 处理部, 其根据所获取到的上述布局信息对扫描仪所读取出的表单的图像数据进 行 OCR 处理。
13: 一种表单制作装置, 具有 : 布局生成部, 其生成表示表单的布局的布局信息 ; 以及 布局发送部, 其向 OCR 装置发送所生成的上述布局信息, 该 OCR 装置对在上述表单中填 写的填写信息进行分析。
14: 一种表单处理方法, 通过表单制作装置以及与上述表单制作装置通信连接的 OCR 装置来进行表单管理, 上述表单制作装置生成表示表单布局的布局信息, 并将所生成的上述布局信息发送给 上述 OCR 装置, 3 上述 OCR 装置获取从上述表单制作装置发送过来的布局信息, 并根据所获取到的上述 布局信息对扫描仪所读取出的表单的图像数据进行 OCR 处理。

说明书


表单处理系统、 OCR 装置、 表单制作装置及其处理方法

    技术领域 本发明涉及一种对表单进行制作以及读取的表单处理系统、 OCR 装置、 表单制作装 置以及表单处理方法。
     背景技术 近年来, 在各领域中进行着无纸化, 但是例如在组织的基础业务中, 发票、 考勤表、 调查表、 试卷以及医院的诊断表等仍然使用印刷在纸张上的表单。用户为了有效地管理之 后通过手写等填写在表单上的信息, 利用扫描仪读取表单, 利用 OCR(Optical Character Reader : 光符阅读机 ) 装置实施 OCR 处理。
     但是, 在表单的布局、 格式不正确的情况下, 有时无法正确地进行 OCR 处理。因此, 公开了一种技术, 即根据由用户输入的 OCR 型号、 行字段数、 字符数自动生成表单格式 ( 例 如专利文献 1)。 另外, 提出了一种信息处理装置, 即将从表单读取到的图像数据与作为选择 基准的多个选择基准图像数据进行比较, 选择对应于从表单读取到的图像数据的选择基准 图像数据, 根据该选择基准图像数据来进行 O CR 处理 ( 例如专利文献 2)。
     专利文献 1 : 日本特开平 8-30659 号公报
     专利文献 2 : 日本特开 2000-132542 号公报
     发明内容 发明要解决的问题
     以往, 利用 OCR 装置有时无法对扫描仪所读取到的表单的图像数据正确地进行 OCR 处理。另外, 有时以 OCR 处理的精度为优先而仅能将表单的布局固定地形成。
     因此, 本发明是鉴于这种问题而完成的, 目的在于提供一种能够提高表单的 OCR 处理精度的表单处理系统、 OCR 装置、 OCR 处理程序、 表单制作装置、 表单制作程序以及表单 处理方法。
     用于解决问题的方案
     为了解决上述问题, 本发明的表单处理系统包括表单制作装置和 OCR 装置, 表单 制作装置具有 : 布局生成部, 其生成表示表单布局的布局信息 ; 以及布局发送部, 其将所生 成的布局信息发送给 OCR 装置, 其中, OCR 装置具有 : 布局获取部, 其获取从表单制作装置发 送过来的布局信息 ; 以及 OCR 处理部, 其根据获取到的布局信息对扫描仪所读出到的表单 的图像数据进行 OCR 处理。
     OCR 装置还可以具有 : 辅助生成部, 其生成用于辅助生成布局信息的辅助信息 ; 以 及辅助发送部, 其将辅助信息发送给表单制作装置, 其中, 表单制作装置还具有辅助获取 部, 该辅助获取部获取发送过来的辅助信息, 布局生成部根据所获取到的辅助信息来生成 布局信息。
     在辅助信息中也可以包含与使用于 OCR 装置的 OCR 处理部的算法有关的算法信 息。
     辅助生成部还可以根据 OCR 处理的结果来生成表示所获取到的辅助信息的改进 点的改进信息, 在辅助信息中包含改进信息。
     表单制作装置还可以具有基准生成部, 该基准生成部根据所生成的布局信息来生 成基准数据, 该基准数据为与 OCR 处理的结果进行比较的基准, 布局发送部将基准数据发 送给 OCR 装置, OCR 装置还具有基准获取部, 该基准获取部获取发送过来的基准数据, 辅助 生成部根据获取到的基准数据和 OCR 处理的结果来生成改进信息。
     表单制作装置还可以具有数据输出部, 该数据输出部将所生成的布局信息输出到 打印机, 在所生成的布局信息中包含用于定义可变表单的可变信息, 该可变表单是表单中 的输入区域可变的表单, 当数据输出部将已确定可变信息中的输入区域的布局信息输出到 打印机时, 布局发送部将已确定可变信息中的输入区域的布局信息发送给 OCR 装置。
     还可以包括打印机和图像读取装置, 表单制作装置还具有 : 输出控制部, 其在打印 机印刷表单的情况下, 控制打印机使其在预先确定的印刷条件下进行印刷 ; 以及读取控制 部, 其在由图像读取装置读取表单的情况下, 指定图像读取装置的动作方法。
     表单制作装置还具有 : 不使用要素决定部, 其决定布局信息中的不使用的图像要 素; 以及参考用图像生成部, 其根据布局信息来生成排除了由不使用要素决定部决定为不 使用的图像要素而得到的参考用图像数据, 布局发送部将布局信息或者参考用图像数据发 送给 OCR 装置, OCR 装置还具有图像校正部, 该图像校正部在接收到参考用图像数据的情况 下根据该参考用图像数据来校正扫描仪读取到的表单的图像数据。 OCR 装置还可以具有 : 不使用要素决定部, 其决定布局信息中的不使用的图像要 素; 参考用图像生成部, 其根据布局信息来生成排除了由不使用要素决定部决定为不使用 的图像要素而得到的参考用图像数据 ; 以及图像校正部, 其根据参考用图像数据来校正扫 描仪读取到的表单的图像数据。
     在由不使用要素决定部决定为不使用的图像要素中包含可变的字符串或者数字 串、 点线、 虚线、 包含灰色的彩色填充、 阴影、 条形码的图案图像、 包含灰色的彩色图像要素、 比预先确定的预定值细的线、 比预先确定的预定值小的字符。
     参考用图像生成部也可以对从布局信息中排除由上述不使用要素决定部决定为 不使用的图像要素而得到的图像要素进行栅格化处理。
     为了解决上述问题, 本发明的 OCR 装置具有 : 布局获取部, 其获取从制作表单的表 单制作装置发送过来的表示表单布局的布局信息 ; 以及 OCR 处理部, 其根据获取到的布局 信息对扫描仪读取到的表单的图像数据进行 OCR 处理。
     为了解决上述问题, 本发明的 OCR 处理程序使计算机作为以下部分而发挥功能 : 布局获取部, 其获取从制作表单的表单制作装置发送过来的表示表单布局的布局信息 ; 以 及 OCR 处理部, 其根据获取到的布局信息对扫描仪读取到的表单的图像数据进行 OCR 处理。
     为了解决上述问题, 本发明的表单制作装置具有 : 布局生成部, 其生成表示表单布 局的布局信息 ; 以及布局发送部, 其向 OCR 装置发送所生成的布局信息, 该 O CR 装置对在表 单中填写的填写信息进行分析。
     为了解决上述问题, , 本发明的表单制作程序使计算机作为以下部分而发挥功能 : 布局生成部, 其生成表示表单布局的布局信息 ; 以及布局发送部, 其向 OCR 装置发送所生成 的布局信息, 该 O CR 装置对在表单中填写的填写信息进行分析。
     为了解决上述问题, 本发明的表单处理方法通过表单制作装置以及与表单制作装 置通信连接的 OCR 装置来进行表单管理, 表单制作装置生成表示表单布局的布局信息, 并 将所生成的布局信息发送给 OCR 装置, OCR 装置获取从表单制作装置发送过来的布局信息, 并根据所获取到的布局信息对扫描仪所读取出的表单的图像数据进行 OCR 处理。
     发明的效果
     如上所述, 本发明能够提高表单的 OCR 处理精度。 附图说明
     图 1 是表示表单处理系统的概要连接关系的说明图。 图 2 是表示表单制作装置的结构的功能框图。 图 3 是表示表单布局的一例的说明图。 图 4 是用于说明布局信息 ( 特征信息以及数据属性信息 ) 的说明图。 图 5 是用于说明参考用图像数据的说明图。 图 6 是表示 OCR 装置的结构的功能框图。 图 7 是用于说明改进信息的说明图。图 8 是表示表单处理方法测试时的整体处理流程的序列图。
     图 9 是表示表单处理方法使用时的整体处理流程的序列图。
     附图标记说明
     100 : 表单处理系统 ; 110 : 表单制作装置 ; 120 : O CR 装置 ; 130 : 打印机 ; 140 : 扫描 仪; 152 : 表单 ; 160 : 布局生成部 ; 162 : 不使用要素决定部 ; 164 : 参考用图像生成部 ; 166 : 辅助获取部 ; 170 : 基准生成部 ; 172 : 布局发送部 ; 174 : 数据输出部 ; 192 : 参考用图像数据 ; 220 : 布局获取部 ; 224 : 图像校正部 ; 226 : OCR 处理部 ; 228 : 辅助生成部 ; 230 : 基准获取部 ; 232 : 辅助发送部。 具体实施方式
     下面, 参照附图详细说明本发明的优选实施方式。上述实施方式示出的尺寸、 材 料、 其它具体的数值等仅是用于使发明的理解变得容易的例示, 除了具有特别说明的情况 以外, 并不限定本发明。 此外, 在本说明书以及附图中, 对实质上具有相同的功能、 结构的要 素附加相同的附图标记来省略重复说明, 另外省略与本发明没有直接关系的要素的图示。
     ( 表单处理系统 100)
     图 1 是表示表单处理系统 100 的概要连接关系的说明图。表单处理系统 100 构成 为包括表单制作装置 110、 OCR 装置 120、 打印机 130、 扫描仪 140。表单制作装置 110 通过因 特网、 LAN(LocalArea Network : 局域网 )、 专用线路等通信网 150 与 OCR 装置 120 相连接。 另外, 表单制作装置 110 例如通过 LAN 与打印机 130 相连接, OCR 装置 120 例如通过 LAN 与 扫描仪 140 相连接。
     当接收到由用户输入的制作布局的输入时, 表单制作装置 110 生成表示表单 152 布局 ( 与布局有关的信息 ) 的布局信息。然后, 打印机 130 印刷所生成的该布局信息的表 单 152。用户在印刷出的表单 152 上通过手写、 盖印以及冲压等记载例如业务上的信息。当 向表单 152 的记载完成时, 扫描仪 140 读取记载有信息的表单 152, OCR 装置 120 对读取到的该图像数据进行 OCR 处理, 获取填写在表单 152 上的填写信息。
     例如, 提出了一种表单制作装置, 即根据由用户手动输入的 OCR 型号、 行字段数、 字符数来自动生成表单格式。但是, 这种表单制作装置仅自动地调整要制作的表单的文本 框、 表单尺寸, 存在要确定 OCR 型号等麻烦。并且, 在反复读取同一布局的表单的情况下, 为 了提高 OCR 处理精度, 用户必须对 OCR 装置指定成为读取对象的表单的读取位置等。
     另外, 将由扫描仪 140 读取到的成为 OCR 处理对象的图像数据与成为 OCR 处理的 参考的图像数据 ( 以下称为参考用图像数据 ) 进行比较来校正图像数据的位置偏移、 倾斜, 由此能够提高 OCR 处理精度。
     作为生成这样的参考用图像数据的手段, 例如可考虑以下手段 : 利用扫描仪 140 读取印刷出的表单 152, 由用户判断印刷的字符、 格线等根据数据不同而可变的部分, 在图 像处理中将其删除而设为参考用图像数据 ; 使用空数据作为与可变的部分有关的数据, 印 刷表单 152, 利用扫描仪 140 读取而设为参考用图像数据。
     例如在进行印刷、 利用扫描仪 140 读取时, 在存在由于颜色 ( 包括黑色 ) 变浅等浓 度变化的影响而很有可能使 OCR 处理精度下降的部分的情况下, 如果是前一方法, 则用户 要对这些部分分别进行逐一指示删除的操作, 而判断哪一部分容易受到浓度变化的影响等 是困难的, 有可能产生作业错误而增加用户的作业负担。 至于后一方法, 存在无法避免浓度变化的影响而使 OCR 处理精度下降的情况。另 外, 用户需要特意准备空数据作为表单 152 输出而使作业负担增加。并且, 无法删除自动地 生成的表单 152 的输出日期和时间、 页码、 连号等字符、 标记。
     另外, 在所生成的参考用图像数据中残留按照每个表单 152 而可变的可变部分的 情况下, 使用哪一方法都会使 OCR 处理精度下降。 另外, 在读取印刷过一次的表单 152 时, 表 单 152 起皱或者在表单 152 上附着脏污都会导致无法得到正确的参考用图像数据而使 OCR 处理精度下降。
     本实施方式所涉及的表单处理系统 100 在表单制作装置 110 生成布局信息时, 还 将该布局信息共用于 OCR 装置 120 的 OCR 处理。特别是, 在使用参考用图像数据的情况下, 表单制作装置 110 生成不包含位置偏移、 倾斜的校正所不需要的信息的参考用图像数据, 发送给 OCR 装置 120。因而, 根据该表单处理系统 100, 能够在减轻用户的作业负担的同时 提高 OCR 处理精度。下面, 按照表单制作装置 110、 OCR 装置 120 的顺序详细说明表单制作 装置 110、 OCR 装置 120 的结构。
     ( 表单制作装置 110)
     图 2 是表示表单制作装置 110 的结构的功能框图。表单制作装置 110 构成为包括 显示部 154、 操作部 156、 中央控制部 158。
     显示部 154 包括液晶显示器、 有机 EL(Electro Luminescence : 电致发光 ) 显示器 等。操作部 156 包括设置于显示部 154 的显示面上的触摸面板、 设置有多个操作键的键盘、 鼠标等指示装置、 十字键以及操纵杆等。表单制作装置 110 在显示部 154 中显示布局制作 画面, 接受用户通过操作部 156 的操作输入而生成表单 152 的布局。
     图 3 是表示表单 152 的布局的一例的说明图。如图 3 所示, 作为表单 152 的布局, 例如设定文本框 182a、 字符 182b、 基准标记 182c、 条形码 182d 等的配置。在此, 在 OCR 装 置 120 对扫描仪 140 所读取的图像数据实施 O CR 处理时, 基准标记 182c 成为表单 152 的
     方向以及布局位置的基准。另外, 条形码 182d 是按照规定的规则对任意的信息进行编码而 得到的, 例如表示识别表单 152 的表单 ID。
     表单制作装置 110 根据用户通过操作部 156 的操作输入来设定图 3 示出的布局。 此时, 表单 152 包括作为汇总具有规则性的输入方式的区域的多个输入区域 184。输入区 域 184 例如被文本框 182a 包围。在输入区域 184 中能够按照每个输入区域 184 来设定假 设为要填写的字符种类 ( 英文、 数字、 日文、 符号等 )、 属性 ( 手写字符、 铅字等 ) 等。
     中央控制部 158 通过半导体集成电路来控制表单制作装置 110 整体, 其中, 该半导 体集成电路包括中央处理装置 (CPU)、 保存有程序等的 ROM、 作为工作区的 RAM 等。另外, 中 央控制部 158 还作为布局生成部 160、 不使用要素决定部 162、 参考用图像生成部 164、 辅助 获取部 166、 基准生成部 168、 布局发送部 170、 数据输出部 172、 输出控制部 174 以及读取控 制部 176 而发挥功能。
     布局生成部 160 根据用户通过操作部 156 输入操作而设定的布局来生成表示表单 152 布局的布局信息。
     在布局信息中包含特征信息、 OCR 属性信息。特征信息是注释 ( 字典 ) 等表示布 局特征的信息, 例如对格线、 字符设定其位置、 线类型等。 OCR 属性信息是表示成为 OCR 处理 的对象的位置 ( 以下称为 OCR 位置 )、 成为该 OCR 处理的对象的字符、 标记等数据属性的信 息。下面, 根据图 4 说明特征信息以及 O CR 属性信息。
     图 4 是用于说明布局信息 ( 特征信息和数据属性信息 ) 的说明图。特别是, 图4 的 (a) 示出文本框 182a 的布局信息 ( 特征信息 ), 图 4 的 (b) 示出字符 182b 的布局信息 ( 特征信息 ), 图 4 的 (c) 示出输入区域 184 的布局信息 (OCR 属性信息 )。如图 4 的 (a) 所 示, 文本框 182a 的布局信息例如包括布局 ID 190a、 表单 ID 190b、 基准点坐标 190c、 行列 190d、 尺寸 190e、 线宽 190f、 线类型 190g、 颜色 190h 等。
     布局 ID 190a 是识别该文本框 182a 的识别信息。表单 ID 190b 是识别成为表单 152 的源的布局信息的识别信息。 基准点坐标 190c 表示成为该文本框 182a 的基准的点、 例 如文本框 182a 左下角的点的坐标。在本实施方式中, 坐标系例如以表单 152 左下角基准标 记 182c 为原点, 将横向方向设为 x 轴而将纵向方向设为 y 轴。行列 190d 表示进一步分割 被该文本框 182a 包围的区域的情况下的行和列的数量。另外, 布局信息 ( 特征信息 ) 也可 以是不以表为单位设定文本框 182a 而以进一步分割被该文本框 182a 包围的区域而得到的 块为单位设定该文本框 182a 的信息。
     尺寸 190e 例如表示进一步分割被该文本框 182a 包围的表而得到的块的宽度和高 度, 在行、 列不同而宽度、 高度不同的情况下, 按照每个行或者每个列进行设定。 文本框 182a 的线宽 190f、 线类型 190g、 颜色 190h 也同样地, 在由于行、 列不同而不同的情况下也按照每 个行或者每个列进行设定。此时, 在相邻的行、 列中文本框 182a 的线宽 190f、 线类型 190g、 颜色 190h 不同的情况下, 文本框 182a 夹持的部分例如以通过用户的操作输入而在后面进 行的设定优先。另外, 并不限于利用格线包围四周的文本框 182a, 还能够单独地设定格线。
     如图 4 的 (b) 所示, 字符 182b 的布局信息例如包括布局 ID190a、 表单 ID 190b、 基 准点坐标 190c、 大小 190i 以及内容 190j 等。大小 190i 表示字符 182b 的大小, 内容 190j 表示 “采购发票” “年” “月” “日” 等实际要印刷的字符 182b 本身。另外, 在字符 182b 例如 为连号的发票编号、 根据用户不同而不同的用户编号而可变的情况下, 也可以在布局信息中包含表示字符 182b 的变更规则的可变信息。
     如图 4 的 (c) 所示, 输入区域 184 的布局信息例如包括布局 ID190a、 表单 ID 190b、 基准点坐标 190c、 尺寸 190e、 字符种类 190k、 属性 190l 以及颜色 190m 等。如上所述, 字符 种类 190k 是假设为被填写的字符的种类, 例如能够设定英文、 数字、 日文平假名、 日文片假 名、 标记、 日文等。关于属性 190l, 如果填写的方法为手写则能够设定手写字符、 如果是印 刷、 数据符号等则能够设定铅字等。
     图 4 示出的布局信息 ( 特征信息和数据属性信息 ) 仅是一例, 除了设定基准标记 182c、 条形码 182d 以外还可设定能够记载于表单 152 的各种结构要素的信息。另外, 特征 信息例如也可以用 PDL(Page Description Language : 页面描述语言 ) 等各种数据形式来 表示。
     另外, 上述参考用图像数据是将通过用户的操作输入而设定的布局例如图像化 ( 栅格化 ) 为使用了 RGB、 CMYK 等表色方法的位图形式等而得到的图像数据。但是, 在仅使 布局图像化时, 例如由于上述的进行印刷、 扫描仪 140 读取时产生浓度变化的部分、 自动地 生成的表单 152 的输出日期和时间、 页码、 连号等字符、 标记这种按照每个表单 152 而可变 的可变部分的影响, 很有可能使 OCR 处理精度下降。因此, 本实施方式的表单制作装置 110 具备不使用要素决定部 162。 不使用要素决定部 162 决定布局信息中的不使用图像要素。参考用图像生成部 164 根据布局信息并例如参照不使用要素决定部 162 对每个图像要素附加的表示是否可以 图像化的图像化标志, 生成排除了由不使用要素决定部 162 决定为不使用的 ( 图像化标志 为不可 (false : 假 )) 的图像要素而得到的参考用图像数据。在本实施方式中, 图像要素是 与布局信息中的图 3 示出的文本框 182a、 字符 182b、 基准标记 182c、 条形码 182d 等各个项 目对应的信息。
     图 5 是用于说明参考用图像数据的说明图。在表单制作装置 110 中, 关于不使用 要素决定部 162, 例如 “付款通知单” “采购发票” 等固定的文字 ( 字符 )、 实线格线、 文本框、 白色 ( 在 RGB 中表示为 (255、 255、 255))、 黑色 ( 在 RGB 中表示为 (0、 0、 0)) 的图像要素不 会使 OCR 处理精度下降, 因此不使用要素决定部 162 将这些图像要素的图像化标志设为可 (true : 真 )。
     另外, 由不使用要素决定部 162 决定为不使用的图像要素包含可变的字符串或者 数字串、 点线、 虚线、 包含灰色的彩色填充、 阴影、 条形码等的图案图像、 包含灰色的彩色图 像要素、 比预先确定的预定值细的线、 比预先确定的预定值小的字符。关于这些图像要素, 由于打印机 130、 扫描仪 140 的性能差、 处理方式不同等原因, 在所生成的参考用图像数据 中有时线的粗细、 分辨率、 颜色、 半色调点的结构产生差或者产生干涉条纹。不使用要素决 定部 162 将这些图像要素的图像化标志设为 false( 不可 )。根据上述结构, 能够从参考用 图像数据更可靠地排除导致 OCR 处理精度下降的图像要素。
     如图 5 所示, 表单制作装置 110 的参考用图像生成部 164 生成排除了由不使用要 素决定部 162 决定为不使用的图像要素的参考用图像数据 192, 将该参考用图像数据 192 发 送到 OCR 装置 120, 在此不使用的图像要素为虚线、 可变的字符串、 条形码的图像要素。 后述 的 OCR 装置 120 的图像校正部对参考用图像数据 192 以及由扫描仪 140 读取到的表单 152 的图像数据进行位置偏移、 倾斜的校正。
     通过 OCR 装置 120 根据排除了不使用的图像要素而得到的参考用图像数据进行 OCR 处理的结构, 避免由于用户的判断错误等而在参考用图像数据中残留按照每个表单 152 变化的可变部分的情况, 与用户的技能无关, 能够提高 OCR 处理精度。 另外, 不需要对不 使用的图像要素逐一进行指示删除的操作或者准备空数据, 从而能够大幅减轻用户的作业 负担。
     并且, 与读取印刷过一次的数据 152 来生成参考用图像数据的情况相比, 本实施 方式的表单制作装置 110 不受表单 152 的褶皱、 附着于表单 152 的脏污的影响, 由此 OCR 处 理精度较高。
     另外, 参考用图像生成部 164 仅使从布局信息排除了由不使用要素决定部 162 决 定为不使用的图像要素而得到的图像要素栅格化。因此, 与使所有图像要素栅格化之后从 参考用图像数据删除不使用的图像要素部分的情况相比, 能够使参考用图像生成部 164 的 处理负载减少, 减少量为使不使用的图像要素栅格化的处理量。
     辅助获取部 166 获取从后述的 OCR 装置 120 发送过来的辅助信息。在辅助获取部 166 获取到辅助信息的情况下, 布局生成部 160 能够根据该辅助信息生成布局信息。 在辅助 信息中包含与使用于 OCR 装置 120 的 OCR 处理部中的算法有关的算法信息, 例如为 OCR 装 置 120 的型号名称或者在 OCR 装置 120 的 OCR 处理部中使用的 OCR 处理软件的名称或者版 本。 布局生成部 160 与辅助获取部 166 所获取的算法信息相应地对布局信息施加限 制。例如在根据用户的操作输入配置文本框 182a 的情况下, 布局生成部 160 对该文本框 182a 的线宽 190f 设置下限值。 例如在算法信息为 OCR 处理软件的名称和版本的情况下, 根 据以该 OCR 处理软件和版本确定的算法的性能来设定该下限值。
     同样地, 布局生成部 160 根据算法信息对基准标记 182c 的大小 190i 和配置 ( 基 准点坐标 190c)、 条形码 182d 的大小 190i、 扫描仪 140 无法读取的滤色、 字符种类 190k、 属 性 190l 等设定项目施加限制。另外, 在用户指示了文本框 182a 等结构要素的配置的情况 下, 布局生成部 160 也可以根据算法信息来决定该结构要素的布局信息所含的上述设定项 目的初始值。
     根据使用算法信息的结构, 能够减少用于确认表单 152 的 OCR 处理精度的测试以 及观察该测试的 OCR 处理结果来修正布局信息这种作业的反复次数, 能够大幅减轻用户的 作业负担。
     基准生成部 168 根据布局生成部 160 所生成的布局信息来生成成为与 OCR 装置 120 中的 OCR 处理的结果进行比较的基准的基准数据。后面详细说明基准数据。
     布局发送部 170 将布局信息、 基准数据发送给 OCR 装置 120。 另外, 布局发送部 170 将排除了由不使用要素决定部 162 决定为不使用的图像要素而得到的参考用图像数据发 送给 OCR 装置 120。数据输出部 172 将布局信息变换为与印刷对应的形式之后输出到打印 机 130。
     输出控制部 174 在印刷表单 152 的情况下控制打印机 130 使其在预定的印刷条件 下进行印刷。并不限于输出控制部 174 直接控制打印机 130 的情况, 也可以是以下情况 : 输 出控制部 174 将禁止变更的印刷条件等控制信息输出到打印机 130, 打印机 130 根据该控制 信息来设定印刷条件。
     在随意地在打印机 130 中变更印刷条件而例如进行缩小印刷时, 印刷出的表单 152 的字符大小变小或者线的粗细变细, 从而有可能使 OCR 处理精度下降。输出控制部 174 控制打印机 130 使其在预定的印刷条件下进行印刷, 从而能够避免以上的情况。
     读取控制部 176 将指定扫描仪 140 读取表单 152 并转换为图像数据时的分辨率、 读取后执行的应用程序、 命令的指定信息通过通信网 150 输出到扫描仪 140。 并不限于通过 上述通信网 150 输出, 读取控制部 176 也可以将指定信息例如作为条形码 182d 嵌入于表单 152, 扫描仪 140 从该条形码 182d 获取指定信息。
     根据具备上述读取控制部 176 的结构, 能够以适合于 OCR 处理的分辨率生成图像 数据或者利用扫描仪 140 的应用程序、 命令来校正生成后的图像数据, 从而能够进一步提 高 OCR 处理精度。
     (OCR 装置 120)
     图 6 是表示 OCR 装置 120 的结构的功能框图。OCR 装置 120 构成为包括显示部 200、 操作部 202、 存储装置 204、 中央控制部 206。
     显示部 200 包括液晶显示器、 有机 EL 显示器等。 操作部 202 包括设置于显示部 200 的显示面上的触摸面板、 设置有多个操作键的键盘、 鼠标等指示装置、 十字键、 操纵杆等。 存储装置 204 包括 HDD(Hard Disk Drive : 硬盘驱动器 )、 快闪存储器、 非易失性 RAM(Random Access Memory : 随机存取存储器 ) 等, 存储布局信息等。在本实施方式中, 存储装置 204 与 OCR 装置 120 一体地形成, 但是并不限于上述情况, 也可以是独立的例如 NAS(Network Attached Storage : 网络附加存储 )、 外置 HDD、 USB(Universal Serial Bus : 通用串行总线 ) 存储器等。
     中央控制部 206 通过半导体集成电路来控制 OCR 装置 120 整体, 其中, 该半导体集 成电路包括中央处理装置 (CPU)、 保存有程序等的 ROM、 作为工作区的 RAM 等。另外, 中央控 制部 206 还作为布局获取部 220、 图像获取部 222、 图像校正部 224、 OCR 处理部 226、 辅助生 成部 228、 基准获取部 230 以及辅助发送部 232 而发挥功能。
     布局获取部 220 获取从表单制作装置 110 发送过来的布局信息或者参考用图像数 据, 存储到存储装置 204。
     图像获取部 222 从扫描仪 140 获取读取表单 152 而生成的图像数据。
     在布局获取部 220 预先接收到参考用图像数据的情况下, 图像校正部 224 根据存 储在存储装置 204 中的参考用图像数据对由扫描仪 140 读取到的表单 152 的图像数据进行 位置偏移、 倾斜的校正。存储在存储装置 204 中的参考用图像数据例如与表单 152 的表单 ID 相对应, 图像校正部 224 能够参照与所生成的表单 152 的图像数据对应的参考用图像数 据。
     另外, 在本实施方式中设为以下结构 : 表单制作装置 110 具备不使用要素决定部 162 和参考用图像生成部 164, 由 OCR 装置 120 接收在表单制作装置 110 中生成的参考用图 像数据, 但是也可以是以下结构即 OCR 装置 120 具备不使用要素决定部 162 和参考用图像 生成部 164。
     OCR 处理部 226 例如以图像获取部 222 获取到的图像数据的图像中的基准标记 182c 为基准, 读取以条形码 182d 等形式记载的表单 152 的表单 ID。另外, OCR 处理部 226 从存储装置 204 读出包含该表单 ID 的布局信息, 根据读出的布局信息对扫描仪 140 所读取
     的表单 152 的图像数据进行 OCR 处理 ( 从图像数据中抽取该图像数据所示的字符、 数字等 内容的处理 )。
     本实施方式的 O CR 装置 120 根据从表单制作装置 110 获取到的布局信息进行 OCR 处理, 因此例如文本框 182a 的位置、 读取写入信息的位置可知, 从而能够提高 OCR 处理 精度。并且, 与例如由扫描仪 140 读取印刷出的表单 152 而生成图像数据并根据该图像数 据进行位置偏移、 倾斜的校正的情况相比, 根据布局信息、 参考用图像数据进行 OCR 处理的 OCR 装置 120 不受附着于表单 152 的脏污、 表单 152 的褶皱的影响, 从而能够提高 OCR 处理 精度。另外, 在 O CR 装置 120 中共用由表单制作装置 110 生成的布局信息, 因此用户不需 要分别在表单制作装置 110 和 O CR 装置 120 中进行相同的设定, 从而能够减轻用户的作业 负担。并且, 在根据条件变更、 根据 OCR 处理的结果需要提高 O CR 处理精度而对制作过一 次的表单 152 进行布局信息的修正的情况下, 也同样地在表单制作装置 110 和 OCR 装置 120 中共用在表单制作装置 110 中修正过的布局信息, 从而能够减轻用户的作业负担。
     另外, 在布局信息中包含对可变表单进行定义的可变信息, 该可变表单是表单 152 中的输入区域 184 的例如形状、 大小 190i、 配置、 分割数等可变的表单。
     如果在处理这种可变表单的情况下不采用任何方法, 则 OCR 处理部 226 不得不仅 根据图像数据估计该输入区域 184, 有时无法得到适当的 OCR 结果。 因此, 在本实施方式中, 表单制作装置 110 根据用户的输入操作来确定布局信息中的作为可变信息的输入区域 184 的形状、 大小 190i、 配置、 分割数等, 当数据输出部 172 将包含确定了可变信息中的输入区 域 184 的可变信息的布局信息输出到打印机 130 时, 以该数据输出部 172 的输出为契机, 布 局发送部 170 将确定了该输入区域 184 的布局信息发送给 OCR 装置 120。另外, 在要在打 印机 130 中确定输入区域 184 的形状、 大小 190i、 配置、 分割数等的情况下, 布局发送部 170 也可以以来自打印机 130 的表单 152 的实际印刷为契机, 将确定了该输入区域 184 的布局 信息发送给 OCR 装置 120。
     根据上述结构, 在 OCR 装置 120 中布局信息的输入区域 184 已确定, 因此能够根据 正确的输入区域 184 的信息来提高 OCR 处理精度, 并且由于成为 OCR 处理的对象的区域缩 小, 因此能够降低处理负载。
     另外, 这种情况下的布局信息也可以是上述的与用户的操作输入相应的表单 152 的布局的参考用图像数据。例如, OCR 装置 120 将扫描仪 140 所读取的表单 152 的图像数 据例如格线的位置等以与作为布局信息的参考用图像数据一致地方式进行校正之后, 进行 OCR 处理。即使根据上述结构也能够提高 OCR 处理精度。
     辅助生成部 228 生成辅助信息, 该辅助信息辅助布局信息的生成。并且, 在辅助信 息中还包含表示布局信息的改进点的改进信息。以上说明了辅助信息中的算法信息, 因此 在此详细说明改进信息。
     图 7 是用于说明改进信息的说明图。特别是, 图 7 的 (a) 表示布局信息的一例, 图 7 的 (b) 表示改进信息的一例, 图 7 的 (c) 表示基准数据的一例。
     辅助生成部 228 参照由布局获取部 220 获取到的例如图 7 的 (a) 示出的与输入区 域 184 有关的布局信息。前面使用图 4 的 (c) 说明了上述布局信息, 因此省略说明。
     另外, 辅助生成部 228 确认由 OCR 处理部 226 进行 OCR 处理的结果, 即确认对以所 参照的布局信息表示的、 应该读取写入信息的分割得到的输入区域 184 是否读取出写入信息 ( 读取成功与否 )。例如在读取手写字符的情况下, OCR 处理部 226 对于与登记于 OCR 处 理软件的基准字符进行对照的结果是判断为最接近的字符, 将表示与基准字符匹配的程度 的指标值与规定阈值进行比较来判断读取成功与否。 能够根据用户的操作输入来变更该阈 值。
     辅助生成部 228 根据 OCR 处理结果生成图 7 的 (b) 示出的使布局信息中的表示分 割得到的该输入区域 184 的布局 ID 190a 与读取成功与否 ( 读取成功与否 250) 相关联的 改进信息。
     这样, 改进信息例如表示 OCR 处理的结果、 准确地说是在应该读取写入信息的分 割得到的输入区域 184 中读取失败的情况。在布局生成部 160 中根据该改进信息例如以红 色填充读取失败的分割得到的输入区域 184 或者染红包围分割得到的该输入区域 184 的文 本框 182a 来促使用户改进。并且, 根据用户的操作输入, 例如进行增大输入区域 184、 文本 框 182a 的大小 190i 等布局信息的修正来实现提高 O CR 处理精度。
     根据使用上述改进信息的结构, 即使不按照每个输入区域 184 确认写入信息的读 取成功与否也自动地进行提示, 因此能够减轻用户的作业负担, 并且能够避免看漏要改进 的点这种情况。
     另外, 使用上述表单制作装置 110 的基准生成部 168 所生成的基准数据, 能够使改 进信息作为更有益的信息而有效地实现改进。基准生成部 168 所生成的基准数据是不包含 于布局信息的使用于确认 OCR 处理精度的测试中的数据。基准数据例如包含图 7 的 (c) 示 出的表示分割得到的输入区域 184 的布局 ID 190a、 用户用于进行测试而写入到分割得到 的该输入区域 184 的字符的大小 260a 以及内容 260b。
     在这种情况下, 用户预先对在表单 152 中分割得到的输入区域 184 写入被确定为 基准数据的例如大小 260a、 内容 260b 的字符。 另外, 并不限于手写字符, 也可以利用打印机 130 印刷被确定为基准数据的字符。在这种情况下, 不受用户手写字符的好坏限制, 能够可 靠地检测由扫描仪 140 的图像失真等引起的读取失败而改进 OCR 处理精度。之后, OCR 装 置 120 的图像获取部 222 通过扫描仪 140 获取该表单 152 的图像数据。
     基准获取部 230 获取布局发送部 170 所发送的基准数据。辅助生成部 228 根据基 准获取部 230 所获取到的基准数据以及 O CR 处理的结果来生成改进信息。
     辅助生成部 228 例如将表示确定了大小 260a、 内容 260b 的字符等的基准数据与实 际被写入了字符等的表单 152 的图像数据的 OCR 处理结果进行比较, 生成改进信息, 后述的 辅助发送部 232 将该改进信息发送给表单制作装置 110。表单制作装置 110 根据该改进信 息来修正布局信息。根据使用上述基准数据的结构, 能够进行是否存在字符错误识别等详 细的比较, 从而能够提高布局信息的改进精度。
     如上所述, 通过使用算法信息、 改进信息这种辅助信息, 表单制作装置 110 能够共 享可在 O CR 装置 120 侧掌握的信息, 表单制作装置 110 的布局生成部 160 能够生成容易进 行 OCR 处理的布局信息。
     辅助发送部 232 将由辅助生成部 228 生成的辅助信息发送给表单制作装置 110。
     以上, 通过所说明的表单制作装置 110 和 OCR 装置 120, 能够在大幅减轻用户的作 业负担的同时提高 OCR 处理精度。 另外, 还提供使计算机作为表单制作装置 110 而发挥功能 的表单制作程序以及作为 OCR 装置 120 而发挥功能的 OCR 处理程序、 存储有该表单制作程序和 OCR 处理程序的计算机可读取的软盘、 光磁盘、 ROM、 EPROM、 EEPROM、 CD(Compact Disc : 致密光盘 )、 DVD(Digital Versatile Disc : 数字多功能光盘 )、 BD(Blu-ray Disc 蓝光光 盘 ) 等存储介质。在此, 程序是指通过任意的语言、 描述方法描述的数据处理方法。
     另外, 该表单制作程序和 OCR 处理程序也可以被存储在通过通信网 150 与表单制 作装置 110 或者 OCR 装置 120 相连接的任意的应用程序服务器, 根据需要还能够下载其全 部或者一部分。
     ( 表单处理方法 )
     接着, 说明进行上述表单处理程序的使用的表单处理方法。图 8 是表示表单处理 方法测试时的整体处理流程的序列图, 图 9 是表示表单处理方法使用时的整体处理流程的 序列图。
     如图 8 所示, 当 OCR 装置 120 将包含算法信息的辅助信息发送给表单制作装置 110 时 (S 300), 在表单制作装置 110 中, 布局生成部 160 根据用户的操作输入来生成表示表单 152 的布局的布局信息 (S 302)。然后, 按照印刷表单 152 的操作输入, 数据输出部 172 将 确定了输入区域 184 的布局信息变换为与印刷对应的形式之后输出到打印机 130(S304)。 打印机 130 印刷表单 152(S306)。不使用要素决定部 162 决定布局信息中的不使用的图像 要素 (S308)。 参考用图像生成部 164 根据布局信息生成排除了由不使用要素决定部 162 决 定为不使用的图像要素而得到的参考用图像数据 (S 310)。 然后, 基准生成部 168 根据确定 了输入区域 184 的布局信息来生成基准数据 (S 310)。 布局发送部 170 将布局信息、 参考用 图像数据、 基准数据发送给 OCR 装置 120(S 314)。用户在印刷出的表单 152 中例如记载显 示在显示部 154 中的基准数据所示的确定了大小 260a、 内容 260b 的字符等。 在印刷出的表单 152 中记载了信息之后, 扫描仪 140 读取记载了该信息的表单 152(S 316), 将图像数据发送给 OCR 装置 120(S318)。OCR 装置 120 的图像校正部 224 根据 参考用图像数据对由扫描仪 140 读取并生成的表单 152 的图像数据进行位置偏移、 倾斜的 校正 (S320)。OCR 处理部 226 根据布局信息对图像数据进行 OCR 处理 (S322)。然后, 辅助 生成部 228 根据 OCR 处理的结果和基准数据来生成改进信息 (S324)。辅助发送部 232 将改 进信息发送给表单制作装置 110(S326)。表单制作装置 110 的布局生成部 160 根据改进信 息来促使用户改进, 修正布局信息 (S328)。
     如图 9 所示, 在使用时, 按照印刷表单 152 的操作输入, 表单制作装置 110 的数据 输出部 172 将确定了输入区域 184 的布局信息变换为与印刷对应的形式之后输出到打印机 130(S 340)。表单制作装置 110 的不使用要素决定部 162 决定布局信息中的不使用的图像 要素 (S 342)。参考用图像生成部 164 根据布局信息生成排除了由不使用要素决定部 162 决定为不使用的图像要素而得到的参考用图像数据 (S344)。布局发送部 170 将布局信息、 参考用图像数据发送给 OCR 装置 120(S 346)。打印机 130 印刷表单 152(S 348)。将此时 的表单 152 的布局信息设为已经通过图 8 示出的表单处理方法根据改进信息修正的信息。
     然后, 用户通过手写等方式将业务上的信息记载于表单 152 上之后, 扫描仪 140 读 取所记载的表单 152(S 350), 当读取到的图像数据发送给 OCR 装置 120 时 (S 352), OCR 装 置 120 的图像校正部 224 根据参考用图像数据对扫描仪 140 读取并生成的表单 152 的图像 数据进行位置偏移、 倾斜的校正 (S 354)。然后, OCR 处理部 226 对校正后的图像数据进行 OCR 处理来获取写入信息 (S 356)。上述图像数据的布局信息已经在图 8 中进行了修正, 因
     此 OCR 处理精度也变高。
     根据这种表单处理方法, 在图 8 示出的测试时以及图 9 示出的使用时都能够减轻 用户的作业负担, 并且通过使用根据改进信息修正过的布局信息能够提高 OCR 处理精度。
     以上, 参照附图说明了本发明的优选实施方式, 但是当然本发明并不限于上述实 施方式。 本领域技术人员在记载于权利要求的范围内的范畴中能够想得到各种变更例或者 修正例是显而易见的, 这些也当然理解为属于本发明的技术范围。
     此外, 本说明书的表单处理方法中的各工序不一定按照记载为序列图的顺序以时 间序列进行处理, 还可以包含并列或者子程序的处理。
     产业上的可利用性
     能够将本发明利用于进行表单的制作以及读取的表单处理系统、 OCR 装置、 OCR 处 理程序、 表单制作装置、 表单制作程序以及表单处理方法。

表单处理系统、OCR装置、表单制作装置及其处理方法.pdf_第1页
第1页 / 共25页
表单处理系统、OCR装置、表单制作装置及其处理方法.pdf_第2页
第2页 / 共25页
表单处理系统、OCR装置、表单制作装置及其处理方法.pdf_第3页
第3页 / 共25页
点击查看更多>>
资源描述

《表单处理系统、OCR装置、表单制作装置及其处理方法.pdf》由会员分享,可在线阅读,更多相关《表单处理系统、OCR装置、表单制作装置及其处理方法.pdf(25页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN102331914A43申请公布日20120125CN102331914ACN102331914A21申请号201110136450X22申请日20110524201011880720100524JP201023010920101012JPG06F3/12200601G06K9/2020060171申请人株式会社PFU地址日本石川县72发明人萩泽章一道场乡杉田敏彦桑村良则74专利代理机构北京林达刘知识产权代理事务所普通合伙11277代理人刘新宇54发明名称表单处理系统、OCR装置、表单制作装置及其处理方法57摘要提供一种表单处理系统、OCR装置、表单制作装置及其处理方法,提高。

2、表单的OCR处理精度。本发明的表单处理系统100包括表单制作装置110和OCR装置120,表单制作装置具有布局生成部160和布局发送部170,该布局生成部160生成表示表单152布局的布局信息,该布局发送部170将所生成的布局信息发送给OCR装置,OCR装置具有布局获取部220和OCR处理部226,该布局获取部220获取从表单制作装置发送过来的布局信息,该OCR处理部226根据获取到的布局信息对扫描仪140读取到的表单的图像数据进行OCR处理。30优先权数据51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书3页说明书12页附图9页CN102331927A1/3页21一种表。

3、单处理系统,包括表单制作装置和OCR装置,上述表单制作装置具有布局生成部,其生成表示表单布局的布局信息;以及布局发送部,其将所生成的上述布局信息发送给上述OCR装置,其中,上述OCR装置具有布局获取部,其获取从上述表单制作装置发送过来的布局信息;以及OCR处理部,其根据获取到的上述布局信息对扫描仪所读取出的表单的图像数据进行OCR处理。2根据权利要求1所述的表单处理系统,其特征在于,上述OCR装置还具有辅助生成部,其生成用于辅助生成上述布局信息的辅助信息;以及辅助发送部,其将上述辅助信息发送给上述表单制作装置,其中,上述表单制作装置还具有辅助获取部,该辅助获取部获取发送过来的上述辅助信息,上述。

4、布局生成部根据所获取到的上述辅助信息来生成上述布局信息。3根据权利要求2所述的表单处理系统,其特征在于,在上述辅助信息中包含与使用于上述OCR装置的OCR处理部的算法有关的算法信息。4根据权利要求2或者3所述的表单处理系统,其特征在于,上述辅助生成部根据上述OCR处理的结果来生成表示所获取到的上述布局信息的改进点的改进信息,在上述辅助信息中包含上述改进信息。5根据权利要求4所述的表单处理系统,其特征在于,上述表单制作装置还具有基准生成部,该基准生成部根据所生成的上述布局信息来生成基准数据,该基准数据为与上述OCR处理的结果进行比较的基准,上述布局发送部将上述基准数据发送给上述OCR装置,上述O。

5、CR装置还具有基准获取部,该基准获取部获取发送过来的上述基准数据,上述辅助生成部根据所获取到的上述基准数据和上述OCR处理的结果来生成上述改进信息。6根据权利要求1至5中的任一项所述的表单处理系统,其特征在于,上述表单制作装置还具有数据输出部,该数据输出部将所生成的上述布局信息输出到打印机,在所生成的上述布局信息中包含用于定义可变表单的可变信息,该可变表单是表单中的输入区域可变的表单,当上述数据输出部将已确定上述可变信息中的输入区域的布局信息输出到上述打印机时,上述布局发送部将已确定上述输入区域的布局信息发送给上述OCR装置。7根据权利要求1所述的表单处理系统,其特征在于,还包括打印机和图像读。

6、取装置,上述表单制作装置还具有输出控制部,其在上述打印机印刷表单的情况下,控制打印机以使其在预先确定的印权利要求书CN102331914ACN102331927A2/3页3刷条件下进行印刷;以及读取控制部,其在由上述图像读取装置读取表单的情况下,指定图像读取装置的动作方法。8根据权利要求1至7中的任一项所述的表单处理系统,其特征在于,上述表单制作装置还具有不使用要素决定部,其决定上述布局信息中的不使用的图像要素;以及参考用图像生成部,其根据上述布局信息来生成已排除由上述不使用要素决定部决定为不使用的图像要素而得到的参考用图像数据,其中,上述布局发送部将上述布局信息或者上述参考用图像数据发送给上。

7、述OCR装置,上述OCR装置还具有图像校正部,该图像校正部在接收到上述参考用图像数据的情况下根据该参考用图像数据来校正上述扫描仪所读取出的表单的图像数据。9根据权利要求1至7中的任一项所述的表单处理系统,其特征在于,上述OCR装置还具有不使用要素决定部,其决定上述布局信息中的不使用的图像要素;参考用图像生成部,其根据上述布局信息来生成已排除由上述不使用要素决定部决定为不使用的图像要素而得到的参考用图像数据;以及图像校正部,其根据上述参考用图像数据来校正上述扫描仪所读取出的表单的图像数据。10根据权利要求8或者9所述的表单处理系统,其特征在于,在由上述不使用要素决定部决定为不使用的图像要素中包含。

8、可变的字符串或者数字串、点线、虚线、包含灰色的彩色填充、阴影、条形码的图案图像、包含灰色的彩色图像要素、比预先确定的预定值细的线、或者比预先确定的预定值小的字符。11根据权利要求8至10中的任一项所述的表单处理系统,其特征在于,上述参考用图像生成部对从上述布局信息中排除由上述不使用要素决定部决定为不使用的图像要素而得到的图像要素进行栅格化处理。12一种OCR装置,具有布局获取部,其获取从制作表单的表单制作装置发送过来的表示表单布局的布局信息;以及OCR处理部,其根据所获取到的上述布局信息对扫描仪所读取出的表单的图像数据进行OCR处理。13一种表单制作装置,具有布局生成部,其生成表示表单的布局的。

9、布局信息;以及布局发送部,其向OCR装置发送所生成的上述布局信息,该OCR装置对在上述表单中填写的填写信息进行分析。14一种表单处理方法,通过表单制作装置以及与上述表单制作装置通信连接的OCR装置来进行表单管理,上述表单制作装置生成表示表单布局的布局信息,并将所生成的上述布局信息发送给上述OCR装置,权利要求书CN102331914ACN102331927A3/3页4上述OCR装置获取从上述表单制作装置发送过来的布局信息,并根据所获取到的上述布局信息对扫描仪所读取出的表单的图像数据进行OCR处理。权利要求书CN102331914ACN102331927A1/12页5表单处理系统、OCR装置、表。

10、单制作装置及其处理方法技术领域0001本发明涉及一种对表单进行制作以及读取的表单处理系统、OCR装置、表单制作装置以及表单处理方法。背景技术0002近年来,在各领域中进行着无纸化,但是例如在组织的基础业务中,发票、考勤表、调查表、试卷以及医院的诊断表等仍然使用印刷在纸张上的表单。用户为了有效地管理之后通过手写等填写在表单上的信息,利用扫描仪读取表单,利用OCROPTICALCHARACTERREADER光符阅读机装置实施OCR处理。0003但是,在表单的布局、格式不正确的情况下,有时无法正确地进行OCR处理。因此,公开了一种技术,即根据由用户输入的OCR型号、行字段数、字符数自动生成表单格式例。

11、如专利文献1。另外,提出了一种信息处理装置,即将从表单读取到的图像数据与作为选择基准的多个选择基准图像数据进行比较,选择对应于从表单读取到的图像数据的选择基准图像数据,根据该选择基准图像数据来进行OCR处理例如专利文献2。0004专利文献1日本特开平830659号公报0005专利文献2日本特开2000132542号公报发明内容0006发明要解决的问题0007以往,利用OCR装置有时无法对扫描仪所读取到的表单的图像数据正确地进行OCR处理。另外,有时以OCR处理的精度为优先而仅能将表单的布局固定地形成。0008因此,本发明是鉴于这种问题而完成的,目的在于提供一种能够提高表单的OCR处理精度的表单。

12、处理系统、OCR装置、OCR处理程序、表单制作装置、表单制作程序以及表单处理方法。0009用于解决问题的方案0010为了解决上述问题,本发明的表单处理系统包括表单制作装置和OCR装置,表单制作装置具有布局生成部,其生成表示表单布局的布局信息;以及布局发送部,其将所生成的布局信息发送给OCR装置,其中,OCR装置具有布局获取部,其获取从表单制作装置发送过来的布局信息;以及OCR处理部,其根据获取到的布局信息对扫描仪所读出到的表单的图像数据进行OCR处理。0011OCR装置还可以具有辅助生成部,其生成用于辅助生成布局信息的辅助信息;以及辅助发送部,其将辅助信息发送给表单制作装置,其中,表单制作装置。

13、还具有辅助获取部,该辅助获取部获取发送过来的辅助信息,布局生成部根据所获取到的辅助信息来生成布局信息。0012在辅助信息中也可以包含与使用于OCR装置的OCR处理部的算法有关的算法信息。说明书CN102331914ACN102331927A2/12页60013辅助生成部还可以根据OCR处理的结果来生成表示所获取到的辅助信息的改进点的改进信息,在辅助信息中包含改进信息。0014表单制作装置还可以具有基准生成部,该基准生成部根据所生成的布局信息来生成基准数据,该基准数据为与OCR处理的结果进行比较的基准,布局发送部将基准数据发送给OCR装置,OCR装置还具有基准获取部,该基准获取部获取发送过来的基。

14、准数据,辅助生成部根据获取到的基准数据和OCR处理的结果来生成改进信息。0015表单制作装置还可以具有数据输出部,该数据输出部将所生成的布局信息输出到打印机,在所生成的布局信息中包含用于定义可变表单的可变信息,该可变表单是表单中的输入区域可变的表单,当数据输出部将已确定可变信息中的输入区域的布局信息输出到打印机时,布局发送部将已确定可变信息中的输入区域的布局信息发送给OCR装置。0016还可以包括打印机和图像读取装置,表单制作装置还具有输出控制部,其在打印机印刷表单的情况下,控制打印机使其在预先确定的印刷条件下进行印刷;以及读取控制部,其在由图像读取装置读取表单的情况下,指定图像读取装置的动作。

15、方法。0017表单制作装置还具有不使用要素决定部,其决定布局信息中的不使用的图像要素;以及参考用图像生成部,其根据布局信息来生成排除了由不使用要素决定部决定为不使用的图像要素而得到的参考用图像数据,布局发送部将布局信息或者参考用图像数据发送给OCR装置,OCR装置还具有图像校正部,该图像校正部在接收到参考用图像数据的情况下根据该参考用图像数据来校正扫描仪读取到的表单的图像数据。0018OCR装置还可以具有不使用要素决定部,其决定布局信息中的不使用的图像要素;参考用图像生成部,其根据布局信息来生成排除了由不使用要素决定部决定为不使用的图像要素而得到的参考用图像数据;以及图像校正部,其根据参考用图。

16、像数据来校正扫描仪读取到的表单的图像数据。0019在由不使用要素决定部决定为不使用的图像要素中包含可变的字符串或者数字串、点线、虚线、包含灰色的彩色填充、阴影、条形码的图案图像、包含灰色的彩色图像要素、比预先确定的预定值细的线、比预先确定的预定值小的字符。0020参考用图像生成部也可以对从布局信息中排除由上述不使用要素决定部决定为不使用的图像要素而得到的图像要素进行栅格化处理。0021为了解决上述问题,本发明的OCR装置具有布局获取部,其获取从制作表单的表单制作装置发送过来的表示表单布局的布局信息;以及OCR处理部,其根据获取到的布局信息对扫描仪读取到的表单的图像数据进行OCR处理。0022为。

17、了解决上述问题,本发明的OCR处理程序使计算机作为以下部分而发挥功能布局获取部,其获取从制作表单的表单制作装置发送过来的表示表单布局的布局信息;以及OCR处理部,其根据获取到的布局信息对扫描仪读取到的表单的图像数据进行OCR处理。0023为了解决上述问题,本发明的表单制作装置具有布局生成部,其生成表示表单布局的布局信息;以及布局发送部,其向OCR装置发送所生成的布局信息,该OCR装置对在表单中填写的填写信息进行分析。0024为了解决上述问题,本发明的表单制作程序使计算机作为以下部分而发挥功能布局生成部,其生成表示表单布局的布局信息;以及布局发送部,其向OCR装置发送所生成的布局信息,该OCR装。

18、置对在表单中填写的填写信息进行分析。说明书CN102331914ACN102331927A3/12页70025为了解决上述问题,本发明的表单处理方法通过表单制作装置以及与表单制作装置通信连接的OCR装置来进行表单管理,表单制作装置生成表示表单布局的布局信息,并将所生成的布局信息发送给OCR装置,OCR装置获取从表单制作装置发送过来的布局信息,并根据所获取到的布局信息对扫描仪所读取出的表单的图像数据进行OCR处理。0026发明的效果0027如上所述,本发明能够提高表单的OCR处理精度。附图说明0028图1是表示表单处理系统的概要连接关系的说明图。0029图2是表示表单制作装置的结构的功能框图。0。

19、030图3是表示表单布局的一例的说明图。0031图4是用于说明布局信息特征信息以及数据属性信息的说明图。0032图5是用于说明参考用图像数据的说明图。0033图6是表示OCR装置的结构的功能框图。0034图7是用于说明改进信息的说明图。0035图8是表示表单处理方法测试时的整体处理流程的序列图。0036图9是表示表单处理方法使用时的整体处理流程的序列图。0037附图标记说明0038100表单处理系统;110表单制作装置;120OCR装置;130打印机;140扫描仪;152表单;160布局生成部;162不使用要素决定部;164参考用图像生成部;166辅助获取部;170基准生成部;172布局发送部。

20、;174数据输出部;192参考用图像数据;220布局获取部;224图像校正部;226OCR处理部;228辅助生成部;230基准获取部;232辅助发送部。具体实施方式0039下面,参照附图详细说明本发明的优选实施方式。上述实施方式示出的尺寸、材料、其它具体的数值等仅是用于使发明的理解变得容易的例示,除了具有特别说明的情况以外,并不限定本发明。此外,在本说明书以及附图中,对实质上具有相同的功能、结构的要素附加相同的附图标记来省略重复说明,另外省略与本发明没有直接关系的要素的图示。0040表单处理系统1000041图1是表示表单处理系统100的概要连接关系的说明图。表单处理系统100构成为包括表单制。

21、作装置110、OCR装置120、打印机130、扫描仪140。表单制作装置110通过因特网、LANLOCALAREANETWORK局域网、专用线路等通信网150与OCR装置120相连接。另外,表单制作装置110例如通过LAN与打印机130相连接,OCR装置120例如通过LAN与扫描仪140相连接。0042当接收到由用户输入的制作布局的输入时,表单制作装置110生成表示表单152布局与布局有关的信息的布局信息。然后,打印机130印刷所生成的该布局信息的表单152。用户在印刷出的表单152上通过手写、盖印以及冲压等记载例如业务上的信息。当向表单152的记载完成时,扫描仪140读取记载有信息的表单15。

22、2,OCR装置120对读取到说明书CN102331914ACN102331927A4/12页8的该图像数据进行OCR处理,获取填写在表单152上的填写信息。0043例如,提出了一种表单制作装置,即根据由用户手动输入的OCR型号、行字段数、字符数来自动生成表单格式。但是,这种表单制作装置仅自动地调整要制作的表单的文本框、表单尺寸,存在要确定OCR型号等麻烦。并且,在反复读取同一布局的表单的情况下,为了提高OCR处理精度,用户必须对OCR装置指定成为读取对象的表单的读取位置等。0044另外,将由扫描仪140读取到的成为OCR处理对象的图像数据与成为OCR处理的参考的图像数据以下称为参考用图像数据进。

23、行比较来校正图像数据的位置偏移、倾斜,由此能够提高OCR处理精度。0045作为生成这样的参考用图像数据的手段,例如可考虑以下手段利用扫描仪140读取印刷出的表单152,由用户判断印刷的字符、格线等根据数据不同而可变的部分,在图像处理中将其删除而设为参考用图像数据;使用空数据作为与可变的部分有关的数据,印刷表单152,利用扫描仪140读取而设为参考用图像数据。0046例如在进行印刷、利用扫描仪140读取时,在存在由于颜色包括黑色变浅等浓度变化的影响而很有可能使OCR处理精度下降的部分的情况下,如果是前一方法,则用户要对这些部分分别进行逐一指示删除的操作,而判断哪一部分容易受到浓度变化的影响等是困。

24、难的,有可能产生作业错误而增加用户的作业负担。0047至于后一方法,存在无法避免浓度变化的影响而使OCR处理精度下降的情况。另外,用户需要特意准备空数据作为表单152输出而使作业负担增加。并且,无法删除自动地生成的表单152的输出日期和时间、页码、连号等字符、标记。0048另外,在所生成的参考用图像数据中残留按照每个表单152而可变的可变部分的情况下,使用哪一方法都会使OCR处理精度下降。另外,在读取印刷过一次的表单152时,表单152起皱或者在表单152上附着脏污都会导致无法得到正确的参考用图像数据而使OCR处理精度下降。0049本实施方式所涉及的表单处理系统100在表单制作装置110生成布。

25、局信息时,还将该布局信息共用于OCR装置120的OCR处理。特别是,在使用参考用图像数据的情况下,表单制作装置110生成不包含位置偏移、倾斜的校正所不需要的信息的参考用图像数据,发送给OCR装置120。因而,根据该表单处理系统100,能够在减轻用户的作业负担的同时提高OCR处理精度。下面,按照表单制作装置110、OCR装置120的顺序详细说明表单制作装置110、OCR装置120的结构。0050表单制作装置1100051图2是表示表单制作装置110的结构的功能框图。表单制作装置110构成为包括显示部154、操作部156、中央控制部158。0052显示部154包括液晶显示器、有机ELELECTRO。

26、LUMINESCENCE电致发光显示器等。操作部156包括设置于显示部154的显示面上的触摸面板、设置有多个操作键的键盘、鼠标等指示装置、十字键以及操纵杆等。表单制作装置110在显示部154中显示布局制作画面,接受用户通过操作部156的操作输入而生成表单152的布局。0053图3是表示表单152的布局的一例的说明图。如图3所示,作为表单152的布局,例如设定文本框182A、字符182B、基准标记182C、条形码182D等的配置。在此,在OCR装置120对扫描仪140所读取的图像数据实施OCR处理时,基准标记182C成为表单152的说明书CN102331914ACN102331927A5/12页。

27、9方向以及布局位置的基准。另外,条形码182D是按照规定的规则对任意的信息进行编码而得到的,例如表示识别表单152的表单ID。0054表单制作装置110根据用户通过操作部156的操作输入来设定图3示出的布局。此时,表单152包括作为汇总具有规则性的输入方式的区域的多个输入区域184。输入区域184例如被文本框182A包围。在输入区域184中能够按照每个输入区域184来设定假设为要填写的字符种类英文、数字、日文、符号等、属性手写字符、铅字等等。0055中央控制部158通过半导体集成电路来控制表单制作装置110整体,其中,该半导体集成电路包括中央处理装置CPU、保存有程序等的ROM、作为工作区的R。

28、AM等。另外,中央控制部158还作为布局生成部160、不使用要素决定部162、参考用图像生成部164、辅助获取部166、基准生成部168、布局发送部170、数据输出部172、输出控制部174以及读取控制部176而发挥功能。0056布局生成部160根据用户通过操作部156输入操作而设定的布局来生成表示表单152布局的布局信息。0057在布局信息中包含特征信息、OCR属性信息。特征信息是注释字典等表示布局特征的信息,例如对格线、字符设定其位置、线类型等。OCR属性信息是表示成为OCR处理的对象的位置以下称为OCR位置、成为该OCR处理的对象的字符、标记等数据属性的信息。下面,根据图4说明特征信息以。

29、及OCR属性信息。0058图4是用于说明布局信息特征信息和数据属性信息的说明图。特别是,图4的A示出文本框182A的布局信息特征信息,图4的B示出字符182B的布局信息特征信息,图4的C示出输入区域184的布局信息OCR属性信息。如图4的A所示,文本框182A的布局信息例如包括布局ID190A、表单ID190B、基准点坐标190C、行列190D、尺寸190E、线宽190F、线类型190G、颜色190H等。0059布局ID190A是识别该文本框182A的识别信息。表单ID190B是识别成为表单152的源的布局信息的识别信息。基准点坐标190C表示成为该文本框182A的基准的点、例如文本框182A。

30、左下角的点的坐标。在本实施方式中,坐标系例如以表单152左下角基准标记182C为原点,将横向方向设为X轴而将纵向方向设为Y轴。行列190D表示进一步分割被该文本框182A包围的区域的情况下的行和列的数量。另外,布局信息特征信息也可以是不以表为单位设定文本框182A而以进一步分割被该文本框182A包围的区域而得到的块为单位设定该文本框182A的信息。0060尺寸190E例如表示进一步分割被该文本框182A包围的表而得到的块的宽度和高度,在行、列不同而宽度、高度不同的情况下,按照每个行或者每个列进行设定。文本框182A的线宽190F、线类型190G、颜色190H也同样地,在由于行、列不同而不同的情。

31、况下也按照每个行或者每个列进行设定。此时,在相邻的行、列中文本框182A的线宽190F、线类型190G、颜色190H不同的情况下,文本框182A夹持的部分例如以通过用户的操作输入而在后面进行的设定优先。另外,并不限于利用格线包围四周的文本框182A,还能够单独地设定格线。0061如图4的B所示,字符182B的布局信息例如包括布局ID190A、表单ID190B、基准点坐标190C、大小190I以及内容190J等。大小190I表示字符182B的大小,内容190J表示“采购发票”“年”“月”“日”等实际要印刷的字符182B本身。另外,在字符182B例如为连号的发票编号、根据用户不同而不同的用户编号而。

32、可变的情况下,也可以在布局信息说明书CN102331914ACN102331927A6/12页10中包含表示字符182B的变更规则的可变信息。0062如图4的C所示,输入区域184的布局信息例如包括布局ID190A、表单ID190B、基准点坐标190C、尺寸190E、字符种类190K、属性190L以及颜色190M等。如上所述,字符种类190K是假设为被填写的字符的种类,例如能够设定英文、数字、日文平假名、日文片假名、标记、日文等。关于属性190L,如果填写的方法为手写则能够设定手写字符、如果是印刷、数据符号等则能够设定铅字等。0063图4示出的布局信息特征信息和数据属性信息仅是一例,除了设定基。

33、准标记182C、条形码182D以外还可设定能够记载于表单152的各种结构要素的信息。另外,特征信息例如也可以用PDLPAGEDESCRIPTIONLANGUAGE页面描述语言等各种数据形式来表示。0064另外,上述参考用图像数据是将通过用户的操作输入而设定的布局例如图像化栅格化为使用了RGB、CMYK等表色方法的位图形式等而得到的图像数据。但是,在仅使布局图像化时,例如由于上述的进行印刷、扫描仪140读取时产生浓度变化的部分、自动地生成的表单152的输出日期和时间、页码、连号等字符、标记这种按照每个表单152而可变的可变部分的影响,很有可能使OCR处理精度下降。因此,本实施方式的表单制作装置1。

34、10具备不使用要素决定部162。0065不使用要素决定部162决定布局信息中的不使用图像要素。参考用图像生成部164根据布局信息并例如参照不使用要素决定部162对每个图像要素附加的表示是否可以图像化的图像化标志,生成排除了由不使用要素决定部162决定为不使用的图像化标志为不可FALSE假的图像要素而得到的参考用图像数据。在本实施方式中,图像要素是与布局信息中的图3示出的文本框182A、字符182B、基准标记182C、条形码182D等各个项目对应的信息。0066图5是用于说明参考用图像数据的说明图。在表单制作装置110中,关于不使用要素决定部162,例如“付款通知单”“采购发票”等固定的文字字符。

35、、实线格线、文本框、白色在RGB中表示为255、255、255、黑色在RGB中表示为0、0、0的图像要素不会使OCR处理精度下降,因此不使用要素决定部162将这些图像要素的图像化标志设为可TRUE真。0067另外,由不使用要素决定部162决定为不使用的图像要素包含可变的字符串或者数字串、点线、虚线、包含灰色的彩色填充、阴影、条形码等的图案图像、包含灰色的彩色图像要素、比预先确定的预定值细的线、比预先确定的预定值小的字符。关于这些图像要素,由于打印机130、扫描仪140的性能差、处理方式不同等原因,在所生成的参考用图像数据中有时线的粗细、分辨率、颜色、半色调点的结构产生差或者产生干涉条纹。不使用。

36、要素决定部162将这些图像要素的图像化标志设为FALSE不可。根据上述结构,能够从参考用图像数据更可靠地排除导致OCR处理精度下降的图像要素。0068如图5所示,表单制作装置110的参考用图像生成部164生成排除了由不使用要素决定部162决定为不使用的图像要素的参考用图像数据192,将该参考用图像数据192发送到OCR装置120,在此不使用的图像要素为虚线、可变的字符串、条形码的图像要素。后述的OCR装置120的图像校正部对参考用图像数据192以及由扫描仪140读取到的表单152的图像数据进行位置偏移、倾斜的校正。说明书CN102331914ACN102331927A7/12页110069通过。

37、OCR装置120根据排除了不使用的图像要素而得到的参考用图像数据进行OCR处理的结构,避免由于用户的判断错误等而在参考用图像数据中残留按照每个表单152变化的可变部分的情况,与用户的技能无关,能够提高OCR处理精度。另外,不需要对不使用的图像要素逐一进行指示删除的操作或者准备空数据,从而能够大幅减轻用户的作业负担。0070并且,与读取印刷过一次的数据152来生成参考用图像数据的情况相比,本实施方式的表单制作装置110不受表单152的褶皱、附着于表单152的脏污的影响,由此OCR处理精度较高。0071另外,参考用图像生成部164仅使从布局信息排除了由不使用要素决定部162决定为不使用的图像要素而。

38、得到的图像要素栅格化。因此,与使所有图像要素栅格化之后从参考用图像数据删除不使用的图像要素部分的情况相比,能够使参考用图像生成部164的处理负载减少,减少量为使不使用的图像要素栅格化的处理量。0072辅助获取部166获取从后述的OCR装置120发送过来的辅助信息。在辅助获取部166获取到辅助信息的情况下,布局生成部160能够根据该辅助信息生成布局信息。在辅助信息中包含与使用于OCR装置120的OCR处理部中的算法有关的算法信息,例如为OCR装置120的型号名称或者在OCR装置120的OCR处理部中使用的OCR处理软件的名称或者版本。0073布局生成部160与辅助获取部166所获取的算法信息相应。

39、地对布局信息施加限制。例如在根据用户的操作输入配置文本框182A的情况下,布局生成部160对该文本框182A的线宽190F设置下限值。例如在算法信息为OCR处理软件的名称和版本的情况下,根据以该OCR处理软件和版本确定的算法的性能来设定该下限值。0074同样地,布局生成部160根据算法信息对基准标记182C的大小190I和配置基准点坐标190C、条形码182D的大小190I、扫描仪140无法读取的滤色、字符种类190K、属性190L等设定项目施加限制。另外,在用户指示了文本框182A等结构要素的配置的情况下,布局生成部160也可以根据算法信息来决定该结构要素的布局信息所含的上述设定项目的初始值。

40、。0075根据使用算法信息的结构,能够减少用于确认表单152的OCR处理精度的测试以及观察该测试的OCR处理结果来修正布局信息这种作业的反复次数,能够大幅减轻用户的作业负担。0076基准生成部168根据布局生成部160所生成的布局信息来生成成为与OCR装置120中的OCR处理的结果进行比较的基准的基准数据。后面详细说明基准数据。0077布局发送部170将布局信息、基准数据发送给OCR装置120。另外,布局发送部170将排除了由不使用要素决定部162决定为不使用的图像要素而得到的参考用图像数据发送给OCR装置120。数据输出部172将布局信息变换为与印刷对应的形式之后输出到打印机130。0078。

41、输出控制部174在印刷表单152的情况下控制打印机130使其在预定的印刷条件下进行印刷。并不限于输出控制部174直接控制打印机130的情况,也可以是以下情况输出控制部174将禁止变更的印刷条件等控制信息输出到打印机130,打印机130根据该控制信息来设定印刷条件。说明书CN102331914ACN102331927A8/12页120079在随意地在打印机130中变更印刷条件而例如进行缩小印刷时,印刷出的表单152的字符大小变小或者线的粗细变细,从而有可能使OCR处理精度下降。输出控制部174控制打印机130使其在预定的印刷条件下进行印刷,从而能够避免以上的情况。0080读取控制部176将指定扫。

42、描仪140读取表单152并转换为图像数据时的分辨率、读取后执行的应用程序、命令的指定信息通过通信网150输出到扫描仪140。并不限于通过上述通信网150输出,读取控制部176也可以将指定信息例如作为条形码182D嵌入于表单152,扫描仪140从该条形码182D获取指定信息。0081根据具备上述读取控制部176的结构,能够以适合于OCR处理的分辨率生成图像数据或者利用扫描仪140的应用程序、命令来校正生成后的图像数据,从而能够进一步提高OCR处理精度。0082OCR装置1200083图6是表示OCR装置120的结构的功能框图。OCR装置120构成为包括显示部200、操作部202、存储装置204、。

43、中央控制部206。0084显示部200包括液晶显示器、有机EL显示器等。操作部202包括设置于显示部200的显示面上的触摸面板、设置有多个操作键的键盘、鼠标等指示装置、十字键、操纵杆等。0085存储装置204包括HDDHARDDISKDRIVE硬盘驱动器、快闪存储器、非易失性RAMRANDOMACCESSMEMORY随机存取存储器等,存储布局信息等。在本实施方式中,存储装置204与OCR装置120一体地形成,但是并不限于上述情况,也可以是独立的例如NASNETWORKATTACHEDSTORAGE网络附加存储、外置HDD、USBUNIVERSALSERIALBUS通用串行总线存储器等。0086。

44、中央控制部206通过半导体集成电路来控制OCR装置120整体,其中,该半导体集成电路包括中央处理装置CPU、保存有程序等的ROM、作为工作区的RAM等。另外,中央控制部206还作为布局获取部220、图像获取部222、图像校正部224、OCR处理部226、辅助生成部228、基准获取部230以及辅助发送部232而发挥功能。0087布局获取部220获取从表单制作装置110发送过来的布局信息或者参考用图像数据,存储到存储装置204。0088图像获取部222从扫描仪140获取读取表单152而生成的图像数据。0089在布局获取部220预先接收到参考用图像数据的情况下,图像校正部224根据存储在存储装置20。

45、4中的参考用图像数据对由扫描仪140读取到的表单152的图像数据进行位置偏移、倾斜的校正。存储在存储装置204中的参考用图像数据例如与表单152的表单ID相对应,图像校正部224能够参照与所生成的表单152的图像数据对应的参考用图像数据。0090另外,在本实施方式中设为以下结构表单制作装置110具备不使用要素决定部162和参考用图像生成部164,由OCR装置120接收在表单制作装置110中生成的参考用图像数据,但是也可以是以下结构即OCR装置120具备不使用要素决定部162和参考用图像生成部164。0091OCR处理部226例如以图像获取部222获取到的图像数据的图像中的基准标记182C为基准。

46、,读取以条形码182D等形式记载的表单152的表单ID。另外,OCR处理部226从存储装置204读出包含该表单ID的布局信息,根据读出的布局信息对扫描仪140所读取说明书CN102331914ACN102331927A9/12页13的表单152的图像数据进行OCR处理从图像数据中抽取该图像数据所示的字符、数字等内容的处理。0092本实施方式的OCR装置120根据从表单制作装置110获取到的布局信息进行OCR处理,因此例如文本框182A的位置、读取写入信息的位置可知,从而能够提高OCR处理精度。并且,与例如由扫描仪140读取印刷出的表单152而生成图像数据并根据该图像数据进行位置偏移、倾斜的校正。

47、的情况相比,根据布局信息、参考用图像数据进行OCR处理的OCR装置120不受附着于表单152的脏污、表单152的褶皱的影响,从而能够提高OCR处理精度。另外,在OCR装置120中共用由表单制作装置110生成的布局信息,因此用户不需要分别在表单制作装置110和OCR装置120中进行相同的设定,从而能够减轻用户的作业负担。并且,在根据条件变更、根据OCR处理的结果需要提高OCR处理精度而对制作过一次的表单152进行布局信息的修正的情况下,也同样地在表单制作装置110和OCR装置120中共用在表单制作装置110中修正过的布局信息,从而能够减轻用户的作业负担。0093另外,在布局信息中包含对可变表单进。

48、行定义的可变信息,该可变表单是表单152中的输入区域184的例如形状、大小190I、配置、分割数等可变的表单。0094如果在处理这种可变表单的情况下不采用任何方法,则OCR处理部226不得不仅根据图像数据估计该输入区域184,有时无法得到适当的OCR结果。因此,在本实施方式中,表单制作装置110根据用户的输入操作来确定布局信息中的作为可变信息的输入区域184的形状、大小190I、配置、分割数等,当数据输出部172将包含确定了可变信息中的输入区域184的可变信息的布局信息输出到打印机130时,以该数据输出部172的输出为契机,布局发送部170将确定了该输入区域184的布局信息发送给OCR装置12。

49、0。另外,在要在打印机130中确定输入区域184的形状、大小190I、配置、分割数等的情况下,布局发送部170也可以以来自打印机130的表单152的实际印刷为契机,将确定了该输入区域184的布局信息发送给OCR装置120。0095根据上述结构,在OCR装置120中布局信息的输入区域184已确定,因此能够根据正确的输入区域184的信息来提高OCR处理精度,并且由于成为OCR处理的对象的区域缩小,因此能够降低处理负载。0096另外,这种情况下的布局信息也可以是上述的与用户的操作输入相应的表单152的布局的参考用图像数据。例如,OCR装置120将扫描仪140所读取的表单152的图像数据例如格线的位置等以与作为布局信息的参考用图像数据一致地方式进行校正之后,进行OCR处理。即使根据上述结构也能够提高OCR处理精度。0097辅助生成部228生成辅助信息,该辅助信息辅助布局信息的生成。并且,在辅助信息中还包含表示布局信息的改进点的改进信息。以上说明了辅助信息中的算法信息,因此在此详细说明改进信息。0098图7是用于说明改进信息的说明图。特别是,图7的A表示布局信息的一例,图7的B表示改进信息的一例,图7的C表示基准数据的一例。0099辅助生成部228参照由布局获取部220获取到的例如图7的A示出的与输入区域184有关的布局信息。前面使用图4的C说明了上述布局信息,因此省略说明。0100另外,。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1