表单处理系统、 OCR 装置、 表单制作装置及其处理方法 技术领域 本发明涉及一种对表单进行制作以及读取的表单处理系统、 OCR 装置、 表单制作装 置以及表单处理方法。
背景技术 近年来, 在各领域中进行着无纸化, 但是例如在组织的基础业务中, 发票、 考勤表、 调查表、 试卷以及医院的诊断表等仍然使用印刷在纸张上的表单。用户为了有效地管理之 后通过手写等填写在表单上的信息, 利用扫描仪读取表单, 利用 OCR(Optical Character Reader : 光符阅读机 ) 装置实施 OCR 处理。
但是, 在表单的布局、 格式不正确的情况下, 有时无法正确地进行 OCR 处理。因此, 公开了一种技术, 即根据由用户输入的 OCR 型号、 行字段数、 字符数自动生成表单格式 ( 例 如专利文献 1)。 另外, 提出了一种信息处理装置, 即将从表单读取到的图像数据与作为选择 基准的多个选择基准图像数据进行比较, 选择对应于从表单读取到的图像数据的选择基准 图像数据, 根据该选择基准图像数据来进行 O CR 处理 ( 例如专利文献 2)。
专利文献 1 : 日本特开平 8-30659 号公报
专利文献 2 : 日本特开 2000-132542 号公报
发明内容 发明要解决的问题
以往, 利用 OCR 装置有时无法对扫描仪所读取到的表单的图像数据正确地进行 OCR 处理。另外, 有时以 OCR 处理的精度为优先而仅能将表单的布局固定地形成。
因此, 本发明是鉴于这种问题而完成的, 目的在于提供一种能够提高表单的 OCR 处理精度的表单处理系统、 OCR 装置、 OCR 处理程序、 表单制作装置、 表单制作程序以及表单 处理方法。
用于解决问题的方案
为了解决上述问题, 本发明的表单处理系统包括表单制作装置和 OCR 装置, 表单 制作装置具有 : 布局生成部, 其生成表示表单布局的布局信息 ; 以及布局发送部, 其将所生 成的布局信息发送给 OCR 装置, 其中, OCR 装置具有 : 布局获取部, 其获取从表单制作装置发 送过来的布局信息 ; 以及 OCR 处理部, 其根据获取到的布局信息对扫描仪所读出到的表单 的图像数据进行 OCR 处理。
OCR 装置还可以具有 : 辅助生成部, 其生成用于辅助生成布局信息的辅助信息 ; 以 及辅助发送部, 其将辅助信息发送给表单制作装置, 其中, 表单制作装置还具有辅助获取 部, 该辅助获取部获取发送过来的辅助信息, 布局生成部根据所获取到的辅助信息来生成 布局信息。
在辅助信息中也可以包含与使用于 OCR 装置的 OCR 处理部的算法有关的算法信 息。
辅助生成部还可以根据 OCR 处理的结果来生成表示所获取到的辅助信息的改进 点的改进信息, 在辅助信息中包含改进信息。
表单制作装置还可以具有基准生成部, 该基准生成部根据所生成的布局信息来生 成基准数据, 该基准数据为与 OCR 处理的结果进行比较的基准, 布局发送部将基准数据发 送给 OCR 装置, OCR 装置还具有基准获取部, 该基准获取部获取发送过来的基准数据, 辅助 生成部根据获取到的基准数据和 OCR 处理的结果来生成改进信息。
表单制作装置还可以具有数据输出部, 该数据输出部将所生成的布局信息输出到 打印机, 在所生成的布局信息中包含用于定义可变表单的可变信息, 该可变表单是表单中 的输入区域可变的表单, 当数据输出部将已确定可变信息中的输入区域的布局信息输出到 打印机时, 布局发送部将已确定可变信息中的输入区域的布局信息发送给 OCR 装置。
还可以包括打印机和图像读取装置, 表单制作装置还具有 : 输出控制部, 其在打印 机印刷表单的情况下, 控制打印机使其在预先确定的印刷条件下进行印刷 ; 以及读取控制 部, 其在由图像读取装置读取表单的情况下, 指定图像读取装置的动作方法。
表单制作装置还具有 : 不使用要素决定部, 其决定布局信息中的不使用的图像要 素; 以及参考用图像生成部, 其根据布局信息来生成排除了由不使用要素决定部决定为不 使用的图像要素而得到的参考用图像数据, 布局发送部将布局信息或者参考用图像数据发 送给 OCR 装置, OCR 装置还具有图像校正部, 该图像校正部在接收到参考用图像数据的情况 下根据该参考用图像数据来校正扫描仪读取到的表单的图像数据。 OCR 装置还可以具有 : 不使用要素决定部, 其决定布局信息中的不使用的图像要 素; 参考用图像生成部, 其根据布局信息来生成排除了由不使用要素决定部决定为不使用 的图像要素而得到的参考用图像数据 ; 以及图像校正部, 其根据参考用图像数据来校正扫 描仪读取到的表单的图像数据。
在由不使用要素决定部决定为不使用的图像要素中包含可变的字符串或者数字 串、 点线、 虚线、 包含灰色的彩色填充、 阴影、 条形码的图案图像、 包含灰色的彩色图像要素、 比预先确定的预定值细的线、 比预先确定的预定值小的字符。
参考用图像生成部也可以对从布局信息中排除由上述不使用要素决定部决定为 不使用的图像要素而得到的图像要素进行栅格化处理。
为了解决上述问题, 本发明的 OCR 装置具有 : 布局获取部, 其获取从制作表单的表 单制作装置发送过来的表示表单布局的布局信息 ; 以及 OCR 处理部, 其根据获取到的布局 信息对扫描仪读取到的表单的图像数据进行 OCR 处理。
为了解决上述问题, 本发明的 OCR 处理程序使计算机作为以下部分而发挥功能 : 布局获取部, 其获取从制作表单的表单制作装置发送过来的表示表单布局的布局信息 ; 以 及 OCR 处理部, 其根据获取到的布局信息对扫描仪读取到的表单的图像数据进行 OCR 处理。
为了解决上述问题, 本发明的表单制作装置具有 : 布局生成部, 其生成表示表单布 局的布局信息 ; 以及布局发送部, 其向 OCR 装置发送所生成的布局信息, 该 O CR 装置对在表 单中填写的填写信息进行分析。
为了解决上述问题, , 本发明的表单制作程序使计算机作为以下部分而发挥功能 : 布局生成部, 其生成表示表单布局的布局信息 ; 以及布局发送部, 其向 OCR 装置发送所生成 的布局信息, 该 O CR 装置对在表单中填写的填写信息进行分析。
为了解决上述问题, 本发明的表单处理方法通过表单制作装置以及与表单制作装 置通信连接的 OCR 装置来进行表单管理, 表单制作装置生成表示表单布局的布局信息, 并 将所生成的布局信息发送给 OCR 装置, OCR 装置获取从表单制作装置发送过来的布局信息, 并根据所获取到的布局信息对扫描仪所读取出的表单的图像数据进行 OCR 处理。
发明的效果
如上所述, 本发明能够提高表单的 OCR 处理精度。 附图说明
图 1 是表示表单处理系统的概要连接关系的说明图。 图 2 是表示表单制作装置的结构的功能框图。 图 3 是表示表单布局的一例的说明图。 图 4 是用于说明布局信息 ( 特征信息以及数据属性信息 ) 的说明图。 图 5 是用于说明参考用图像数据的说明图。 图 6 是表示 OCR 装置的结构的功能框图。 图 7 是用于说明改进信息的说明图。图 8 是表示表单处理方法测试时的整体处理流程的序列图。
图 9 是表示表单处理方法使用时的整体处理流程的序列图。
附图标记说明
100 : 表单处理系统 ; 110 : 表单制作装置 ; 120 : O CR 装置 ; 130 : 打印机 ; 140 : 扫描 仪; 152 : 表单 ; 160 : 布局生成部 ; 162 : 不使用要素决定部 ; 164 : 参考用图像生成部 ; 166 : 辅助获取部 ; 170 : 基准生成部 ; 172 : 布局发送部 ; 174 : 数据输出部 ; 192 : 参考用图像数据 ; 220 : 布局获取部 ; 224 : 图像校正部 ; 226 : OCR 处理部 ; 228 : 辅助生成部 ; 230 : 基准获取部 ; 232 : 辅助发送部。 具体实施方式
下面, 参照附图详细说明本发明的优选实施方式。上述实施方式示出的尺寸、 材 料、 其它具体的数值等仅是用于使发明的理解变得容易的例示, 除了具有特别说明的情况 以外, 并不限定本发明。 此外, 在本说明书以及附图中, 对实质上具有相同的功能、 结构的要 素附加相同的附图标记来省略重复说明, 另外省略与本发明没有直接关系的要素的图示。
( 表单处理系统 100)
图 1 是表示表单处理系统 100 的概要连接关系的说明图。表单处理系统 100 构成 为包括表单制作装置 110、 OCR 装置 120、 打印机 130、 扫描仪 140。表单制作装置 110 通过因 特网、 LAN(LocalArea Network : 局域网 )、 专用线路等通信网 150 与 OCR 装置 120 相连接。 另外, 表单制作装置 110 例如通过 LAN 与打印机 130 相连接, OCR 装置 120 例如通过 LAN 与 扫描仪 140 相连接。
当接收到由用户输入的制作布局的输入时, 表单制作装置 110 生成表示表单 152 布局 ( 与布局有关的信息 ) 的布局信息。然后, 打印机 130 印刷所生成的该布局信息的表 单 152。用户在印刷出的表单 152 上通过手写、 盖印以及冲压等记载例如业务上的信息。当 向表单 152 的记载完成时, 扫描仪 140 读取记载有信息的表单 152, OCR 装置 120 对读取到的该图像数据进行 OCR 处理, 获取填写在表单 152 上的填写信息。
例如, 提出了一种表单制作装置, 即根据由用户手动输入的 OCR 型号、 行字段数、 字符数来自动生成表单格式。但是, 这种表单制作装置仅自动地调整要制作的表单的文本 框、 表单尺寸, 存在要确定 OCR 型号等麻烦。并且, 在反复读取同一布局的表单的情况下, 为 了提高 OCR 处理精度, 用户必须对 OCR 装置指定成为读取对象的表单的读取位置等。
另外, 将由扫描仪 140 读取到的成为 OCR 处理对象的图像数据与成为 OCR 处理的 参考的图像数据 ( 以下称为参考用图像数据 ) 进行比较来校正图像数据的位置偏移、 倾斜, 由此能够提高 OCR 处理精度。
作为生成这样的参考用图像数据的手段, 例如可考虑以下手段 : 利用扫描仪 140 读取印刷出的表单 152, 由用户判断印刷的字符、 格线等根据数据不同而可变的部分, 在图 像处理中将其删除而设为参考用图像数据 ; 使用空数据作为与可变的部分有关的数据, 印 刷表单 152, 利用扫描仪 140 读取而设为参考用图像数据。
例如在进行印刷、 利用扫描仪 140 读取时, 在存在由于颜色 ( 包括黑色 ) 变浅等浓 度变化的影响而很有可能使 OCR 处理精度下降的部分的情况下, 如果是前一方法, 则用户 要对这些部分分别进行逐一指示删除的操作, 而判断哪一部分容易受到浓度变化的影响等 是困难的, 有可能产生作业错误而增加用户的作业负担。 至于后一方法, 存在无法避免浓度变化的影响而使 OCR 处理精度下降的情况。另 外, 用户需要特意准备空数据作为表单 152 输出而使作业负担增加。并且, 无法删除自动地 生成的表单 152 的输出日期和时间、 页码、 连号等字符、 标记。
另外, 在所生成的参考用图像数据中残留按照每个表单 152 而可变的可变部分的 情况下, 使用哪一方法都会使 OCR 处理精度下降。 另外, 在读取印刷过一次的表单 152 时, 表 单 152 起皱或者在表单 152 上附着脏污都会导致无法得到正确的参考用图像数据而使 OCR 处理精度下降。
本实施方式所涉及的表单处理系统 100 在表单制作装置 110 生成布局信息时, 还 将该布局信息共用于 OCR 装置 120 的 OCR 处理。特别是, 在使用参考用图像数据的情况下, 表单制作装置 110 生成不包含位置偏移、 倾斜的校正所不需要的信息的参考用图像数据, 发送给 OCR 装置 120。因而, 根据该表单处理系统 100, 能够在减轻用户的作业负担的同时 提高 OCR 处理精度。下面, 按照表单制作装置 110、 OCR 装置 120 的顺序详细说明表单制作 装置 110、 OCR 装置 120 的结构。
( 表单制作装置 110)
图 2 是表示表单制作装置 110 的结构的功能框图。表单制作装置 110 构成为包括 显示部 154、 操作部 156、 中央控制部 158。
显示部 154 包括液晶显示器、 有机 EL(Electro Luminescence : 电致发光 ) 显示器 等。操作部 156 包括设置于显示部 154 的显示面上的触摸面板、 设置有多个操作键的键盘、 鼠标等指示装置、 十字键以及操纵杆等。表单制作装置 110 在显示部 154 中显示布局制作 画面, 接受用户通过操作部 156 的操作输入而生成表单 152 的布局。
图 3 是表示表单 152 的布局的一例的说明图。如图 3 所示, 作为表单 152 的布局, 例如设定文本框 182a、 字符 182b、 基准标记 182c、 条形码 182d 等的配置。在此, 在 OCR 装 置 120 对扫描仪 140 所读取的图像数据实施 O CR 处理时, 基准标记 182c 成为表单 152 的
方向以及布局位置的基准。另外, 条形码 182d 是按照规定的规则对任意的信息进行编码而 得到的, 例如表示识别表单 152 的表单 ID。
表单制作装置 110 根据用户通过操作部 156 的操作输入来设定图 3 示出的布局。 此时, 表单 152 包括作为汇总具有规则性的输入方式的区域的多个输入区域 184。输入区 域 184 例如被文本框 182a 包围。在输入区域 184 中能够按照每个输入区域 184 来设定假 设为要填写的字符种类 ( 英文、 数字、 日文、 符号等 )、 属性 ( 手写字符、 铅字等 ) 等。
中央控制部 158 通过半导体集成电路来控制表单制作装置 110 整体, 其中, 该半导 体集成电路包括中央处理装置 (CPU)、 保存有程序等的 ROM、 作为工作区的 RAM 等。另外, 中 央控制部 158 还作为布局生成部 160、 不使用要素决定部 162、 参考用图像生成部 164、 辅助 获取部 166、 基准生成部 168、 布局发送部 170、 数据输出部 172、 输出控制部 174 以及读取控 制部 176 而发挥功能。
布局生成部 160 根据用户通过操作部 156 输入操作而设定的布局来生成表示表单 152 布局的布局信息。
在布局信息中包含特征信息、 OCR 属性信息。特征信息是注释 ( 字典 ) 等表示布 局特征的信息, 例如对格线、 字符设定其位置、 线类型等。 OCR 属性信息是表示成为 OCR 处理 的对象的位置 ( 以下称为 OCR 位置 )、 成为该 OCR 处理的对象的字符、 标记等数据属性的信 息。下面, 根据图 4 说明特征信息以及 O CR 属性信息。
图 4 是用于说明布局信息 ( 特征信息和数据属性信息 ) 的说明图。特别是, 图4 的 (a) 示出文本框 182a 的布局信息 ( 特征信息 ), 图 4 的 (b) 示出字符 182b 的布局信息 ( 特征信息 ), 图 4 的 (c) 示出输入区域 184 的布局信息 (OCR 属性信息 )。如图 4 的 (a) 所 示, 文本框 182a 的布局信息例如包括布局 ID 190a、 表单 ID 190b、 基准点坐标 190c、 行列 190d、 尺寸 190e、 线宽 190f、 线类型 190g、 颜色 190h 等。
布局 ID 190a 是识别该文本框 182a 的识别信息。表单 ID 190b 是识别成为表单 152 的源的布局信息的识别信息。 基准点坐标 190c 表示成为该文本框 182a 的基准的点、 例 如文本框 182a 左下角的点的坐标。在本实施方式中, 坐标系例如以表单 152 左下角基准标 记 182c 为原点, 将横向方向设为 x 轴而将纵向方向设为 y 轴。行列 190d 表示进一步分割 被该文本框 182a 包围的区域的情况下的行和列的数量。另外, 布局信息 ( 特征信息 ) 也可 以是不以表为单位设定文本框 182a 而以进一步分割被该文本框 182a 包围的区域而得到的 块为单位设定该文本框 182a 的信息。
尺寸 190e 例如表示进一步分割被该文本框 182a 包围的表而得到的块的宽度和高 度, 在行、 列不同而宽度、 高度不同的情况下, 按照每个行或者每个列进行设定。 文本框 182a 的线宽 190f、 线类型 190g、 颜色 190h 也同样地, 在由于行、 列不同而不同的情况下也按照每 个行或者每个列进行设定。此时, 在相邻的行、 列中文本框 182a 的线宽 190f、 线类型 190g、 颜色 190h 不同的情况下, 文本框 182a 夹持的部分例如以通过用户的操作输入而在后面进 行的设定优先。另外, 并不限于利用格线包围四周的文本框 182a, 还能够单独地设定格线。
如图 4 的 (b) 所示, 字符 182b 的布局信息例如包括布局 ID190a、 表单 ID 190b、 基 准点坐标 190c、 大小 190i 以及内容 190j 等。大小 190i 表示字符 182b 的大小, 内容 190j 表示 “采购发票” “年” “月” “日” 等实际要印刷的字符 182b 本身。另外, 在字符 182b 例如 为连号的发票编号、 根据用户不同而不同的用户编号而可变的情况下, 也可以在布局信息中包含表示字符 182b 的变更规则的可变信息。
如图 4 的 (c) 所示, 输入区域 184 的布局信息例如包括布局 ID190a、 表单 ID 190b、 基准点坐标 190c、 尺寸 190e、 字符种类 190k、 属性 190l 以及颜色 190m 等。如上所述, 字符 种类 190k 是假设为被填写的字符的种类, 例如能够设定英文、 数字、 日文平假名、 日文片假 名、 标记、 日文等。关于属性 190l, 如果填写的方法为手写则能够设定手写字符、 如果是印 刷、 数据符号等则能够设定铅字等。
图 4 示出的布局信息 ( 特征信息和数据属性信息 ) 仅是一例, 除了设定基准标记 182c、 条形码 182d 以外还可设定能够记载于表单 152 的各种结构要素的信息。另外, 特征 信息例如也可以用 PDL(Page Description Language : 页面描述语言 ) 等各种数据形式来 表示。
另外, 上述参考用图像数据是将通过用户的操作输入而设定的布局例如图像化 ( 栅格化 ) 为使用了 RGB、 CMYK 等表色方法的位图形式等而得到的图像数据。但是, 在仅使 布局图像化时, 例如由于上述的进行印刷、 扫描仪 140 读取时产生浓度变化的部分、 自动地 生成的表单 152 的输出日期和时间、 页码、 连号等字符、 标记这种按照每个表单 152 而可变 的可变部分的影响, 很有可能使 OCR 处理精度下降。因此, 本实施方式的表单制作装置 110 具备不使用要素决定部 162。 不使用要素决定部 162 决定布局信息中的不使用图像要素。参考用图像生成部 164 根据布局信息并例如参照不使用要素决定部 162 对每个图像要素附加的表示是否可以 图像化的图像化标志, 生成排除了由不使用要素决定部 162 决定为不使用的 ( 图像化标志 为不可 (false : 假 )) 的图像要素而得到的参考用图像数据。在本实施方式中, 图像要素是 与布局信息中的图 3 示出的文本框 182a、 字符 182b、 基准标记 182c、 条形码 182d 等各个项 目对应的信息。
图 5 是用于说明参考用图像数据的说明图。在表单制作装置 110 中, 关于不使用 要素决定部 162, 例如 “付款通知单” “采购发票” 等固定的文字 ( 字符 )、 实线格线、 文本框、 白色 ( 在 RGB 中表示为 (255、 255、 255))、 黑色 ( 在 RGB 中表示为 (0、 0、 0)) 的图像要素不 会使 OCR 处理精度下降, 因此不使用要素决定部 162 将这些图像要素的图像化标志设为可 (true : 真 )。
另外, 由不使用要素决定部 162 决定为不使用的图像要素包含可变的字符串或者 数字串、 点线、 虚线、 包含灰色的彩色填充、 阴影、 条形码等的图案图像、 包含灰色的彩色图 像要素、 比预先确定的预定值细的线、 比预先确定的预定值小的字符。关于这些图像要素, 由于打印机 130、 扫描仪 140 的性能差、 处理方式不同等原因, 在所生成的参考用图像数据 中有时线的粗细、 分辨率、 颜色、 半色调点的结构产生差或者产生干涉条纹。不使用要素决 定部 162 将这些图像要素的图像化标志设为 false( 不可 )。根据上述结构, 能够从参考用 图像数据更可靠地排除导致 OCR 处理精度下降的图像要素。
如图 5 所示, 表单制作装置 110 的参考用图像生成部 164 生成排除了由不使用要 素决定部 162 决定为不使用的图像要素的参考用图像数据 192, 将该参考用图像数据 192 发 送到 OCR 装置 120, 在此不使用的图像要素为虚线、 可变的字符串、 条形码的图像要素。 后述 的 OCR 装置 120 的图像校正部对参考用图像数据 192 以及由扫描仪 140 读取到的表单 152 的图像数据进行位置偏移、 倾斜的校正。
通过 OCR 装置 120 根据排除了不使用的图像要素而得到的参考用图像数据进行 OCR 处理的结构, 避免由于用户的判断错误等而在参考用图像数据中残留按照每个表单 152 变化的可变部分的情况, 与用户的技能无关, 能够提高 OCR 处理精度。 另外, 不需要对不 使用的图像要素逐一进行指示删除的操作或者准备空数据, 从而能够大幅减轻用户的作业 负担。
并且, 与读取印刷过一次的数据 152 来生成参考用图像数据的情况相比, 本实施 方式的表单制作装置 110 不受表单 152 的褶皱、 附着于表单 152 的脏污的影响, 由此 OCR 处 理精度较高。
另外, 参考用图像生成部 164 仅使从布局信息排除了由不使用要素决定部 162 决 定为不使用的图像要素而得到的图像要素栅格化。因此, 与使所有图像要素栅格化之后从 参考用图像数据删除不使用的图像要素部分的情况相比, 能够使参考用图像生成部 164 的 处理负载减少, 减少量为使不使用的图像要素栅格化的处理量。
辅助获取部 166 获取从后述的 OCR 装置 120 发送过来的辅助信息。在辅助获取部 166 获取到辅助信息的情况下, 布局生成部 160 能够根据该辅助信息生成布局信息。 在辅助 信息中包含与使用于 OCR 装置 120 的 OCR 处理部中的算法有关的算法信息, 例如为 OCR 装 置 120 的型号名称或者在 OCR 装置 120 的 OCR 处理部中使用的 OCR 处理软件的名称或者版 本。 布局生成部 160 与辅助获取部 166 所获取的算法信息相应地对布局信息施加限 制。例如在根据用户的操作输入配置文本框 182a 的情况下, 布局生成部 160 对该文本框 182a 的线宽 190f 设置下限值。 例如在算法信息为 OCR 处理软件的名称和版本的情况下, 根 据以该 OCR 处理软件和版本确定的算法的性能来设定该下限值。
同样地, 布局生成部 160 根据算法信息对基准标记 182c 的大小 190i 和配置 ( 基 准点坐标 190c)、 条形码 182d 的大小 190i、 扫描仪 140 无法读取的滤色、 字符种类 190k、 属 性 190l 等设定项目施加限制。另外, 在用户指示了文本框 182a 等结构要素的配置的情况 下, 布局生成部 160 也可以根据算法信息来决定该结构要素的布局信息所含的上述设定项 目的初始值。
根据使用算法信息的结构, 能够减少用于确认表单 152 的 OCR 处理精度的测试以 及观察该测试的 OCR 处理结果来修正布局信息这种作业的反复次数, 能够大幅减轻用户的 作业负担。
基准生成部 168 根据布局生成部 160 所生成的布局信息来生成成为与 OCR 装置 120 中的 OCR 处理的结果进行比较的基准的基准数据。后面详细说明基准数据。
布局发送部 170 将布局信息、 基准数据发送给 OCR 装置 120。 另外, 布局发送部 170 将排除了由不使用要素决定部 162 决定为不使用的图像要素而得到的参考用图像数据发 送给 OCR 装置 120。数据输出部 172 将布局信息变换为与印刷对应的形式之后输出到打印 机 130。
输出控制部 174 在印刷表单 152 的情况下控制打印机 130 使其在预定的印刷条件 下进行印刷。并不限于输出控制部 174 直接控制打印机 130 的情况, 也可以是以下情况 : 输 出控制部 174 将禁止变更的印刷条件等控制信息输出到打印机 130, 打印机 130 根据该控制 信息来设定印刷条件。
在随意地在打印机 130 中变更印刷条件而例如进行缩小印刷时, 印刷出的表单 152 的字符大小变小或者线的粗细变细, 从而有可能使 OCR 处理精度下降。输出控制部 174 控制打印机 130 使其在预定的印刷条件下进行印刷, 从而能够避免以上的情况。
读取控制部 176 将指定扫描仪 140 读取表单 152 并转换为图像数据时的分辨率、 读取后执行的应用程序、 命令的指定信息通过通信网 150 输出到扫描仪 140。 并不限于通过 上述通信网 150 输出, 读取控制部 176 也可以将指定信息例如作为条形码 182d 嵌入于表单 152, 扫描仪 140 从该条形码 182d 获取指定信息。
根据具备上述读取控制部 176 的结构, 能够以适合于 OCR 处理的分辨率生成图像 数据或者利用扫描仪 140 的应用程序、 命令来校正生成后的图像数据, 从而能够进一步提 高 OCR 处理精度。
(OCR 装置 120)
图 6 是表示 OCR 装置 120 的结构的功能框图。OCR 装置 120 构成为包括显示部 200、 操作部 202、 存储装置 204、 中央控制部 206。
显示部 200 包括液晶显示器、 有机 EL 显示器等。 操作部 202 包括设置于显示部 200 的显示面上的触摸面板、 设置有多个操作键的键盘、 鼠标等指示装置、 十字键、 操纵杆等。 存储装置 204 包括 HDD(Hard Disk Drive : 硬盘驱动器 )、 快闪存储器、 非易失性 RAM(Random Access Memory : 随机存取存储器 ) 等, 存储布局信息等。在本实施方式中, 存储装置 204 与 OCR 装置 120 一体地形成, 但是并不限于上述情况, 也可以是独立的例如 NAS(Network Attached Storage : 网络附加存储 )、 外置 HDD、 USB(Universal Serial Bus : 通用串行总线 ) 存储器等。
中央控制部 206 通过半导体集成电路来控制 OCR 装置 120 整体, 其中, 该半导体集 成电路包括中央处理装置 (CPU)、 保存有程序等的 ROM、 作为工作区的 RAM 等。另外, 中央控 制部 206 还作为布局获取部 220、 图像获取部 222、 图像校正部 224、 OCR 处理部 226、 辅助生 成部 228、 基准获取部 230 以及辅助发送部 232 而发挥功能。
布局获取部 220 获取从表单制作装置 110 发送过来的布局信息或者参考用图像数 据, 存储到存储装置 204。
图像获取部 222 从扫描仪 140 获取读取表单 152 而生成的图像数据。
在布局获取部 220 预先接收到参考用图像数据的情况下, 图像校正部 224 根据存 储在存储装置 204 中的参考用图像数据对由扫描仪 140 读取到的表单 152 的图像数据进行 位置偏移、 倾斜的校正。存储在存储装置 204 中的参考用图像数据例如与表单 152 的表单 ID 相对应, 图像校正部 224 能够参照与所生成的表单 152 的图像数据对应的参考用图像数 据。
另外, 在本实施方式中设为以下结构 : 表单制作装置 110 具备不使用要素决定部 162 和参考用图像生成部 164, 由 OCR 装置 120 接收在表单制作装置 110 中生成的参考用图 像数据, 但是也可以是以下结构即 OCR 装置 120 具备不使用要素决定部 162 和参考用图像 生成部 164。
OCR 处理部 226 例如以图像获取部 222 获取到的图像数据的图像中的基准标记 182c 为基准, 读取以条形码 182d 等形式记载的表单 152 的表单 ID。另外, OCR 处理部 226 从存储装置 204 读出包含该表单 ID 的布局信息, 根据读出的布局信息对扫描仪 140 所读取
的表单 152 的图像数据进行 OCR 处理 ( 从图像数据中抽取该图像数据所示的字符、 数字等 内容的处理 )。
本实施方式的 O CR 装置 120 根据从表单制作装置 110 获取到的布局信息进行 OCR 处理, 因此例如文本框 182a 的位置、 读取写入信息的位置可知, 从而能够提高 OCR 处理 精度。并且, 与例如由扫描仪 140 读取印刷出的表单 152 而生成图像数据并根据该图像数 据进行位置偏移、 倾斜的校正的情况相比, 根据布局信息、 参考用图像数据进行 OCR 处理的 OCR 装置 120 不受附着于表单 152 的脏污、 表单 152 的褶皱的影响, 从而能够提高 OCR 处理 精度。另外, 在 O CR 装置 120 中共用由表单制作装置 110 生成的布局信息, 因此用户不需 要分别在表单制作装置 110 和 O CR 装置 120 中进行相同的设定, 从而能够减轻用户的作业 负担。并且, 在根据条件变更、 根据 OCR 处理的结果需要提高 O CR 处理精度而对制作过一 次的表单 152 进行布局信息的修正的情况下, 也同样地在表单制作装置 110 和 OCR 装置 120 中共用在表单制作装置 110 中修正过的布局信息, 从而能够减轻用户的作业负担。
另外, 在布局信息中包含对可变表单进行定义的可变信息, 该可变表单是表单 152 中的输入区域 184 的例如形状、 大小 190i、 配置、 分割数等可变的表单。
如果在处理这种可变表单的情况下不采用任何方法, 则 OCR 处理部 226 不得不仅 根据图像数据估计该输入区域 184, 有时无法得到适当的 OCR 结果。 因此, 在本实施方式中, 表单制作装置 110 根据用户的输入操作来确定布局信息中的作为可变信息的输入区域 184 的形状、 大小 190i、 配置、 分割数等, 当数据输出部 172 将包含确定了可变信息中的输入区 域 184 的可变信息的布局信息输出到打印机 130 时, 以该数据输出部 172 的输出为契机, 布 局发送部 170 将确定了该输入区域 184 的布局信息发送给 OCR 装置 120。另外, 在要在打 印机 130 中确定输入区域 184 的形状、 大小 190i、 配置、 分割数等的情况下, 布局发送部 170 也可以以来自打印机 130 的表单 152 的实际印刷为契机, 将确定了该输入区域 184 的布局 信息发送给 OCR 装置 120。
根据上述结构, 在 OCR 装置 120 中布局信息的输入区域 184 已确定, 因此能够根据 正确的输入区域 184 的信息来提高 OCR 处理精度, 并且由于成为 OCR 处理的对象的区域缩 小, 因此能够降低处理负载。
另外, 这种情况下的布局信息也可以是上述的与用户的操作输入相应的表单 152 的布局的参考用图像数据。例如, OCR 装置 120 将扫描仪 140 所读取的表单 152 的图像数 据例如格线的位置等以与作为布局信息的参考用图像数据一致地方式进行校正之后, 进行 OCR 处理。即使根据上述结构也能够提高 OCR 处理精度。
辅助生成部 228 生成辅助信息, 该辅助信息辅助布局信息的生成。并且, 在辅助信 息中还包含表示布局信息的改进点的改进信息。以上说明了辅助信息中的算法信息, 因此 在此详细说明改进信息。
图 7 是用于说明改进信息的说明图。特别是, 图 7 的 (a) 表示布局信息的一例, 图 7 的 (b) 表示改进信息的一例, 图 7 的 (c) 表示基准数据的一例。
辅助生成部 228 参照由布局获取部 220 获取到的例如图 7 的 (a) 示出的与输入区 域 184 有关的布局信息。前面使用图 4 的 (c) 说明了上述布局信息, 因此省略说明。
另外, 辅助生成部 228 确认由 OCR 处理部 226 进行 OCR 处理的结果, 即确认对以所 参照的布局信息表示的、 应该读取写入信息的分割得到的输入区域 184 是否读取出写入信息 ( 读取成功与否 )。例如在读取手写字符的情况下, OCR 处理部 226 对于与登记于 OCR 处 理软件的基准字符进行对照的结果是判断为最接近的字符, 将表示与基准字符匹配的程度 的指标值与规定阈值进行比较来判断读取成功与否。 能够根据用户的操作输入来变更该阈 值。
辅助生成部 228 根据 OCR 处理结果生成图 7 的 (b) 示出的使布局信息中的表示分 割得到的该输入区域 184 的布局 ID 190a 与读取成功与否 ( 读取成功与否 250) 相关联的 改进信息。
这样, 改进信息例如表示 OCR 处理的结果、 准确地说是在应该读取写入信息的分 割得到的输入区域 184 中读取失败的情况。在布局生成部 160 中根据该改进信息例如以红 色填充读取失败的分割得到的输入区域 184 或者染红包围分割得到的该输入区域 184 的文 本框 182a 来促使用户改进。并且, 根据用户的操作输入, 例如进行增大输入区域 184、 文本 框 182a 的大小 190i 等布局信息的修正来实现提高 O CR 处理精度。
根据使用上述改进信息的结构, 即使不按照每个输入区域 184 确认写入信息的读 取成功与否也自动地进行提示, 因此能够减轻用户的作业负担, 并且能够避免看漏要改进 的点这种情况。
另外, 使用上述表单制作装置 110 的基准生成部 168 所生成的基准数据, 能够使改 进信息作为更有益的信息而有效地实现改进。基准生成部 168 所生成的基准数据是不包含 于布局信息的使用于确认 OCR 处理精度的测试中的数据。基准数据例如包含图 7 的 (c) 示 出的表示分割得到的输入区域 184 的布局 ID 190a、 用户用于进行测试而写入到分割得到 的该输入区域 184 的字符的大小 260a 以及内容 260b。
在这种情况下, 用户预先对在表单 152 中分割得到的输入区域 184 写入被确定为 基准数据的例如大小 260a、 内容 260b 的字符。 另外, 并不限于手写字符, 也可以利用打印机 130 印刷被确定为基准数据的字符。在这种情况下, 不受用户手写字符的好坏限制, 能够可 靠地检测由扫描仪 140 的图像失真等引起的读取失败而改进 OCR 处理精度。之后, OCR 装 置 120 的图像获取部 222 通过扫描仪 140 获取该表单 152 的图像数据。
基准获取部 230 获取布局发送部 170 所发送的基准数据。辅助生成部 228 根据基 准获取部 230 所获取到的基准数据以及 O CR 处理的结果来生成改进信息。
辅助生成部 228 例如将表示确定了大小 260a、 内容 260b 的字符等的基准数据与实 际被写入了字符等的表单 152 的图像数据的 OCR 处理结果进行比较, 生成改进信息, 后述的 辅助发送部 232 将该改进信息发送给表单制作装置 110。表单制作装置 110 根据该改进信 息来修正布局信息。根据使用上述基准数据的结构, 能够进行是否存在字符错误识别等详 细的比较, 从而能够提高布局信息的改进精度。
如上所述, 通过使用算法信息、 改进信息这种辅助信息, 表单制作装置 110 能够共 享可在 O CR 装置 120 侧掌握的信息, 表单制作装置 110 的布局生成部 160 能够生成容易进 行 OCR 处理的布局信息。
辅助发送部 232 将由辅助生成部 228 生成的辅助信息发送给表单制作装置 110。
以上, 通过所说明的表单制作装置 110 和 OCR 装置 120, 能够在大幅减轻用户的作 业负担的同时提高 OCR 处理精度。 另外, 还提供使计算机作为表单制作装置 110 而发挥功能 的表单制作程序以及作为 OCR 装置 120 而发挥功能的 OCR 处理程序、 存储有该表单制作程序和 OCR 处理程序的计算机可读取的软盘、 光磁盘、 ROM、 EPROM、 EEPROM、 CD(Compact Disc : 致密光盘 )、 DVD(Digital Versatile Disc : 数字多功能光盘 )、 BD(Blu-ray Disc 蓝光光 盘 ) 等存储介质。在此, 程序是指通过任意的语言、 描述方法描述的数据处理方法。
另外, 该表单制作程序和 OCR 处理程序也可以被存储在通过通信网 150 与表单制 作装置 110 或者 OCR 装置 120 相连接的任意的应用程序服务器, 根据需要还能够下载其全 部或者一部分。
( 表单处理方法 )
接着, 说明进行上述表单处理程序的使用的表单处理方法。图 8 是表示表单处理 方法测试时的整体处理流程的序列图, 图 9 是表示表单处理方法使用时的整体处理流程的 序列图。
如图 8 所示, 当 OCR 装置 120 将包含算法信息的辅助信息发送给表单制作装置 110 时 (S 300), 在表单制作装置 110 中, 布局生成部 160 根据用户的操作输入来生成表示表单 152 的布局的布局信息 (S 302)。然后, 按照印刷表单 152 的操作输入, 数据输出部 172 将 确定了输入区域 184 的布局信息变换为与印刷对应的形式之后输出到打印机 130(S304)。 打印机 130 印刷表单 152(S306)。不使用要素决定部 162 决定布局信息中的不使用的图像 要素 (S308)。 参考用图像生成部 164 根据布局信息生成排除了由不使用要素决定部 162 决 定为不使用的图像要素而得到的参考用图像数据 (S 310)。 然后, 基准生成部 168 根据确定 了输入区域 184 的布局信息来生成基准数据 (S 310)。 布局发送部 170 将布局信息、 参考用 图像数据、 基准数据发送给 OCR 装置 120(S 314)。用户在印刷出的表单 152 中例如记载显 示在显示部 154 中的基准数据所示的确定了大小 260a、 内容 260b 的字符等。 在印刷出的表单 152 中记载了信息之后, 扫描仪 140 读取记载了该信息的表单 152(S 316), 将图像数据发送给 OCR 装置 120(S318)。OCR 装置 120 的图像校正部 224 根据 参考用图像数据对由扫描仪 140 读取并生成的表单 152 的图像数据进行位置偏移、 倾斜的 校正 (S320)。OCR 处理部 226 根据布局信息对图像数据进行 OCR 处理 (S322)。然后, 辅助 生成部 228 根据 OCR 处理的结果和基准数据来生成改进信息 (S324)。辅助发送部 232 将改 进信息发送给表单制作装置 110(S326)。表单制作装置 110 的布局生成部 160 根据改进信 息来促使用户改进, 修正布局信息 (S328)。
如图 9 所示, 在使用时, 按照印刷表单 152 的操作输入, 表单制作装置 110 的数据 输出部 172 将确定了输入区域 184 的布局信息变换为与印刷对应的形式之后输出到打印机 130(S 340)。表单制作装置 110 的不使用要素决定部 162 决定布局信息中的不使用的图像 要素 (S 342)。参考用图像生成部 164 根据布局信息生成排除了由不使用要素决定部 162 决定为不使用的图像要素而得到的参考用图像数据 (S344)。布局发送部 170 将布局信息、 参考用图像数据发送给 OCR 装置 120(S 346)。打印机 130 印刷表单 152(S 348)。将此时 的表单 152 的布局信息设为已经通过图 8 示出的表单处理方法根据改进信息修正的信息。
然后, 用户通过手写等方式将业务上的信息记载于表单 152 上之后, 扫描仪 140 读 取所记载的表单 152(S 350), 当读取到的图像数据发送给 OCR 装置 120 时 (S 352), OCR 装 置 120 的图像校正部 224 根据参考用图像数据对扫描仪 140 读取并生成的表单 152 的图像 数据进行位置偏移、 倾斜的校正 (S 354)。然后, OCR 处理部 226 对校正后的图像数据进行 OCR 处理来获取写入信息 (S 356)。上述图像数据的布局信息已经在图 8 中进行了修正, 因
此 OCR 处理精度也变高。
根据这种表单处理方法, 在图 8 示出的测试时以及图 9 示出的使用时都能够减轻 用户的作业负担, 并且通过使用根据改进信息修正过的布局信息能够提高 OCR 处理精度。
以上, 参照附图说明了本发明的优选实施方式, 但是当然本发明并不限于上述实 施方式。 本领域技术人员在记载于权利要求的范围内的范畴中能够想得到各种变更例或者 修正例是显而易见的, 这些也当然理解为属于本发明的技术范围。
此外, 本说明书的表单处理方法中的各工序不一定按照记载为序列图的顺序以时 间序列进行处理, 还可以包含并列或者子程序的处理。
产业上的可利用性
能够将本发明利用于进行表单的制作以及读取的表单处理系统、 OCR 装置、 OCR 处 理程序、 表单制作装置、 表单制作程序以及表单处理方法。