1、10申请公布号CN102331914A43申请公布日20120125CN102331914ACN102331914A21申请号201110136450X22申请日20110524201011880720100524JP201023010920101012JPG06F3/12200601G06K9/2020060171申请人株式会社PFU地址日本石川县72发明人萩泽章一道场乡杉田敏彦桑村良则74专利代理机构北京林达刘知识产权代理事务所普通合伙11277代理人刘新宇54发明名称表单处理系统、OCR装置、表单制作装置及其处理方法57摘要提供一种表单处理系统、OCR装置、表单制作装置及其处理方法,提高
2、表单的OCR处理精度。本发明的表单处理系统100包括表单制作装置110和OCR装置120,表单制作装置具有布局生成部160和布局发送部170,该布局生成部160生成表示表单152布局的布局信息,该布局发送部170将所生成的布局信息发送给OCR装置,OCR装置具有布局获取部220和OCR处理部226,该布局获取部220获取从表单制作装置发送过来的布局信息,该OCR处理部226根据获取到的布局信息对扫描仪140读取到的表单的图像数据进行OCR处理。30优先权数据51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书3页说明书12页附图9页CN102331927A1/3页21一种表
3、单处理系统,包括表单制作装置和OCR装置,上述表单制作装置具有布局生成部,其生成表示表单布局的布局信息;以及布局发送部,其将所生成的上述布局信息发送给上述OCR装置,其中,上述OCR装置具有布局获取部,其获取从上述表单制作装置发送过来的布局信息;以及OCR处理部,其根据获取到的上述布局信息对扫描仪所读取出的表单的图像数据进行OCR处理。2根据权利要求1所述的表单处理系统,其特征在于,上述OCR装置还具有辅助生成部,其生成用于辅助生成上述布局信息的辅助信息;以及辅助发送部,其将上述辅助信息发送给上述表单制作装置,其中,上述表单制作装置还具有辅助获取部,该辅助获取部获取发送过来的上述辅助信息,上述
4、布局生成部根据所获取到的上述辅助信息来生成上述布局信息。3根据权利要求2所述的表单处理系统,其特征在于,在上述辅助信息中包含与使用于上述OCR装置的OCR处理部的算法有关的算法信息。4根据权利要求2或者3所述的表单处理系统,其特征在于,上述辅助生成部根据上述OCR处理的结果来生成表示所获取到的上述布局信息的改进点的改进信息,在上述辅助信息中包含上述改进信息。5根据权利要求4所述的表单处理系统,其特征在于,上述表单制作装置还具有基准生成部,该基准生成部根据所生成的上述布局信息来生成基准数据,该基准数据为与上述OCR处理的结果进行比较的基准,上述布局发送部将上述基准数据发送给上述OCR装置,上述O
5、CR装置还具有基准获取部,该基准获取部获取发送过来的上述基准数据,上述辅助生成部根据所获取到的上述基准数据和上述OCR处理的结果来生成上述改进信息。6根据权利要求1至5中的任一项所述的表单处理系统,其特征在于,上述表单制作装置还具有数据输出部,该数据输出部将所生成的上述布局信息输出到打印机,在所生成的上述布局信息中包含用于定义可变表单的可变信息,该可变表单是表单中的输入区域可变的表单,当上述数据输出部将已确定上述可变信息中的输入区域的布局信息输出到上述打印机时,上述布局发送部将已确定上述输入区域的布局信息发送给上述OCR装置。7根据权利要求1所述的表单处理系统,其特征在于,还包括打印机和图像读
6、取装置,上述表单制作装置还具有输出控制部,其在上述打印机印刷表单的情况下,控制打印机以使其在预先确定的印权利要求书CN102331914ACN102331927A2/3页3刷条件下进行印刷;以及读取控制部,其在由上述图像读取装置读取表单的情况下,指定图像读取装置的动作方法。8根据权利要求1至7中的任一项所述的表单处理系统,其特征在于,上述表单制作装置还具有不使用要素决定部,其决定上述布局信息中的不使用的图像要素;以及参考用图像生成部,其根据上述布局信息来生成已排除由上述不使用要素决定部决定为不使用的图像要素而得到的参考用图像数据,其中,上述布局发送部将上述布局信息或者上述参考用图像数据发送给上
7、述OCR装置,上述OCR装置还具有图像校正部,该图像校正部在接收到上述参考用图像数据的情况下根据该参考用图像数据来校正上述扫描仪所读取出的表单的图像数据。9根据权利要求1至7中的任一项所述的表单处理系统,其特征在于,上述OCR装置还具有不使用要素决定部,其决定上述布局信息中的不使用的图像要素;参考用图像生成部,其根据上述布局信息来生成已排除由上述不使用要素决定部决定为不使用的图像要素而得到的参考用图像数据;以及图像校正部,其根据上述参考用图像数据来校正上述扫描仪所读取出的表单的图像数据。10根据权利要求8或者9所述的表单处理系统,其特征在于,在由上述不使用要素决定部决定为不使用的图像要素中包含
8、可变的字符串或者数字串、点线、虚线、包含灰色的彩色填充、阴影、条形码的图案图像、包含灰色的彩色图像要素、比预先确定的预定值细的线、或者比预先确定的预定值小的字符。11根据权利要求8至10中的任一项所述的表单处理系统,其特征在于,上述参考用图像生成部对从上述布局信息中排除由上述不使用要素决定部决定为不使用的图像要素而得到的图像要素进行栅格化处理。12一种OCR装置,具有布局获取部,其获取从制作表单的表单制作装置发送过来的表示表单布局的布局信息;以及OCR处理部,其根据所获取到的上述布局信息对扫描仪所读取出的表单的图像数据进行OCR处理。13一种表单制作装置,具有布局生成部,其生成表示表单的布局的
9、布局信息;以及布局发送部,其向OCR装置发送所生成的上述布局信息,该OCR装置对在上述表单中填写的填写信息进行分析。14一种表单处理方法,通过表单制作装置以及与上述表单制作装置通信连接的OCR装置来进行表单管理,上述表单制作装置生成表示表单布局的布局信息,并将所生成的上述布局信息发送给上述OCR装置,权利要求书CN102331914ACN102331927A3/3页4上述OCR装置获取从上述表单制作装置发送过来的布局信息,并根据所获取到的上述布局信息对扫描仪所读取出的表单的图像数据进行OCR处理。权利要求书CN102331914ACN102331927A1/12页5表单处理系统、OCR装置、表
10、单制作装置及其处理方法技术领域0001本发明涉及一种对表单进行制作以及读取的表单处理系统、OCR装置、表单制作装置以及表单处理方法。背景技术0002近年来,在各领域中进行着无纸化,但是例如在组织的基础业务中,发票、考勤表、调查表、试卷以及医院的诊断表等仍然使用印刷在纸张上的表单。用户为了有效地管理之后通过手写等填写在表单上的信息,利用扫描仪读取表单,利用OCROPTICALCHARACTERREADER光符阅读机装置实施OCR处理。0003但是,在表单的布局、格式不正确的情况下,有时无法正确地进行OCR处理。因此,公开了一种技术,即根据由用户输入的OCR型号、行字段数、字符数自动生成表单格式例
11、如专利文献1。另外,提出了一种信息处理装置,即将从表单读取到的图像数据与作为选择基准的多个选择基准图像数据进行比较,选择对应于从表单读取到的图像数据的选择基准图像数据,根据该选择基准图像数据来进行OCR处理例如专利文献2。0004专利文献1日本特开平830659号公报0005专利文献2日本特开2000132542号公报发明内容0006发明要解决的问题0007以往,利用OCR装置有时无法对扫描仪所读取到的表单的图像数据正确地进行OCR处理。另外,有时以OCR处理的精度为优先而仅能将表单的布局固定地形成。0008因此,本发明是鉴于这种问题而完成的,目的在于提供一种能够提高表单的OCR处理精度的表单
12、处理系统、OCR装置、OCR处理程序、表单制作装置、表单制作程序以及表单处理方法。0009用于解决问题的方案0010为了解决上述问题,本发明的表单处理系统包括表单制作装置和OCR装置,表单制作装置具有布局生成部,其生成表示表单布局的布局信息;以及布局发送部,其将所生成的布局信息发送给OCR装置,其中,OCR装置具有布局获取部,其获取从表单制作装置发送过来的布局信息;以及OCR处理部,其根据获取到的布局信息对扫描仪所读出到的表单的图像数据进行OCR处理。0011OCR装置还可以具有辅助生成部,其生成用于辅助生成布局信息的辅助信息;以及辅助发送部,其将辅助信息发送给表单制作装置,其中,表单制作装置
13、还具有辅助获取部,该辅助获取部获取发送过来的辅助信息,布局生成部根据所获取到的辅助信息来生成布局信息。0012在辅助信息中也可以包含与使用于OCR装置的OCR处理部的算法有关的算法信息。说明书CN102331914ACN102331927A2/12页60013辅助生成部还可以根据OCR处理的结果来生成表示所获取到的辅助信息的改进点的改进信息,在辅助信息中包含改进信息。0014表单制作装置还可以具有基准生成部,该基准生成部根据所生成的布局信息来生成基准数据,该基准数据为与OCR处理的结果进行比较的基准,布局发送部将基准数据发送给OCR装置,OCR装置还具有基准获取部,该基准获取部获取发送过来的基
14、准数据,辅助生成部根据获取到的基准数据和OCR处理的结果来生成改进信息。0015表单制作装置还可以具有数据输出部,该数据输出部将所生成的布局信息输出到打印机,在所生成的布局信息中包含用于定义可变表单的可变信息,该可变表单是表单中的输入区域可变的表单,当数据输出部将已确定可变信息中的输入区域的布局信息输出到打印机时,布局发送部将已确定可变信息中的输入区域的布局信息发送给OCR装置。0016还可以包括打印机和图像读取装置,表单制作装置还具有输出控制部,其在打印机印刷表单的情况下,控制打印机使其在预先确定的印刷条件下进行印刷;以及读取控制部,其在由图像读取装置读取表单的情况下,指定图像读取装置的动作
15、方法。0017表单制作装置还具有不使用要素决定部,其决定布局信息中的不使用的图像要素;以及参考用图像生成部,其根据布局信息来生成排除了由不使用要素决定部决定为不使用的图像要素而得到的参考用图像数据,布局发送部将布局信息或者参考用图像数据发送给OCR装置,OCR装置还具有图像校正部,该图像校正部在接收到参考用图像数据的情况下根据该参考用图像数据来校正扫描仪读取到的表单的图像数据。0018OCR装置还可以具有不使用要素决定部,其决定布局信息中的不使用的图像要素;参考用图像生成部,其根据布局信息来生成排除了由不使用要素决定部决定为不使用的图像要素而得到的参考用图像数据;以及图像校正部,其根据参考用图
16、像数据来校正扫描仪读取到的表单的图像数据。0019在由不使用要素决定部决定为不使用的图像要素中包含可变的字符串或者数字串、点线、虚线、包含灰色的彩色填充、阴影、条形码的图案图像、包含灰色的彩色图像要素、比预先确定的预定值细的线、比预先确定的预定值小的字符。0020参考用图像生成部也可以对从布局信息中排除由上述不使用要素决定部决定为不使用的图像要素而得到的图像要素进行栅格化处理。0021为了解决上述问题,本发明的OCR装置具有布局获取部,其获取从制作表单的表单制作装置发送过来的表示表单布局的布局信息;以及OCR处理部,其根据获取到的布局信息对扫描仪读取到的表单的图像数据进行OCR处理。0022为
17、了解决上述问题,本发明的OCR处理程序使计算机作为以下部分而发挥功能布局获取部,其获取从制作表单的表单制作装置发送过来的表示表单布局的布局信息;以及OCR处理部,其根据获取到的布局信息对扫描仪读取到的表单的图像数据进行OCR处理。0023为了解决上述问题,本发明的表单制作装置具有布局生成部,其生成表示表单布局的布局信息;以及布局发送部,其向OCR装置发送所生成的布局信息,该OCR装置对在表单中填写的填写信息进行分析。0024为了解决上述问题,本发明的表单制作程序使计算机作为以下部分而发挥功能布局生成部,其生成表示表单布局的布局信息;以及布局发送部,其向OCR装置发送所生成的布局信息,该OCR装
18、置对在表单中填写的填写信息进行分析。说明书CN102331914ACN102331927A3/12页70025为了解决上述问题,本发明的表单处理方法通过表单制作装置以及与表单制作装置通信连接的OCR装置来进行表单管理,表单制作装置生成表示表单布局的布局信息,并将所生成的布局信息发送给OCR装置,OCR装置获取从表单制作装置发送过来的布局信息,并根据所获取到的布局信息对扫描仪所读取出的表单的图像数据进行OCR处理。0026发明的效果0027如上所述,本发明能够提高表单的OCR处理精度。附图说明0028图1是表示表单处理系统的概要连接关系的说明图。0029图2是表示表单制作装置的结构的功能框图。0
19、030图3是表示表单布局的一例的说明图。0031图4是用于说明布局信息特征信息以及数据属性信息的说明图。0032图5是用于说明参考用图像数据的说明图。0033图6是表示OCR装置的结构的功能框图。0034图7是用于说明改进信息的说明图。0035图8是表示表单处理方法测试时的整体处理流程的序列图。0036图9是表示表单处理方法使用时的整体处理流程的序列图。0037附图标记说明0038100表单处理系统;110表单制作装置;120OCR装置;130打印机;140扫描仪;152表单;160布局生成部;162不使用要素决定部;164参考用图像生成部;166辅助获取部;170基准生成部;172布局发送部
20、;174数据输出部;192参考用图像数据;220布局获取部;224图像校正部;226OCR处理部;228辅助生成部;230基准获取部;232辅助发送部。具体实施方式0039下面,参照附图详细说明本发明的优选实施方式。上述实施方式示出的尺寸、材料、其它具体的数值等仅是用于使发明的理解变得容易的例示,除了具有特别说明的情况以外,并不限定本发明。此外,在本说明书以及附图中,对实质上具有相同的功能、结构的要素附加相同的附图标记来省略重复说明,另外省略与本发明没有直接关系的要素的图示。0040表单处理系统1000041图1是表示表单处理系统100的概要连接关系的说明图。表单处理系统100构成为包括表单制
21、作装置110、OCR装置120、打印机130、扫描仪140。表单制作装置110通过因特网、LANLOCALAREANETWORK局域网、专用线路等通信网150与OCR装置120相连接。另外,表单制作装置110例如通过LAN与打印机130相连接,OCR装置120例如通过LAN与扫描仪140相连接。0042当接收到由用户输入的制作布局的输入时,表单制作装置110生成表示表单152布局与布局有关的信息的布局信息。然后,打印机130印刷所生成的该布局信息的表单152。用户在印刷出的表单152上通过手写、盖印以及冲压等记载例如业务上的信息。当向表单152的记载完成时,扫描仪140读取记载有信息的表单15
22、2,OCR装置120对读取到说明书CN102331914ACN102331927A4/12页8的该图像数据进行OCR处理,获取填写在表单152上的填写信息。0043例如,提出了一种表单制作装置,即根据由用户手动输入的OCR型号、行字段数、字符数来自动生成表单格式。但是,这种表单制作装置仅自动地调整要制作的表单的文本框、表单尺寸,存在要确定OCR型号等麻烦。并且,在反复读取同一布局的表单的情况下,为了提高OCR处理精度,用户必须对OCR装置指定成为读取对象的表单的读取位置等。0044另外,将由扫描仪140读取到的成为OCR处理对象的图像数据与成为OCR处理的参考的图像数据以下称为参考用图像数据进
23、行比较来校正图像数据的位置偏移、倾斜,由此能够提高OCR处理精度。0045作为生成这样的参考用图像数据的手段,例如可考虑以下手段利用扫描仪140读取印刷出的表单152,由用户判断印刷的字符、格线等根据数据不同而可变的部分,在图像处理中将其删除而设为参考用图像数据;使用空数据作为与可变的部分有关的数据,印刷表单152,利用扫描仪140读取而设为参考用图像数据。0046例如在进行印刷、利用扫描仪140读取时,在存在由于颜色包括黑色变浅等浓度变化的影响而很有可能使OCR处理精度下降的部分的情况下,如果是前一方法,则用户要对这些部分分别进行逐一指示删除的操作,而判断哪一部分容易受到浓度变化的影响等是困
24、难的,有可能产生作业错误而增加用户的作业负担。0047至于后一方法,存在无法避免浓度变化的影响而使OCR处理精度下降的情况。另外,用户需要特意准备空数据作为表单152输出而使作业负担增加。并且,无法删除自动地生成的表单152的输出日期和时间、页码、连号等字符、标记。0048另外,在所生成的参考用图像数据中残留按照每个表单152而可变的可变部分的情况下,使用哪一方法都会使OCR处理精度下降。另外,在读取印刷过一次的表单152时,表单152起皱或者在表单152上附着脏污都会导致无法得到正确的参考用图像数据而使OCR处理精度下降。0049本实施方式所涉及的表单处理系统100在表单制作装置110生成布
25、局信息时,还将该布局信息共用于OCR装置120的OCR处理。特别是,在使用参考用图像数据的情况下,表单制作装置110生成不包含位置偏移、倾斜的校正所不需要的信息的参考用图像数据,发送给OCR装置120。因而,根据该表单处理系统100,能够在减轻用户的作业负担的同时提高OCR处理精度。下面,按照表单制作装置110、OCR装置120的顺序详细说明表单制作装置110、OCR装置120的结构。0050表单制作装置1100051图2是表示表单制作装置110的结构的功能框图。表单制作装置110构成为包括显示部154、操作部156、中央控制部158。0052显示部154包括液晶显示器、有机ELELECTRO
26、LUMINESCENCE电致发光显示器等。操作部156包括设置于显示部154的显示面上的触摸面板、设置有多个操作键的键盘、鼠标等指示装置、十字键以及操纵杆等。表单制作装置110在显示部154中显示布局制作画面,接受用户通过操作部156的操作输入而生成表单152的布局。0053图3是表示表单152的布局的一例的说明图。如图3所示,作为表单152的布局,例如设定文本框182A、字符182B、基准标记182C、条形码182D等的配置。在此,在OCR装置120对扫描仪140所读取的图像数据实施OCR处理时,基准标记182C成为表单152的说明书CN102331914ACN102331927A5/12页
27、9方向以及布局位置的基准。另外,条形码182D是按照规定的规则对任意的信息进行编码而得到的,例如表示识别表单152的表单ID。0054表单制作装置110根据用户通过操作部156的操作输入来设定图3示出的布局。此时,表单152包括作为汇总具有规则性的输入方式的区域的多个输入区域184。输入区域184例如被文本框182A包围。在输入区域184中能够按照每个输入区域184来设定假设为要填写的字符种类英文、数字、日文、符号等、属性手写字符、铅字等等。0055中央控制部158通过半导体集成电路来控制表单制作装置110整体,其中,该半导体集成电路包括中央处理装置CPU、保存有程序等的ROM、作为工作区的R
28、AM等。另外,中央控制部158还作为布局生成部160、不使用要素决定部162、参考用图像生成部164、辅助获取部166、基准生成部168、布局发送部170、数据输出部172、输出控制部174以及读取控制部176而发挥功能。0056布局生成部160根据用户通过操作部156输入操作而设定的布局来生成表示表单152布局的布局信息。0057在布局信息中包含特征信息、OCR属性信息。特征信息是注释字典等表示布局特征的信息,例如对格线、字符设定其位置、线类型等。OCR属性信息是表示成为OCR处理的对象的位置以下称为OCR位置、成为该OCR处理的对象的字符、标记等数据属性的信息。下面,根据图4说明特征信息以
29、及OCR属性信息。0058图4是用于说明布局信息特征信息和数据属性信息的说明图。特别是,图4的A示出文本框182A的布局信息特征信息,图4的B示出字符182B的布局信息特征信息,图4的C示出输入区域184的布局信息OCR属性信息。如图4的A所示,文本框182A的布局信息例如包括布局ID190A、表单ID190B、基准点坐标190C、行列190D、尺寸190E、线宽190F、线类型190G、颜色190H等。0059布局ID190A是识别该文本框182A的识别信息。表单ID190B是识别成为表单152的源的布局信息的识别信息。基准点坐标190C表示成为该文本框182A的基准的点、例如文本框182A
30、左下角的点的坐标。在本实施方式中,坐标系例如以表单152左下角基准标记182C为原点,将横向方向设为X轴而将纵向方向设为Y轴。行列190D表示进一步分割被该文本框182A包围的区域的情况下的行和列的数量。另外,布局信息特征信息也可以是不以表为单位设定文本框182A而以进一步分割被该文本框182A包围的区域而得到的块为单位设定该文本框182A的信息。0060尺寸190E例如表示进一步分割被该文本框182A包围的表而得到的块的宽度和高度,在行、列不同而宽度、高度不同的情况下,按照每个行或者每个列进行设定。文本框182A的线宽190F、线类型190G、颜色190H也同样地,在由于行、列不同而不同的情
31、况下也按照每个行或者每个列进行设定。此时,在相邻的行、列中文本框182A的线宽190F、线类型190G、颜色190H不同的情况下,文本框182A夹持的部分例如以通过用户的操作输入而在后面进行的设定优先。另外,并不限于利用格线包围四周的文本框182A,还能够单独地设定格线。0061如图4的B所示,字符182B的布局信息例如包括布局ID190A、表单ID190B、基准点坐标190C、大小190I以及内容190J等。大小190I表示字符182B的大小,内容190J表示“采购发票”“年”“月”“日”等实际要印刷的字符182B本身。另外,在字符182B例如为连号的发票编号、根据用户不同而不同的用户编号而
32、可变的情况下,也可以在布局信息说明书CN102331914ACN102331927A6/12页10中包含表示字符182B的变更规则的可变信息。0062如图4的C所示,输入区域184的布局信息例如包括布局ID190A、表单ID190B、基准点坐标190C、尺寸190E、字符种类190K、属性190L以及颜色190M等。如上所述,字符种类190K是假设为被填写的字符的种类,例如能够设定英文、数字、日文平假名、日文片假名、标记、日文等。关于属性190L,如果填写的方法为手写则能够设定手写字符、如果是印刷、数据符号等则能够设定铅字等。0063图4示出的布局信息特征信息和数据属性信息仅是一例,除了设定基
33、准标记182C、条形码182D以外还可设定能够记载于表单152的各种结构要素的信息。另外,特征信息例如也可以用PDLPAGEDESCRIPTIONLANGUAGE页面描述语言等各种数据形式来表示。0064另外,上述参考用图像数据是将通过用户的操作输入而设定的布局例如图像化栅格化为使用了RGB、CMYK等表色方法的位图形式等而得到的图像数据。但是,在仅使布局图像化时,例如由于上述的进行印刷、扫描仪140读取时产生浓度变化的部分、自动地生成的表单152的输出日期和时间、页码、连号等字符、标记这种按照每个表单152而可变的可变部分的影响,很有可能使OCR处理精度下降。因此,本实施方式的表单制作装置1
34、10具备不使用要素决定部162。0065不使用要素决定部162决定布局信息中的不使用图像要素。参考用图像生成部164根据布局信息并例如参照不使用要素决定部162对每个图像要素附加的表示是否可以图像化的图像化标志,生成排除了由不使用要素决定部162决定为不使用的图像化标志为不可FALSE假的图像要素而得到的参考用图像数据。在本实施方式中,图像要素是与布局信息中的图3示出的文本框182A、字符182B、基准标记182C、条形码182D等各个项目对应的信息。0066图5是用于说明参考用图像数据的说明图。在表单制作装置110中,关于不使用要素决定部162,例如“付款通知单”“采购发票”等固定的文字字符
35、、实线格线、文本框、白色在RGB中表示为255、255、255、黑色在RGB中表示为0、0、0的图像要素不会使OCR处理精度下降,因此不使用要素决定部162将这些图像要素的图像化标志设为可TRUE真。0067另外,由不使用要素决定部162决定为不使用的图像要素包含可变的字符串或者数字串、点线、虚线、包含灰色的彩色填充、阴影、条形码等的图案图像、包含灰色的彩色图像要素、比预先确定的预定值细的线、比预先确定的预定值小的字符。关于这些图像要素,由于打印机130、扫描仪140的性能差、处理方式不同等原因,在所生成的参考用图像数据中有时线的粗细、分辨率、颜色、半色调点的结构产生差或者产生干涉条纹。不使用
36、要素决定部162将这些图像要素的图像化标志设为FALSE不可。根据上述结构,能够从参考用图像数据更可靠地排除导致OCR处理精度下降的图像要素。0068如图5所示,表单制作装置110的参考用图像生成部164生成排除了由不使用要素决定部162决定为不使用的图像要素的参考用图像数据192,将该参考用图像数据192发送到OCR装置120,在此不使用的图像要素为虚线、可变的字符串、条形码的图像要素。后述的OCR装置120的图像校正部对参考用图像数据192以及由扫描仪140读取到的表单152的图像数据进行位置偏移、倾斜的校正。说明书CN102331914ACN102331927A7/12页110069通过
37、OCR装置120根据排除了不使用的图像要素而得到的参考用图像数据进行OCR处理的结构,避免由于用户的判断错误等而在参考用图像数据中残留按照每个表单152变化的可变部分的情况,与用户的技能无关,能够提高OCR处理精度。另外,不需要对不使用的图像要素逐一进行指示删除的操作或者准备空数据,从而能够大幅减轻用户的作业负担。0070并且,与读取印刷过一次的数据152来生成参考用图像数据的情况相比,本实施方式的表单制作装置110不受表单152的褶皱、附着于表单152的脏污的影响,由此OCR处理精度较高。0071另外,参考用图像生成部164仅使从布局信息排除了由不使用要素决定部162决定为不使用的图像要素而
38、得到的图像要素栅格化。因此,与使所有图像要素栅格化之后从参考用图像数据删除不使用的图像要素部分的情况相比,能够使参考用图像生成部164的处理负载减少,减少量为使不使用的图像要素栅格化的处理量。0072辅助获取部166获取从后述的OCR装置120发送过来的辅助信息。在辅助获取部166获取到辅助信息的情况下,布局生成部160能够根据该辅助信息生成布局信息。在辅助信息中包含与使用于OCR装置120的OCR处理部中的算法有关的算法信息,例如为OCR装置120的型号名称或者在OCR装置120的OCR处理部中使用的OCR处理软件的名称或者版本。0073布局生成部160与辅助获取部166所获取的算法信息相应
39、地对布局信息施加限制。例如在根据用户的操作输入配置文本框182A的情况下,布局生成部160对该文本框182A的线宽190F设置下限值。例如在算法信息为OCR处理软件的名称和版本的情况下,根据以该OCR处理软件和版本确定的算法的性能来设定该下限值。0074同样地,布局生成部160根据算法信息对基准标记182C的大小190I和配置基准点坐标190C、条形码182D的大小190I、扫描仪140无法读取的滤色、字符种类190K、属性190L等设定项目施加限制。另外,在用户指示了文本框182A等结构要素的配置的情况下,布局生成部160也可以根据算法信息来决定该结构要素的布局信息所含的上述设定项目的初始值
40、。0075根据使用算法信息的结构,能够减少用于确认表单152的OCR处理精度的测试以及观察该测试的OCR处理结果来修正布局信息这种作业的反复次数,能够大幅减轻用户的作业负担。0076基准生成部168根据布局生成部160所生成的布局信息来生成成为与OCR装置120中的OCR处理的结果进行比较的基准的基准数据。后面详细说明基准数据。0077布局发送部170将布局信息、基准数据发送给OCR装置120。另外,布局发送部170将排除了由不使用要素决定部162决定为不使用的图像要素而得到的参考用图像数据发送给OCR装置120。数据输出部172将布局信息变换为与印刷对应的形式之后输出到打印机130。0078
41、输出控制部174在印刷表单152的情况下控制打印机130使其在预定的印刷条件下进行印刷。并不限于输出控制部174直接控制打印机130的情况,也可以是以下情况输出控制部174将禁止变更的印刷条件等控制信息输出到打印机130,打印机130根据该控制信息来设定印刷条件。说明书CN102331914ACN102331927A8/12页120079在随意地在打印机130中变更印刷条件而例如进行缩小印刷时,印刷出的表单152的字符大小变小或者线的粗细变细,从而有可能使OCR处理精度下降。输出控制部174控制打印机130使其在预定的印刷条件下进行印刷,从而能够避免以上的情况。0080读取控制部176将指定扫
42、描仪140读取表单152并转换为图像数据时的分辨率、读取后执行的应用程序、命令的指定信息通过通信网150输出到扫描仪140。并不限于通过上述通信网150输出,读取控制部176也可以将指定信息例如作为条形码182D嵌入于表单152,扫描仪140从该条形码182D获取指定信息。0081根据具备上述读取控制部176的结构,能够以适合于OCR处理的分辨率生成图像数据或者利用扫描仪140的应用程序、命令来校正生成后的图像数据,从而能够进一步提高OCR处理精度。0082OCR装置1200083图6是表示OCR装置120的结构的功能框图。OCR装置120构成为包括显示部200、操作部202、存储装置204、
43、中央控制部206。0084显示部200包括液晶显示器、有机EL显示器等。操作部202包括设置于显示部200的显示面上的触摸面板、设置有多个操作键的键盘、鼠标等指示装置、十字键、操纵杆等。0085存储装置204包括HDDHARDDISKDRIVE硬盘驱动器、快闪存储器、非易失性RAMRANDOMACCESSMEMORY随机存取存储器等,存储布局信息等。在本实施方式中,存储装置204与OCR装置120一体地形成,但是并不限于上述情况,也可以是独立的例如NASNETWORKATTACHEDSTORAGE网络附加存储、外置HDD、USBUNIVERSALSERIALBUS通用串行总线存储器等。0086
44、中央控制部206通过半导体集成电路来控制OCR装置120整体,其中,该半导体集成电路包括中央处理装置CPU、保存有程序等的ROM、作为工作区的RAM等。另外,中央控制部206还作为布局获取部220、图像获取部222、图像校正部224、OCR处理部226、辅助生成部228、基准获取部230以及辅助发送部232而发挥功能。0087布局获取部220获取从表单制作装置110发送过来的布局信息或者参考用图像数据,存储到存储装置204。0088图像获取部222从扫描仪140获取读取表单152而生成的图像数据。0089在布局获取部220预先接收到参考用图像数据的情况下,图像校正部224根据存储在存储装置20
45、4中的参考用图像数据对由扫描仪140读取到的表单152的图像数据进行位置偏移、倾斜的校正。存储在存储装置204中的参考用图像数据例如与表单152的表单ID相对应,图像校正部224能够参照与所生成的表单152的图像数据对应的参考用图像数据。0090另外,在本实施方式中设为以下结构表单制作装置110具备不使用要素决定部162和参考用图像生成部164,由OCR装置120接收在表单制作装置110中生成的参考用图像数据,但是也可以是以下结构即OCR装置120具备不使用要素决定部162和参考用图像生成部164。0091OCR处理部226例如以图像获取部222获取到的图像数据的图像中的基准标记182C为基准
46、,读取以条形码182D等形式记载的表单152的表单ID。另外,OCR处理部226从存储装置204读出包含该表单ID的布局信息,根据读出的布局信息对扫描仪140所读取说明书CN102331914ACN102331927A9/12页13的表单152的图像数据进行OCR处理从图像数据中抽取该图像数据所示的字符、数字等内容的处理。0092本实施方式的OCR装置120根据从表单制作装置110获取到的布局信息进行OCR处理,因此例如文本框182A的位置、读取写入信息的位置可知,从而能够提高OCR处理精度。并且,与例如由扫描仪140读取印刷出的表单152而生成图像数据并根据该图像数据进行位置偏移、倾斜的校正
47、的情况相比,根据布局信息、参考用图像数据进行OCR处理的OCR装置120不受附着于表单152的脏污、表单152的褶皱的影响,从而能够提高OCR处理精度。另外,在OCR装置120中共用由表单制作装置110生成的布局信息,因此用户不需要分别在表单制作装置110和OCR装置120中进行相同的设定,从而能够减轻用户的作业负担。并且,在根据条件变更、根据OCR处理的结果需要提高OCR处理精度而对制作过一次的表单152进行布局信息的修正的情况下,也同样地在表单制作装置110和OCR装置120中共用在表单制作装置110中修正过的布局信息,从而能够减轻用户的作业负担。0093另外,在布局信息中包含对可变表单进
48、行定义的可变信息,该可变表单是表单152中的输入区域184的例如形状、大小190I、配置、分割数等可变的表单。0094如果在处理这种可变表单的情况下不采用任何方法,则OCR处理部226不得不仅根据图像数据估计该输入区域184,有时无法得到适当的OCR结果。因此,在本实施方式中,表单制作装置110根据用户的输入操作来确定布局信息中的作为可变信息的输入区域184的形状、大小190I、配置、分割数等,当数据输出部172将包含确定了可变信息中的输入区域184的可变信息的布局信息输出到打印机130时,以该数据输出部172的输出为契机,布局发送部170将确定了该输入区域184的布局信息发送给OCR装置12
49、0。另外,在要在打印机130中确定输入区域184的形状、大小190I、配置、分割数等的情况下,布局发送部170也可以以来自打印机130的表单152的实际印刷为契机,将确定了该输入区域184的布局信息发送给OCR装置120。0095根据上述结构,在OCR装置120中布局信息的输入区域184已确定,因此能够根据正确的输入区域184的信息来提高OCR处理精度,并且由于成为OCR处理的对象的区域缩小,因此能够降低处理负载。0096另外,这种情况下的布局信息也可以是上述的与用户的操作输入相应的表单152的布局的参考用图像数据。例如,OCR装置120将扫描仪140所读取的表单152的图像数据例如格线的位置等以与作为布局信息的参考用图像数据一致地方式进行校正之后,进行OCR处理。即使根据上述结构也能够提高OCR处理精度。0097辅助生成部228生成辅助信息,该辅助信息辅助布局信息的生成。并且,在辅助信息中还包含表示布局信息的改进点的改进信息。以上说明了辅助信息中的算法信息,因此在此详细说明改进信息。0098图7是用于说明改进信息的说明图。特别是,图7的A表示布局信息的一例,图7的B表示改进信息的一例,图7的C表示基准数据的一例。0099辅助生成部228参照由布局获取部220获取到的例如图7的A示出的与输入区域184有关的布局信息。前面使用图4的C说明了上述布局信息,因此省略说明。0100另外,
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1