数据输入系统,数据输入接收装置,数据输入读取方法,以及数据输入接收方法.pdf

上传人:1** 文档编号:4578069 上传时间:2018-10-21 格式:PDF 页数:36 大小:1.67MB
返回 下载 相关 举报
摘要
申请专利号:

CN200910225481.5

申请日:

2009.12.16

公开号:

CN101902541A

公开日:

2010.12.01

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):H04N 1/00申请日:20091216|||公开

IPC分类号:

H04N1/00; H04N1/21; G06K9/00

主分类号:

H04N1/00

申请人:

富士施乐株式会社

发明人:

田村纯一

地址:

日本东京

优先权:

2009.05.26 JP 2009-126649

专利代理机构:

北京天昊联合知识产权代理有限公司 11112

代理人:

陈源;张天舒

PDF下载: PDF下载
内容摘要

一种数据输入系统,包括:图像读取器,其逐表格地读取填写有字符的每个表格的原始图像,提取通过逐字符地分割原始图像数据所得到的原始图像数据段并对每个原始图像数据段设置标识信息以限定位置,为每个原始图像数据段关联字符关联信息,以及相关联地输出原始图像数据段、对每个原始图像数据段设置的标识信息、和每个原始图像数据段的字符关联信息;系统还包括数据输入接收器,其按照预定过程显示所选择的原始图像数据段,接收文本数据输入以识别出每个原始图像数据段表示哪个字符;并通过使文本数据与原始图像数据段和为每个原始图像数据段设置的标识信息相关联来进行存储。

权利要求书

1: 一种数据输入系统, 其包括 : 图像读取装置, 包括 : 读取单元, 用于逐表格地读取填写有字符的每个表格的原始图像 ; 设置单元, 用于提取通过逐字符地对读取单元所读取的表格原始图像的数据进行分割 所得到的原始图像数据段, 并且对每个原始图像数据段设置标识信息以限定其在表格上的 位置 ; 生成单元, 用于为每个由设置单元所提取的原始图像数据段生成与其相关联的字符关 联信息 ; 以及 输出控制单元, 用于相关联地输出原始图像数据段、 对每个原始图像数据段设置的标 识信息、 以及为每个原始图像数据段生成的字符关联信息 ; 数据输入接收装置, 包括 : 显示控制单元, 用于对按照预定过程从输出控制单元所提供的原始图像数据段中选择 的任何原始图像数据段进行显示 ; 接收单元, 用于接收文本数据的输入, 所述文本数据用于标识显示控制单元所显示的 原始图像数据段中的每一个表示哪个字符 ; 以及 存储控制单元, 用于通过使接收单元所接收的文本数据、 显示控制单元所显示的原始 图像数据段、 和对每个原始图像数据段设置的标识信息相关联来进行存储。
2: 根据权利要求 1 的数据输入系统, 其中通过所述预定过程, 从原始图像数据段中随机地选择预定数量的原始图像数据 段。
3: 根据权利要求 1 或 2 的数据输入系统, 其中存储控制单元使接收单元所接收的文本数据与任何其它原始图像数据段相关联, 其中所述其它原始图像数据段的字符关联信息的细节与为显示控制单元所显示的每个原 始图像数据段所生成的字符关联信息的细节近似。
4: 根据权利要求 1 或 2 的数据输入系统, 其中显示控制单元不选择已通过存储控制单元与文本数据相关联的原始图像数据段。
5: 根据权利要求 1 或 2 的数据输入系统, 其中生成单元生成特征信息, 以用作为每个原始图像数据段生成的字符关联信息, 所 述特征信息用来指示由每个原始图像数据段表示的字符的特征 ; 并且存储控制单元针对显 示控制单元所显示的原始图像数据段来生成关于接收单元所接收的文本数据的特征信息, 并且当所生成的特征信息和为每个原始图像数据段生成的特征信息符合预定条件时, 将文 本数据、 原始图像数据段、 和每个原始图像数据段的标识信息相关联地进行存储。
6: 根据权利要求 1 或 2 的数据输入系统, 其中图像读取装置具有验证字符存储单元, 用来存储预定的多个用作验证字符的字 符; 生成单元通过针对存储在验证字符存储单元中的多个验证字符对原始图像数据段进行 验证, 识别出哪个验证字符与哪个原始图像数据段相关联, 以用作为每个原始图像数据段 生成的字符关联信息 ; 并且显示控制单元按照预定的考虑到验证字符类型的分类次序对被 标识为与某个原始图像数据段相关联的验证字符进行分类, 并显示与完成了分类的验证字 符相关联的原始图像数据段。 2
7: 根据权利要求 1 或 2 的数据输入系统, 其中图像读取装置具有验证字符存储单元, 用来存储预定的多个用作验证字符的字 符; 生成单元通过针对存储在验证字符存储单元中的多个验证字符对原始图像数据段进行 验证, 来识别出哪个验证字符与哪个原始图像数据段相关联, 以用作为每个原始图像数据 段生成的字符关联信息 ; 数据输入接收装置具有词存储单元, 用于存储预定的多个词 ; 显 示控制单元从存储在词存储单元中的多个词中提取任何由标识为与某个原始图像数据段 相关联的验证字符所构成词, 并且以验证字符构成所提取的词的次序来显示被标识为与验 证字符相关联的原始图像数据段。
8: 一种数据输入接收装置, 包括 : 存储单元, 用于存储数据 ; 读取单元, 用于逐表格地读取填写有字符的每个表格的原始图像 ; 设置单元, 用于提取通过逐字符地对读取单元所读取的表格原始图像的数据进行分割 所得到的原始图像数据段, 并且对每个原始图像数据段设置标识信息以限定其在表格上的 位置 ; 生成单元, 用于为每个由设置单元所提取的原始图像数据段生成与其相关联的字符关 联信息 ; 原始图像数据存储控制单元, 用于在存储单元中对原始图像数据段、 为每个原始图像 数据段设置的标识信息、 以及为每个原始图像数据段生成的字符关联信息进行相关联地存 储; 显示控制单元, 用于对按照预定过程从存储在存储单元中的原始图像数据段中选择的 任何原始图像数据段进行显示 ; 接收单元, 用于接收文本数据的输入, 所述文本数据用于标识显示控制单元所显示的 原始图像数据段中的每一个表示哪个字符 ; 以及 文本数据存储控制单元, 用于在存储单元中对通过使接收单元接收的文本数据、 由显 示控制单元显示的原始图像数据段、 以及为每个原始图像数据段设置的标识信息相关联来 进行存储。
9: 一种用于读取填写有字符的表格的原始图像的方法, 该方法包括 : 提取通过逐字符地对读取单元所读取的表格的原始图像的数据进行分割所得到的原 始图像数据段, 并且对每个原始图像数据段设置标识信息以限定其在表格上的位置 ; 为每个在设置步骤中提取的原始图像数据段生成与其相关联的字符关联信息 ; 以及 相关联地输出原始图像数据段、 对每个原始图像数据段设置的标识信息、 以及为每个 原始图像数据段生成的字符关联信息。
10: 一种由计算机执行的方法, 其中计算机连接有图像数据存储装置, 其用于对通过逐 字符地对填写有字符的表格的原始图像进行分割所得到的原始图像数据段、 为每个原始图 像数据段设置的标识信息、 以及为每个原始图像数据段生成的字符关联信息相关联地进行 存储, 所述方法包括 : 对按照预定过程从存储在图像数据存储装置中的原始图像数据段中选择的任何原始 图像数据段进行显示 ; 以及 在图像数据存储装置中, 通过使接收单元所接收的文本数据、 显示控制单元所显示的 3 原始图像数据段、 和对每个原始图像数据段设置的标识信息相关联来进行存储。

说明书


数据输入系统 , 数据输入接收装置 , 数据输入读取方法 , 以及数据输入接收方法

    【技术领域】
     本发明涉及数据输入系统、 数据输入接收装置、 数据输入读取方法、 以及数据输入 接收装置。背景技术
     对于填写有诸如地址和姓名等个人信息的表格的数据输入, 迄今已提出了各种技 术来避免个人信息的泄漏。专利文献 1(JP-A-2006-244315) 公开了如下技术, 其中对数据 表格的输入进行图像分割, 并在对其存储之前对所得的数据段进行交错, 即, 使用扫描仪来 读取表格, 然后基于数据表格输入的表格项目或者用户的任意选择来对表格图像进行分 割。对所得的数据段进行交错然后存储。专利文献 2(JP-A-08-272908) 公开了用于在任何 扫描的文档导致字符识别失败时进行数据输入的技术, 其中将识别失败部分的图像切出, 然后为所切出的图像设置标识或其它信息以进行存储。当图像包括任何机密事项时, 在进 行数据输入之前将机密事项部分从文档中切出, 然后打印出所得的文档来由数据输入人员 使用。 发明内容 本发明的目的是在数据输入人员可以接触到填写有相关人员的手写字符的表格 时, 避免向负责数据输入的人员展示过多的关于相关人员的个人信息细节。
     本发明的第一方面涉及一种数据输入系统, 其包括图像读取装置, 图像读取装置 具有 : 读取单元, 用于逐表格地读取填写有字符的每个表格的原始图像 ; 设置单元, 用于提 取通过逐字符地对读取单元所读取的表格原始图像的数据进行分割所得到的原始图像数 据段, 并 且对每个原始图像数据段设置标识信息以限定其在表格上的位置 ; 生成单元, 用 于为每个由设置单元所提取的原始图像数据段生成与其相关联的字符关联信息 ; 以及输出 控制单元, 用于相关联地输出原始图像数据段、 对每个原始图像数据段设置的标识信息、 以 及为每个原始图像数据段生成的字符关联信息 ; 所述数据输入系统还包括数据输入接收装 置, 其具有 : 显示控制单元, 用于对按照预定过程从输出控制单元所提供的原始图像数据段 中选择的任何原始图像数据段进行显示 ; 接收单元, 用于接收文本数据的输入, 所述文本数 据用于标识显示控制单元所显示的原始图像数据段中的每一个表示哪个字符 ; 以及存储控 制单元, 用于通过使接收单元所接收的文本数据与显示控制单元所显示的原始图像数据段 和对每个原始图像数据段设置的标识信息相关联来进行存储。
     根据本发明的第二方面, 在本发明第一方面的数据输入系统中, 通过所述预定过 程从原始图像数据段中随机地选择预定数量的原始图像数据段。
     根据本发明的第三方面, 在本发明第一方面或第二方面的数据输入系统中, 存储 控制单元还使接收单元所接收的文本数据与任何其它原始图像数据段相关联, 其中所述其 它原始图像数据段的字符关联信息的细节与为显示控制单元所显示的每个原始图像数据
     段所生成的字符关联信息的细节近似。
     根据本发明的第四方面, 在本发明第一方面至第三方面之一的数据输入系统中, 显示控制单元不选择已通过存储控制单元而与文本数据相关联的原始图像数据段。
     根据本发明的第五方面, 在本发明第一方面至第四方面之一的数据输入系统中, 生成单元生成特征信息, 以用作为每个原始图像数据段生成的字符关联信息, 来指示由每 个原始图像数据段表示的字符的特征 ; 并且存储控制单元针对显示控制单元所显示的原始 图像数据段来生成关于接收单元所接收的文本数据的特征信息, 并且当所生成的特征信息 以及为每个原始图像数据段生成的特征信息符合预定条件时, 将文本数据与原始图像数据 段和每个原始图像数据段的标识信 息相关联地进行存储。
     根据本发明的第六方面, 在本发明第一方面至第四方面之一的数据输入系统中, 图像读取装置具有验证字符存储单元, 用来存储预定的多个用作验证字符的字符 ; 生成单 元通过针对存储在验证字符存储单元中的多个验证字符对原始图像数据段进行验证, 来识 别出哪个验证字符与哪个原始图像数据段相关联, 以用作为每个原始图像数据段生成的字 符关联信息 ; 并且显示控制单元按照预定的考虑到验证字符类型的分类次序对被标识为与 某个原始图像数据段相关联的验证字符进行分类, 并显示与完成了分类的验证字符相关联 的原始图像数据段。 根据本发明的第七方面, 在本发明第一方面至第四方面之一的数据输入系统中, 图像读取装置具有验证字符存储单元, 用来存储预定的多个用作验证字符的字符 ; 生成单 元通过针对存储在验证字符存储单元中的多个验证字符对原始图像数据段进行验证, 来识 别出哪个验证字符与哪个原始图像数据段相关联, 以用作为每个原始图像数据段生成的字 符关联信息, 数据输入接收装置具有词存储单元, 用于存储预定的多个词 ; 显示控制单元从 存储在词存储单元中的多个词中提取任何由标识为与某个原始图像数据段相关联的验证 字符所构成的词, 并且以验证字符构成所提取的词的次序来显示被标识为与验证字符相关 联的原始图像数据段。
     本发明的第八方面涉及一种数据输入接收装置, 其包括 : 存储单元, 用于存储数 据; 读取单元, 用于逐表格地读取填写有字符的每个表格的原始图像 ; 设置单元, 用于提取 通过逐字符地对读取单元所读取的表格原始图像的数据进行分割所得到的原始图像数据 段, 并且对每个原始图像数据段设置标识信息以限定其在表格上的位置 ; 生成单元, 用于为 每个由设置单元所提取的原始图像数据段生成与其相关联的字符关联信息 ; 原始图像数据 存储控制单元, 用于在存储单元中对原始图像数据段、 为每个原始图像数据段设置的标识 信息、 以及为每个原始图像数据段生成的字符关联信息进行相关联地存储 ; 显示控制单元, 用于对按照预定过程从存储在存储单 元中的原始图像数据段中选择的任何原始图像数据 段进行显示 ; 接收单元, 用于接收文本数据的输入, 所述文本数据用于标识显示控制单元所 显示的原始图像数据段中的每一个表示哪个字符 ; 以及文本数据存储控制单元, 用于在存 储单元中使通过接收单元接收的文本数据、 由显示控制单元显示的原始图像数据段、 以及 为每个原始图像数据段设置的标识信息相关联来进行存储。
     本发明的第九方面涉及用于读取填写有字符的表格的原始图像的方法, 该方法包 括: 提取通过逐字符地对读取单元所读取的表格的原始图像的数据进行分割所得到的原始 图像数据段, 并且对每个原始图像数据段设置标识信息以限定其在表格上的位置 ; 为每个
     在设置步骤中提取的原始图像数据段生成与其相关联的字符关联信息 ; 以及相关联地输出 原始图像数据段、 对每个原始图像数据段设置的标识信息、 以及为每个原始图像数据段生 成的字符关联信息。
     本发明的第十方面涉及一种由计算机执行的方法, 其中计算机连接有图像数据存 储装置, 其用于对通过逐字符地对填写有字符的表格的原始图像进行分割所得到的原始图 像数据段、 为每个原始图像数据段设置的标识信息、 以及为每个原始图像数据段生成的字 符关联信息的相关联地进行存储, 并且计算机具有用于接收数据输入的接收单元, 所述方 法包括 : 对按照预定过程从存储在图像数据存储装置中的原始图像数据段中选择的任何原 始图像数据段进行显示 ; 以及在图像数据存储装置中, 通过使接收单元所接收的文本数据 与在显示控制步骤中所显示的原始图像数据段和对每个原始图像数据段设置的标识信息 相关联来进行存储。
     在本发明的第一方面中, 同将表格中填写的多个字符的字符串显示给负责数据输 入的人员的情况相比, 将不会在数据输入期间将字符串所表示的细节过多地展示给负责数 据输入的人员。
     在本发明的第二方面中, 同在一行中显示填写在表格中的字符串的情况相比, 不 会将表格的细节过多地展示给负责数据输入的人员。 在本发明的第三方面中, 一旦负责数据输入的人员输入了关于 所显示字符的文 本数据, 他 / 她将不必再重复输入关于与所显示字符类型近似的任何字符的文本数据。
     在本发明的第四方面中, 一旦负责数据输入的人员输入了关于一个字符的文本数 据, 将不再把该字符显示为输入对象, 从而避免了重复数据输入。
     在本发明的第五方面中, 为每个字符生成的特征信息可以用来识别填写在表格中 的哪个手写字符对应于所输入的文本数据。
     在本发明的第六方面中, 同负责数据输入的人员通过参照不分类就显示的字符串 来进行数据输入的情况相比, 如果字符在分类后属于容易进行数据输入的类型, 则负责数 据输入的人员会感到对这种类型的字符进行数据输入更容易。
     在本发明的第七方面中, 同参照无意义的任何字符串进行数据输入的情况相比, 将可以更容易地完成数据输入。
     在本发明的第八方面中, 同将表格中填写的多个字符的字符串显示给负责数据输 入的人员的情况相比, 将不会在数据输入期间将字符串所表示的细节过多地展示给负责数 据输入的人员。
     在本发明的第九方面中, 同逐表格项目等对填写在表格中的字符串进行分割的情 况相比, 即使所得的数据段部分泄漏至外界, 也不会将表格的细节过多地展示给第三方。
     在本发明的第十方面中, 同将表格中填写的多个字符的字符串显示给负责数据输 入的人员的情况相比, 将不会在数据输入期间将字符串所表示的细节过多地展示给负责数 据输入的人员。
     附图说明
     下面基于附图对本发明的示例实施例进行详细说明, 附图中 : 图 1 是示出了本发明的数据输入系统的示例构造的示图 ;图 2 是示出了第一示例实施例中表格中的示例数据的示图 ; 图 3 是第一示例实施例中的图像读取装置和数据输入接收装置的框图 ; 图 4 是第一示例实施例中的原始图像信息的概念图 ; 图 5 示出了第一示例实施例中的表格信息表中的示例数据 ; 图 6 是第一示例实施例中的图像读取装置的操作的流程图 ; 图 7 是第一示例实施例中的数据输入接收装置的操作的流程图 ; 图 8A 是示出了第一示例实施例中用于输入字符的示例屏幕的示图 ; 图 8B 示出了在图 8A 的字符输入屏幕上输入字符之后的示例屏幕的示图 ; 图 9 是示出了第一示例实施例中的表格信息表中的另一示例数据的示图 ; 图 10 是示出了第二示例实施例中的示例表格的示图 ; 图 11 示出了第二示例实施例中的表格信息表中的示例数据 ; 图 12 是第二示例实施例中的图像读取装置的操作的流程图 ; 图 13 是第二示例实施例中的数据输入接收装置的操作的流程图 ; 图 14A 是示出了第二示例实施例中用于输入字符的示例屏幕的示图 ; 图 14B 示出了在图 14A 的字符输入屏幕上输入字符之后的示例屏幕的示图 ; 图 15 是示出了第二示例实施例中的表格信息表中的另一示例数据的示图 ; 图 16 示出了第三示例实施例中的词表的示例数据 ; 图 17 示出了第三示例实施例中表格信息表中的示例数据 ; 图 18 示出了第三示例实施例中的数据输入接收装置的操作的流程图 ; 图 19A 是示出了第三示例实施例中用于输入字符的示例屏幕的示图 ; 图 19B 示出了在图 19A 的字符输入屏幕上输入字符之后的示例屏幕的示图 ; 以及 图 20 是示出了第三示例实施例中的表格信息表中的另一示例数据的示图。具体实施方式
     下面参照附图对本发明示例实施例中的数据输入系统进行说明。
     第一示例实施例
     概述
     图 1 示出了第一示例实施例中的数据输入系统的示例构造。如图 1 所示, 数据输 入系统 1 构造为包括图像读取装置 100, 以及多个数据输入接收装置 200a 至 200n( 下文中 在无需装置区分时统称为数据输入接收装置 200)。 图像读取装置 100 和数据输入接收装置 200 通过诸如 LAN( 局域网 ) 的通信单元彼此连接。
     在此示例实施例中的数据输入系统 1 中, 图像读取装置 100 操作来读取填写在表 格 30 中的具有如图 2 所示的预定格式的手写字符, 即分段成表格项目 301 至 303 以分别填 写地址、 姓名、 电话号码等。在数据输入接收装置 200 中, 通过参照所读取的手写字符, 输入 例如文本代码的文本数据来识别字符。所述数据输入由负责表格数据输入的人员 ( 下文中 将此人称作 “操作者” ) 使用字处理器功能 ( 即假名 - 汉字转换功能 ) 来进行。
     注意, 在此示例实施例中将表格例示为预先分段成具有需要填写各种细节的表格 项目的纸质介质, 但是其类型不应受到限制, 只要是由相关人员预先填写有手写字符串的 介质即可。结构
     图 3 是示出了作为数据输入系统 1 的构成组件的图像读取装置 100 和数据输入接 收装置 200 的构造的框图。下面对这些装置的构造进行说明。
     图像读取装置 100 由扫描仪装置实现, 并被构造为包括 CPU( 中央处理单元 )110、 ROM( 只读存储器 )111、 RAM( 随机存取存储器 )112、 接收部分 113、 图像读取部分 114、 存储 部分 115 和通信部 分 116。CPU 110 操作来使用 RAM 112 作为工作区运行存储在 ROM111 中控制程序, 从而使其中的组件即设置单元 110a、 生成单元 110b、 和输出控制单元 110c 工 作, 并且控制各个组件连接至 CPU 110。
     即, 设置单元 110a 基于预定数量的像素对图像进行分割以便提取。这里的图像数 据是如后文所述通过图像读取部分 114 读取每个表格的结果, 下文中将这些图像数据称为 原始图像数据。对每个这样提取的原始图像数据的分割结果 ( 下文中称为原始图像数据 段 ) 设置用于其标识的标识信息。生成单元 110b 从通过设置单元 110a 提取的原始图像数 据段中的手写字符中提取每个手写字符的任意特征, 并生成关于所述字符的特征信息来用 作字符关联信息。输出控制单元 110c 将包括设置单元 110a 所提取的原始图像数据段的原 始图像信息及其每一原始图像信息的标识信息存储在存储部分 115 中。 输出控制单元 110c 然后使标识信息与生成单元 110b 所生成的关于每个原始图像数据段的特征信息相关联, 并将进行关联的结果写入表格信息表。 这里的分割单位以及关于手写字符的特征将在后面 描述。
     接收部分 113 包括图像读取装置 100 的电源开关、 用于操作图像读取部分 114 的 操作开关等。 接收部分 113 把关于用户操作细节的信息发送至 CPU 110。 图像读取部分 114 通过对置于图像读取装置 100 上的表格 30 的填写表面照射光线来执行扫描, 然后将电信号 发送至 CPU 110。 所述电信号是对从表格反射并由 CCD( 电荷耦合器件 ) 接收的光线进行光 电转换的结果。
     存储部分 115 由例如硬盘的非易失性存储介质构成, 并存储原始图像信息以及诸 如表格信息表的数据。下文中将给出关于原始图像信息和表格信息表的详细说明。通信部 分 116 在 CPU 110 的控制下将数据发送至数据输入接收装置 200 以及从数据输入接收装置 200 接收数据。
     数据
     下面对用于存储在存储部分 115 中的数据进行说明。首先对第一示例实施例中的 原始图像数据段进行说明。
     如图 2 所示, 在表格 30 中, 表格项目 301 至 303 分别具有填写区域 311 至 313。填 写区域 311 至 313 分别由虚线分割成多个区域, 每个所述区域用于一个字符。对关于表格 30 的原始图像数据进行光栅扫描, 所述扫描从左上的像素开始顺次地逐像素进行。 于是, 基 于每个表格项目的填写区域对原始图像数据进行分割, 从而提取出每个关于一个字符的原 始图像数据段。此处所要提取的原始图像数据段是包括手写字符的图像数据, 并且对每个 填写区域进行自动判断以确定其中的黑色像素的数量是否等于或大于预定值。 然后使用判 断结果来检查填写区域是否包括手写字符。 对每个所要提取的原始图像数据段设置标识信 息以用于其标识。标识信息包括表格 ID、 项目 ID、 和提取次序, 所述标识信息是在提取原始 图像数据段之后设置的。表格 ID 用于标识哪个表格包括原始图像数据段中的哪一个, 项目ID 用于标识表格项目。 提取次序表示针对每个表格项目提取原始图像数据段的次序。 提取 结果, 即原始图像数据段和标识信息被存储在存储部分 115 的预定区域中作为原始图像信 息。这样, 在此示例实施例中, 按提取次序配置标识信息以作为光栅扫描表格的结果, 并且 包括关于原始图像数据段在表格中的位置的信息。
     注意, 标识信息中的表格 ID 可以是通过字符识别而在表格中得到的 ID, 或者通过 例如读取得到的印刷在表格上的条形码。或者, 图像读取装置 100 可以基于日期或者读取 处理的次序来设置表格 ID。另外, 可以以在考虑表格中的填写区域位置的情况下执行的光 栅扫描的次序分配预先设置的项目 ID。
     图 4 是原始图像信息的概念图, 其中对从图 2 的表格 30 中提取的原始图像数据 段和标识信息建立了相互关联。图中所例示的是如下情形, 其中在图 2 所示表格 30 的 “表 格 001” 下面的地址表格项目 301 中, 在填写区域 311 中由虚线分隔的一个区域中写有字符 “東” , 其表示 “东” , 发音为 “tou” 、 “higashi” 、 或 “azuma” , 此即原始图像数据段 311a。在这 种情况下, 如图 4 所示, 为原始图像数据段 311a( 即字符 “東” ) 设置有标识信息 31a, 包括表 格 ID“A001” 、 项目 ID“a” 、 和提取次序 “1” 。类似地, 原始图像数据段 311b 为 字符 “京” , 其表示 “城市” , 发音为 “kyou” 、 “kei” 、 或 “miyako” , 其标识信息 31b 包括表格 ID“A001” 、 项目 ID“a” 、 和提取次序 “2” 。 下面对表格信息表进行说明。图 5 示出了表格信息表中的示例数据。表格信息表 32 包括原始图像数据段的特征信息与标识信息之间的相互关联。 特征信息是关于每个原始 图像数据段中手写字符的特征。当为每个原始图像数据段提取了特征信息后, 对表格信息 表 32 进行存储, 其中以数据的形式存储所提取的特征信息和标识信息。
     在此实施例中, 通过识别构成每个手写字符的线段 ( 即竖线段和横线段 ) 的数量 来提取手写字符的特征信息。以图 4 中作为字符 “東” 的原始图像数据段 311a 为例, 对此 字符提取的特征信息包括一个竖线段和四个横线段。如图 5 所示, 特征信息 “竖 1 : 横 4” 与 此原始图像数据段的标识信息 ( 即表格 ID“A001” 、 项目 ID“a” 、 和提取次序 “1” ) 被相关 联地生成和存储。特征信息中的 “竖” 表示竖线段的数量, “横” 表示横线段的数量。
     数据输入接收装置 200
     下面对数据输入接收装置 200 的构造进行说明。数据输入接收装置 200 由个人 计算机或其他装置实现, 被构造为包括 CPU 210、 ROM 211、 RAM 212、 存储部分 213、 接收部 分 214、 显示部分 215、 和通信部分 216。CPU 210 操作来使用 RAM 212 作为工作区运行存储 在 ROM 211 中控制程序, 从而使其中的组件即提取单元 210a、 显示控制单元 210b、 和存储控 制单元 210c 工作, 并且控制各个组件连接至 CPU 210。即, 提取单元 210a 从图像读取装置 100 所读取的图像数据中提取作为数据输入对象的表格的信息, 即表格信息和原始图像信 息。显示控制单元 210b 在显示部分 215 上显示从提取单元 210a 所提取的表格信息中随机 选择的字符的任意原始图像数据段。存储控制单元 210c 生成由操作者在文本数据输入中 得到的关于字符的特征信息, 并且针对与显示在显示部分 215 上的原始图像数据段有关的 特征信息来验证所得到的特征信息。然后存储控制单元 210c 根据验证 结果执行处理。
     存储部分 213 由例如硬盘的非易失性存储介质构成, 并存储诸如应用程序和用户 数据的各种数据。接收部分 214 由 10 位键区、 键盘、 鼠标等实现。接收部分 214 由操作者 操作进行输入, 并将关于所述用户输入操作的信息发送至 CPU 210。
     显示部分 215 由诸如液晶显示器的显示器实现, 并且在 CPU 210 的控制下显示各 种类型屏幕的图像, 例如用于操作者进行字符输入操作的字符输入屏幕。通信部分 216 在 CPU 210 的控制下向图像读取装置 100 发送数据或者从图像读取装置 100 接收数据。
     操作
     下面对第一示例实施例的数据输入系统 1 的操作进行说明。首先参照图 6 说明图 像读取装置 100 的操作。
     图像读取装置 100 的操作
     当用户将表格 30 置于图像读取装置 100 上, 以及当通过接收部分 113 对表格 30 执行图像读取操作时, 图像读取装置 100 的 CPU 110 通过对表格照射光线的图像读取部分 114 读取填写在表格中的字符 ( 步骤 S110)。然后 CPU 110 基于作为读取结果的图像的电 信号生成原始图像数据 ( 步骤 S111)。
     CPU 110 随后基于预先为每个表格项目设置的填写区域对在步骤 S111 中生成的 原始图像数据进行扫描。所述扫描为逐像素进行, 从而将原始图像数据分割成原始图像数 据段。然后为每个原始图像数据段设置标识信息 ( 步骤 S112)。也即, 针对为表格中的每 个表格项目设置的每个填写区域, 提取其中的像素值, 并检查像素值以确定这些像素是否 为黑色像素。对于被确定为其中的黑色像素数量等于或大于预定值的任何填写区域, 将填 写在区域中的数据提取为原始图像数据段。然后 CPU 110 为原始图像数据段生成包括表格 ID、 项目 ID 和提取次序的标识信息, 并将标识信息与原始图像数据段相关联地存储在 RAM 112 中。其中表格 ID 用于标识从哪个表格中提取了原始 图像数据段, 项目 ID 用于标识表 格项目。提取次序表示针对每个表格项目提取原始图像数据段的次序。 CPU 110 用于顺序读取存储在 RAM 112 中的原始图像数据段和标识信息, 并且针 对每个原始图像数据段提取在读取的原始图像数据段中得到的关于手写字符的特征信息 ( 步骤 S113)。即, CPU 110 检测每个原始图像数据段中字符的横线段和竖线段的数量, 并 使用检测结果 ( 即横线段和竖线段的数量 ) 生成关于每个原始图像数据段的特征信息。然 后 CPU 110 将原始图像信息存储在存储部分 115 中, 其中在原始图像信息中建立了原始图 像数据段和标识信息的相互关联。CPU 110 还使为每个原始图像数据段设置的标识信息与 在步骤 S113 中针对每个原始图像数据段提取的特征信息相关联, 并将进行关联的结果存 储在表格信息表 32 中 ( 步骤 S114)。
     数据输入接收装置 200 的操作
     下面参照图 7 对数据输入接收装置 200 的操作进行说明。
     在数据输入接收装置 200 中, 当操作者操作接收部分 214 来发出数据输入的指令 时 ( 步骤 S210 : 是 ), CPU 210 通过通信部分 216 访问图像读取装置 100 的存储部分 115, 从 而按表格 ID 的次序读取任何尚未配备有来自表格信息表 32 的数据的表格信息。将读取结 果存储在 RAM 212 中 ( 步骤 211)。
     执行通过这种访问开始的处理, 以从图像读取装置 100 的存储部分 115 读取数据, 在指定从数据输入接收装置 200 读取哪个数据之后将数据读取的请求发送至图像读取装 置 100, 图像读取装置 100 的 CPU 110 从存储部分 115 读取所请求的数据, 以经过通信部分 116 传输至数据输入接收装置 200。 为了将数据写入存储部分 115, 由数据输入接收装置 200 将数据写入请求发送至图像读取装置 100, 所述数据写入请求指示将哪个数据写入何处, 图
     像读取装置 100 的 CPU110 将所请求的数据存储在指定位置。下面 “访问” 的表述意味着这 些处理细节。
     在步骤 S211, CPU 210 任意选择存储在 RAM 212 中的关于表格 信息的任何标识信 息, 然后通过通信部分 216 访问图像读取装置 100 的存储部分 115, 以读取与所选择的标识 信息相关联的原始图像数据段。然后 CPU 210 显示输入对象的字符输入屏幕, 所述输入对 象即所读取的原始图像数据段 ( 步骤 S212)。
     参照附图 8A 和 8B, 对字符输入屏幕进行说明。图 8A 示出了在步骤 S212 显示的示 例字符输入屏幕 33。图 8A 的字符输入屏幕 33 示出了作为输入对象 33a 的字符 “東” 。字 符 “東” 属于原始图像数据段 311a, 其标识信息包括表格 ID“A001” 、 对应于表格项目 “地 址” 的项目 ID“a” 、 和提取次序 “1” 。如图 8B 所示, 操作者在字符输入屏幕 33 的输入数据 字段 33b 中输入与输入对象 33a( 即 “東” ) 相同的字符。
     重新参照图 7, 当操作者操作接收部分 214 在字符输入屏幕 33 上输入字符时, (步 骤 S213 : 是 ), CPU 210 通过检测所输入字符 “東” 的横线段和竖线段的数量来生成特征信 息 ( 步骤 S214)。在图 8B 的示例中, 关于所输入的字符 “東” 的特征信息为 “竖 1 : 横 4” , 因 为竖线段的数量为 1, 横线段的数量为 4。然后 CPU 210 读取存储在 RAM 212 中的关于表格 信息的特征信息, 并确定作为输入对象的字符的特征信息以及如上文所述输入的字符的特 征信息是否符合预定的验证条件 ( 步骤 S215)。注意, 在此示例实施例中, 所述验证条件是 指所输入字符的特征信息与为当前显示的原始图像数据段设置的特征信息之间的匹配。 当在步骤 S215 中确定关于特征信息的验证条件符合时, 即确定特征信息之间匹 配 ( 步骤 S215 : 是 ), CUP 210 将字符 “東” 存储在 RAM 212 中存储的表格信息中, 字符 “東” 是在字符输入屏幕 33 上输入的作为标识信息的输入数据, 其与在步骤 S215 中确定为相同 的特征信息相关联。然后 CPU 210 通过通信部分 216 访问图像读取装置 100 的存储部分 115, 并将所得的表格信息写入表格信息表 32 作为更新 ( 步骤 S216)。
     图 9 示出了如上所述更新的表格信息表 32。如图所示, 在表格 ID“A001” 的表格 信息中, 任何包括特征信息 “竖 1 : 横 4” 的输入 数据 321 都具有同在字符输入屏幕 33 上输 入的字符 “東” 有关的文本数据, 然后进行更新。
     重新参照图 7, 在步骤 S217 中, 当存储在 RAM 212 中的表格信息具有全部输入数据 时, 或者当操作者操作接收部分 214 结束数据输入处理时 ( 步骤 S217 : 是 ), CPU 210 结束 针对当前选择的表格的数据输入处理。
     另外在步骤 S217 中, 当存储在 RAM 212 中的表格信息还未存储有输入数据时, 或 者当操作者尚未操作接收部分 214 结束数据输入处理时 ( 步骤 S217 : 否 ), 流程返回步骤 S212, CPU 210 通过通信部分 216 访问图像读取装置 100 的存储部分 115。然后 CPU 210 随机读取与尚未具有输入数据的标识信息相关联的原始图像数据段, 并在字符输入屏幕 33 上显示所读取的原始图像数据段的字符。于是重复执行步骤 S212 及其后的处理。
     在步骤 S210, CPU 210 保持等待, 直到操作者发出通过接收部分 214 的操作进行 数据输入处理的指令 ( 步骤 S210 : 否 )。在步骤 S213, 在操作者在字符输入屏幕 33 上通过 对接收部分 214 的操作输入任何字符之前, CPU 210 都保持等待, 并显示字符输入屏幕 33。 在步骤 S215, 当 CPU 210 判定作为输入对象的原始图像数据段的特征信息与输入字符的特 征信息不符合验证条件时, 即判定两个特征信息不匹配时 ( 步骤 S215 : 否 ), 流程重复步骤
     S213 及其后的处理。注意, 在这种情况下, 显示消息来要求操作者在字符输入屏幕 33 上再 次输入字符, 以使 CPU 210 针对操作者的字符输入操作准备好。
     在上述示例实施例中, 逐字符地随机显示填写在表格中的每个字符串原始图像数 据段, 并且有利地通过这种显示, 使得填写在表格的表格项目中的地址和姓名细节不会明 显展示给操作者。另外, 一旦操作者输入了原始图像数据段 ( 即字符 “東” ), 此输入操作还 会应用于同一表格中关于字符 “東” 的任何其他原始图像数据段, 因此操作者无需对同一字 符重复进行数据输入。
     第二示例实施例
     下面对本发明第二实施例中的数据输入系统进行说明。
     在第二示例实施例中, 对原始图像数据进行字符识别, 并且依据字符类型 ( 例如 数值或者字母字符 ) 以预定的次序排列完成识别的所得字符 ( 下文中称为识别字符 )。然 后将与如此排列的识别字符相关联的原始图像数据段显示出来, 以由操作者进行字符输入 操作。下文中任何与上述第一示例实施例中类似的构造均具有相同的参考标号。
     图 10 示出了第二示例实施例中的示例表格。 与第一示例实施例中的表格 30 类似, 图 10 的表格 40 被分成表格项目 401 至 403, 以分别填写邮政编码、 地址和姓名。表格项目 401 至 403 分别具有填写区域 411 至 413, 填写区域 411 至 413 中的每一个分别由虚线分割 成多个区域, 每个所述区域用于一个字符。
     在第二示例实施例中, 在图像读取装置 100 中, 生成单元 110b 对任一原始图像数 据段应用图案匹配处理, 其中每个原始图像数据段的标识信息都包括指示需要填写数值的 “邮政编码” 表格项目 401 的项目 ID, 此标识信息因而标识哪个数值与原始图像数据段对 应。输出控制单元 110c 将已标识的数值存储在表格信息表 42 中作为原始图像数据段的文 本信息。图 11 示出了此示例实施例中的示例表格信息表。如图所示, 与第一示例实施例中 的表格信息表 32 类似, 在表格信息表 42 中, 建立了为每个原始图像数据段设置的标识信息 ( 即表格 ID、 项目 ID、 和提取次序 ) 与识别字符之间的相互关联。 这些识别字符是作为应用 于原始图像数据段的手写字符的图案匹配处理的结果而被识别的, 即与每个手写字符相关 联的字符关联信息。在对每个原始图像数据段进行字符识别处理时, 表格信息表 42 存储有 完成了字符识别的标识信息以及识别字符。
     注意, 与第一示例实施例类似, 存储部分 115 存储原始图像信息, 其中原始图像数 据段与标识信息相关联, 其中还预先提供有用于图案识别的数据。这些数据在下文中称为 验证文本数据。
     操作
     下面参照图 12、 13 对第二示例实施例中的数据输入系统 1 的操作进行说明。注 意, 在图 12 和图 13 中, 任何与前述第一示例实施例中类似的处理都具有相同的步骤号, 通 过参照图 10、 11 的示例来对不同于第一示例实施例的操作进行说明。首先说明图像读取装 置 100 的操作。
     图像读取装置 100 的操作
     参照图 12, 图像读取装置 100 的 CPU 110 执行步骤 S110 至 S112 的处理。CPU 110 从存储部分 115 读取验证文本数据, 并使用所述验证文本数据、 通过对任何标识信息包含 项目 ID“a” 的原始图像数据段应用图案匹配来执行字符识别, 从而标识出完成了字符识别的数值 ( 步骤 S123)。然后 CPU 110 将其中原始图像数据段与标识信息相关联的原始图像 信息存储在存储部分 115 中。CPU 110 还在表格信息表 42 中存储包含项目 ID“a” 的关于 任何原始图像数据段的标识信息、 以及为原始图像数据段进行标识的数值 ( 步骤 S124)。
     数据输入接收装置 200 的操作
     在图 13 中, 与第一示例实施例类似, 数据输入接收装置 200 的 CPU 210 执行步骤 S210 和 S211 的处理, 并从图像读取装置 100 中读取表格 ID“B001” 的任何表格信息, 以存 入 RAM 212。
     CPU 210 以升序对存储在 RAM 212 中的表格信息中与项目 ID “a” 相关联的识别字 符进行分类, 并通过通信部分 216 访问图像读取装置 100 的存储部分 115, 以读取任何标识 信息包括项目 ID“a” 的原始图像数据段。然后 CPU 210 在字符输入屏幕上相关联地显示 已完成分类的识别字符的原始图像数据段和标识信息 ( 步骤 S221)。
     现参照图 14A 和 14B 对第二示例实施例中的字符输入屏幕进行说明。图 14A 示 出将在步骤 S221 中显示的示例字符输入屏幕 43。在字符输入屏幕 43 上, 以升序对表格 ID“B001” 下的与项目 ID“a” 相关联的识别字符 “5” 、 “6” 、 “7” 、 “1” 、 “2” 、 “4” 、 和 “3” 进行 分类, 与识别字符相关联的手写数字的原始图像数据段, 即 “1” 、 “2” 、 “3” 、 “4” 、 “5” 、 “6” 、 和 “7” , 被显示在输入对象 43a 中。如图 14B 所示, 在字符输入屏幕 43 上, 操作者将显示在 输入对象 43a 中的数值输入到输入数据字段 43b。
     参照图 13, 当操作者操作接收部分 214 在字符输入屏幕 43 上输入字符时 ( 步骤 S213 : 是 ), CPU 210 将数字数据存储在 RAM 212 中存储的表格信息中, 作为与显示在字符输 入屏幕 43 上的每个原始图像数据段所设置的标识信息相关的输入数据。然后 CPU 210 通 过通信部分 216 访问图像读取装置 100 的存储部分 115, 以将相关表格信息写入表格信息表 42, 从而更新信息 ( 步骤 S216)。
     图 15 示出了所更新的表格信息表 42 的示例。如图 15 所示, 在表格信息表 42 中, 表格 ID“B001” 下的项目 ID“a” 的输入数据字段 421 存储有在字符输入屏幕 43 输入的数 字数据。
     在上述第二示例实施例中, 在表格中得到的诸如数值的字符在以预定次序 ( 升序 或降序 ) 分类后进行显示, 操作者参考已完成分类的字符进行数据输入。
     注意, 在上述第二示例实施例中, 所例示的是字符识别对象为数值的情况。 这当然 并非限定, 字符识别的对象可以是字母字符或者日语字符。 例如, 在对特定表格项目中的任 何原始图像数据段执行字符识别之后, 当识别字符全部是字母字符时, 可以在显示前以字 母顺序对识别字符进行分类。此外当识别字符全部是日语字符时, 可以以文字码对识别字 符进行分类, 或者在日语数值的情况下, 以升序或降序进行分类。 从而以预定次序对识别字 符进行分类, 以显示原始图像数据段。
     第三示例实施例
     在上述第二示例实施例中, 以预定次序对作为数值的原始图像数据段进行分类以 便显示, 并输入所得的数据。在第三示例实施例中, 对任何并非数值的字符进行字符识别, 并从预先存储在数据输入接收装置 200 中的词表中提取任何包含识别字符的字, 以按照所 提取的字的次序显示原始图像数据段。 下文中, 与上述第一示例实施例中类似 的构造具有 相同的参考标号, 主要对不同的构造进行说明图 16 示出了第三示例实施例中的示例词表。如图 16 所示, 词表 50 包括用于对词 进行标识的元素 “词 ID” , 以及各种类型的词, 即名词、 形容词和动词。词表 50 预先存储在 数据输入接收装置 200 的存储部分 213 中。
     图 17 示出了与第二示例实施例中类似的表格信息表 42。 此表格信息表 42 示例性 地包括通过应用于原始图像数据段的字符识别处理而得到的完成了标识的识别字符, 其中 所述原始图像数据段的标识信息包括对应于表格项目 402 和 403( 即地址与姓名 ) 的表格 ID。与第二示例实施例类似, 图像读取装置 100 的存储部分 115 存储有原始图像信息, 其中 原始图像数据段和标识信息相关联地存储。存储部分 115 还预先具有验证文本数据以用于 图案匹配。
     操作
     下面对第三示例实施例中的数据输入系统 1 的操作进行说明。由于此示例实施例 中的图像读取装置 100 与前述第二示例实施例中的类似, 此处仅对数据输入接收装置 200 的操作进行说明。图 18 是数据输入接收装置 200 的操作的流程图。下面参照图 10、 16、 和 17 的示例进行说明。
     与第二示例实施例类似, 数据输入接收装置 200 的 CPU 210 执行步骤 S210 和 S211 的处理, 并从表格信息表 42 中读取关于表格 ID “B001” 的信息以存入 RAM 212。在表格信息 中的识别信息中, 这里假设 CPU 210 选择了识别字符 “静” , 其表示 “安静” , 发音为 “sizu” 、 “sei” 或 “jou” , 此识别字符与尚未提供输入数据的标识信息相关, 即具有表格 ID“B001” 、 项目 ID“c” 和提取次序 “3” 的标识信息 ( 步骤 S231)。这样的识别字符在下文中称为尚未 输入的识别字符。其后, CPU 210 从存储部分 213 读取词表 50, 并从中提取任何包括所选尚 未输入的识别字符的词, 即 “静岡県” , 其表示 “Shizuoka 县” , 发音为 “shizuoka ken” (步 骤 S232)。
     在存储于 RAM 212 中的表格信息中, CPU 210 使用任何与包括 不同于所选尚未输 入的识别字符 “静” 的项目 ID 的标识信息相关的尚未输入的识别字符, 来判断提取出的词 “静岡県” 是否可被构成 ( 步骤 S233)。
     在步骤 S233 中, 当判定提取出的词 “静岡県” 能够通过尚未输入的识别字符 “静” 、 其他尚未输入的识别字符 “岡” ( 表示 “山” , 发音为 “oka”或 “kou” )、 以及 “県” ( 表示 “县” , 发音为 “ken” 、 “gen” 或 “agata” ) 构成时 ( 步骤 S233 : 是 ), CPU 210 通过通信部分 216 访问图像读取装置 100 的存储部分 115。这里的尚未输入的识别字符 “岡” 与包括表格 ID“B001” 、 项目 ID“c” 和提取次序 “1” 的标识信息相关, 尚未输入的识别字符 “県” 与包 括表格 ID“B001” 、 项目 ID“b” 和提取次序 “4” 的识别信息相关。然后 CPU210 分别读取对 应于这些尚未输入的识别字符的原始图像数据段, 并按照词的顺序在字符输入屏幕上显示 所读取的原始图像数据段 ( 步骤 S234)。
     图 19A 示出了这样显示的示例字符输入屏幕 51。输入对象 511 至 513 按照所选词 的顺序显示原始图像数据段。如图 19B 所示, 在分别对应于输入对象 511 至 513 的输入数 据字段 521 至 523 中, 输入与输入对象 511 至 513 中的字符相同的字符。
     重新参照图 18, 在步骤 S213 中, 当在步骤 S236 显示的字符输入屏幕 51 提供了字 符时 ( 步骤 S213 : 是 ), CPU 210 执行与第二示例实施例中类似的步骤 S216 及其后的处理。 图 20 示出了在上述示例中的步骤 S216 中完成了处理的表格信息表 42。如图所示, 有操作者在字符输入屏幕 51 上提供的文本数据 “静” 、 “岡” 、 “県” 被存储在输入数据 422 中, 其对 应于为所显示的原始图像数据段设置的标识信息。
     此外在图 18 中, 在步骤 S233 中, 当判定所提取的词无法被构成时 ( 步骤 S233 : 否 ), CPU 重复步骤 S233 的处理, 即从词表 50 中逐个进行词提取 ( 步骤 S232), 直到词表 50 中的每个词都完成了步骤 S233 的处理 ( 步骤 S235 : 否 )。
     此外在步骤 S235 中, 当对词表 50 中的每个词完成了步骤 S233 的判定之后 ( 步骤 S235 : 是 ), CPU 210 通过通信部分 216 访问图像读取装置 100 的存储部分 115, 并在字符输 入屏幕上按照词的顺序显示原始图像数据段 ( 步骤 S236)。这里的原始图像数据段对应于 任何可以成为所提取出的词的一部分的尚未输入的识别字符, 并且对应于任何已输入的识 别字符。也即, 当最新提取出的词为 “静岡県” 时, 当该词无法通过尚未输入的识别字符构 成时, 通过组合已输入的识别字符来构成其它词, 从而显示分别对应于识别字符的原始图 像数据段。 在这种情况下, 在字符输入屏幕上, 任何完成输入的数据都被提供至对应于完成 输入的原始图像数据段的输入数据字段。 当即使把已输入的识别字符组合起来也无法构成 词的时候, 可以显示任何部分地对应于识别字符 ( 词的一部分 ) 的原始图像数据段。在这 种情况下, 对于词 “静岡県” , 如果在表格信息中未得到 “岡” 的识别字符, 则仅显示字符 “静” 和 “県” 的原始图像数据段。
     这样, 在上述示例实施例中, 按具有意义的词的次序对表格中得到的字符进行显示。 变形示例
     下面对本发明的变形示例进行说明。
     1、 在前述第一示例实施例中, 例示了提取竖线段和横线段的数量作为特征信息的 情况。这当然并非限定, 任何能够提取特征字符的其它方法均可适用。在一种示例方法中, 可以提取在填写区域中观察到的字符区域与剩余区域之间的密度差别, 从而检测出字符的 轮廓, 提取所检测到的轮廓信息作为特征信息。 在另一示例方法中, 通过对填写区域中沿着 字符四周出现的黑色像素进行密度检测来对字符进行分类, 并生成关于所得分类的信息作 为特征信息。作为替代方案, 如此生成的特征信息可以同第一示例实施例中的特征信息相 关联地存储, 并且在符合验证条件时, 例如关于输入字符的特征信息与关于原始图像数据 段的特征信息落入预定的相似度范围内, 则可以将输入字符与对原始图像数据段设置的标 识字符相关联地存储。
     2、 在前述第一示例实施例中, 例示了逐字符地随机显示原始图 像数据段的情况。 替代方案是, 排列多个具有不同项目 ID 的原始图像数据段进行显示。
     3、 在前述第二示例实施例中, 例示了将输入的数值与同一表格 ID 下的识别字符 的标识信息一起存储的情况。替代方案是, 输入的数值可以与不同表格 ID 下的对同一识别 字符设置的标识信息相关联地进行存储。
     4、 在前述第二示例实施例中, 例示了对同一项目 ID 下的识别字符按照预定次序 进行分类、 并以相同的次序显示原始图像数据段的情况。 替代方案是, 当数值形式的识别字 符存储在多个表格项目中时, 可以按照预定次序对所有表格项目中的识别字符进行分类, 并且以相同的次序显示预定数量的原始图像数据段。
     5、 在上述第三示例实施例中, 例示了对词进行提取的情况, 其中所述词是不同表
     格项目下的识别字符的组合。替代方案是, 可以将任一同一表格项目中的识别字符组合起 来, 以构成未在表格项目中得到的词。
     6、 在前述第一至第三示例实施例中, 例示了逐表格地对每个数据输入接收装置 200 进行数据输入的情况。替代方案是, 可以由两个不同的操作者分别对数据输入接收装 置 200a 和 200b 输入同一表格的文本数据。在这种情况下, 按照第一和第三示例实施例, 在 提取了与表格信息表中尚未提供数据的标识信息相对应的原始图像数据段之后, 数据输入 接收装置 200a 和 200b 可以各自在表格信息表中设置使用标记, 来表示正在使用标识信息, 并且可以显示所提取的原始图像数据段。在第二示例实施例中, 数据输入接收装置 200a 和 200b 各自接收逐表格项目输入的表格中的文本数据, 并在表格信息表中对作为包括输入对 象的项目 ID 的标识信息设置使用标记。然后数据输入接收装置 200a 和 200b 各自以预定 的次序对输入对象项目 ID 下的原始图像数据段进行分类以便显示。
     7、 在前述第一至第三示例实施例中, 例示了在包括原始图像数据段的表格中按照 原始图像数据段的提取次序对每个原始图像数据段设置标识信息的情况。替代方案是, 所 设置的标识信息可以表示原 始图像数据段的位置, 例如原始图像数据段在表格中的坐标。
     8、 在前述第一示例实施例中例示了如下情况, 其中数据输入接收装置 200 对操作 者提供的原始图像数据段的文本数据进行存储, 其中所述原始图像数据段还与对任何其它 原始图像数据段设置的标识信息相关联地显示在显示部分 215 上, 其中所述标识信息包括 与所显示的原始图像数据段相对应的字符关联信息。替代方案是, 数据输入接收装置 200 可以相关联地存储仅为设置给所显示的原始图像数据段的标识信息提供的文本数据。 在这 种情况下, 另一替代方案是, 当在显示部分 215 上显示操作者所提供的文本数据以及其它 原始图像数据段时, 以及当操作者确定输入其文本数据作为与所述其它原始图像数据段对 应的文本数据时, 可以将输入的文本数据和为其它原始图像数据段设置的标识信息相关联 地存储。
     9、 在前述第一示例实施例中例示了如下情况, 其中图像读取装置 100 在其存储部 分 115 中相关联地存储完成了读取的每个表格中的原始图像数据段、 对每个原始图像数据 段设置的标识信息、 以及对应于每个原始图像数据段的字符关联信息 ( 即字符信息和识别 字符 )。 替代方案是, 图像读取装置 100 可以配置为将这些数据发送至其它连接至图像读取 装置 100 和数据输入接收装置 200 的设备, 并在这些设备中存储数据。在这种情况下, 数据 输入接收装置 200 可以访问这些设备, 其中相关联地存储有字符关联信息 ( 字符信息和识 别字符 )、 原始图像数据段、 对每个原始图像数据段设置的标识信息、 以及对应于每个原始 图像数据段的字符关联信息, 从而读取这些数据以及写入输入文本数据。
     10、 前述第一至第三示例实施例中的数据输入系统 1 被例示为通过图像读取装置 100 和数据输入接收装置 200 构成。 替代方案是, 图像读取装置 100 可以构造为还用作数据 输入接收装置 200, 在所得到的图像读取装置 100 中, 可以由操作者提供文本数据输入以输 入数据。
     11、 前述第一至第三示例实施例中的表格被例示为预先分成表格项目, 所述表格 项目包括用来填写信息细节的填写区域。 当表格是 未如此定义填写区域的任何介质时, 可 以如下执行原始图像数据段的提取。例如, 图像读取装置 100 可以预定的间隔扫描填写有 手写字符的介质, 以检测黑色像素的分布, 从而定义填写在介质中的字符之间的间隔。然后, 基于如此定义的字符间隔, 图像读取装置 100 可以从介质的原始图像数据中逐字符地 提取原始图像数据段。
     12、 前述第一至第三示例实施例中的数据输入接收装置 200 被例示为包括显示部 分 215。替代方案是, 数据输入接收装置 200 可以连接至诸如液晶显示器的外部显示器。在 这种结构中, 数据输入接收装置 200 的 CPU 210 可以在显示装置上如前述示例实施例一样 来控制显示字符输入屏幕的图像。
     13、 前述第一至第三示例实施例中分别由图像读取装置 100 和数据输入接收装置 200 从 CPU 110、 210 运行的程序, 可以以诸如磁记录介质 ( 如磁带、 磁盘 )、 光记录介质 ( 如 光盘 )、 磁一光记录介质、 和半导体存储器的计算机可读记录介质的形式发布。还可以使用 如互联网的通信单元来将程序下载至图像读取装置 100 和数据输入接收装置 200。
     对本发明的示例实施例的前述说明用于例示和说明, 而非排他性的或者将本发明 限定为所公开的确切形式。显然, 本领域的技术人员将能够作出很多变形和变动。对实施 例的选择和描述是为了向本领域的技术人员作出最佳的阐释以便理解本发明, 各种实施例 和各种修改则适于特定的应用目的。本发明的范围应当由权利要求及其等价部分限定。

数据输入系统,数据输入接收装置,数据输入读取方法,以及数据输入接收方法.pdf_第1页
第1页 / 共36页
数据输入系统,数据输入接收装置,数据输入读取方法,以及数据输入接收方法.pdf_第2页
第2页 / 共36页
数据输入系统,数据输入接收装置,数据输入读取方法,以及数据输入接收方法.pdf_第3页
第3页 / 共36页
点击查看更多>>
资源描述

《数据输入系统,数据输入接收装置,数据输入读取方法,以及数据输入接收方法.pdf》由会员分享,可在线阅读,更多相关《数据输入系统,数据输入接收装置,数据输入读取方法,以及数据输入接收方法.pdf(36页珍藏版)》请在专利查询网上搜索。

一种数据输入系统,包括:图像读取器,其逐表格地读取填写有字符的每个表格的原始图像,提取通过逐字符地分割原始图像数据所得到的原始图像数据段并对每个原始图像数据段设置标识信息以限定位置,为每个原始图像数据段关联字符关联信息,以及相关联地输出原始图像数据段、对每个原始图像数据段设置的标识信息、和每个原始图像数据段的字符关联信息;系统还包括数据输入接收器,其按照预定过程显示所选择的原始图像数据段,接收文本。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1