《手写文档处理装置、手写文档处理方法和手写文档处理程序.pdf》由会员分享,可在线阅读,更多相关《手写文档处理装置、手写文档处理方法和手写文档处理程序.pdf(35页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 104346320 A (43)申请公布日 2015.02.11 CN 104346320 A (21)申请号 201410389153.X (22)申请日 2014.08.08 2013-166367 2013.08.09 JP G06F 17/21(2006.01) G06F 3/01(2006.01) (71)申请人 株式会社东芝 地址 日本东京都港区芝浦一丁目 1 番 1 号 (72)发明人 井本和范 中洲俊信 (74)专利代理机构 上海市华诚律师事务所 31210 代理人 彭里 (54) 发明名称 手写文档处理装置、 手写文档处理方法和手 写文档处理程序 (。
2、57) 摘要 根据一个实施例, 手写文档处理装置包括输 入 / 输出单元和处理单元。输入 / 输出单元获取 手写文档的多个笔划数据组。笔划数据组包括包 括第一笔划数据的第一部分、 包括第二笔划数据 的第二部分和包括第三笔划数据的第三部分。处 理单元能够实施基于笔划数据组导出第一表格数 据和将第一表格数据提供至输入 / 输出单元的第 一处理操作。第一表格数据包括对应于第一部分 的第一格线、 对应于第二部分的第一单元格数据、 对应于第三部分的第二单元格数据、 和被设置在 第一单元格数据和第二单元格数据之间的第二格 线。本发明还包括一种手写文档处理方法和一种 手写文档处理程序。 (30)优先权数据 。
3、(51)Int.Cl. 权利要求书 3 页 说明书 20 页 附图 11 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书3页 说明书20页 附图11页 (10)申请公布号 CN 104346320 A CN 104346320 A 1/3 页 2 1. 一种手写文档处理装置, 其特征在于, 包含 : 输入/输出控制器, 所述输入/输出控制器被配置成获取手写文档的笔划数据, 所述笔 划数据包含第一部分、 第二部分和第三部分, 所述第一部分包含第一笔划数据, 所述第二部 分包含第二笔划数据, 所述第三部分包含第三笔划数据 ; 以及 处理器, 所述处理器被配置成基于所述笔。
4、划数据导出第一表格数据并将所述第一表格 数据提供给所述输入 / 输出控制器, 所述第一表格数据包含第一格线、 第一单元格数据、 第 二单元格数据和第二格线, 所述第一格线对应于所述第一部分, 所述第一单元格数据对应 于所述第二部分, 所述第二单元格数据对应于所述第三部分, 所述第二格线被设置在所述 第一单元格数据和所述第二单元格数据之间。 2. 如权利要求 1 所述的装置, 其特征在于, 所述第一部分沿着第一方向延伸, 所述第一部分包含所述第一笔划数据组, 所述第一笔划数据组沿所述第一方向被互相分离, 并且 所述第一格线沿着所述第一方向延伸。 3. 如权利要求 2 所述的装置, 其特征在于, 。
5、所述第一笔划数据组之间的间隔比所述第 二部分沿着所述第一方向的长度更短, 并且比所述第三部分沿着所述第一方向的长度更 短。 4. 如权利要求 1 所述的装置, 其特征在于, 所述第二部分和所述第三部分在从所述第 二部分朝着所述第三部分的方向上互相接近。 5. 如权利要求 1 所述的装置, 其特征在于, 所述处理器被配置成基于由所述输入 / 输出控制器获取的所述笔划数据来导出第二 表格数据, 并且将所述第二表格数据提供给所述输入 / 输出控制器, 其中所述第二表格数 据包含第三格线和第三单元格数据, 所述第三格线对应于所述第一部分, 所述第三单元格 数据对应于所述第二部分, 并且 当所述第一部分。
6、被显示在显示器上时的所述第一部分的延伸方向与当所述第三格线 被显示在所述显示器上时的所述第三格线的延伸方向相交。 6. 如权利要求 5 所述的装置, 其特征在于, 所述显示器包含具有边的显示区域, 所述第一部分的延伸方向相对于所述边倾斜, 并且 所述第三格线的延伸方向与所述边对齐。 7. 如权利要求 1 所述的装置, 其特征在于, 所述导出第一表格数据包含 : 导出第一轴和第二轴的轴估算处理, 所述第二轴垂直于所述第一轴, 所述笔划数据到 所述第二轴上的累积投影分量的峰值高于所述笔划数据到相对于所述第二轴倾斜的轴上 的累积投影分量的峰值 ; 以及 格线导出处理, 所述格线导出处理导出在所述第二。
7、部分和所述第三部分之间穿过的平 行或垂直于所述第一格线的所述第二格线, 并且基于所述笔划数据到所述第二轴上的所述 累积投影分量来导出对应于所述第一部分的所述第一格线, 以及 所述第一部分到所述第二轴上的投影分量的峰值高于所述第二部分到所述第二轴上 权 利 要 求 书 CN 104346320 A 2 2/3 页 3 的投影分量的峰值, 并且高于所述第三部分到所述第二轴上的投影分量的峰值。 8. 如权利要求 1 所述的装置, 其特征在于, 所述导出所述第一表格数据包含 : 导出第一轴和第二轴的轴估算处理, 所述第二轴垂直于所述第一轴, 所述笔划数据组 到所述第二轴上的累积投影分量的峰值高于所述笔。
8、划数据到相对于所述第二轴倾斜的轴 上的累积投影分量的峰值 ; 以及 分类处理, 所述分类处理基于从所述笔划数据到所述第一轴上的所述累积投影分量和 所述笔划数据到所述第二轴上的所述累积投影分量中选择的至少一个, 将所述笔划数据分 类为格线数据和单元格数据, 所述单元格数据不同于所述格线数据, 以及 所述第一格线包含至少一部分所述格线数据。 9. 如权利要求 8 所述的装置, 其特征在于, 所述格线数据到所述第二轴上的累积投影 分量的峰值高于所述单元格数据到所述第二轴上的累积投影分量的峰值。 10. 如权利要求 1 所述的装置, 其特征在于, 所述导出所述第一表格数据包含 : 导出第一轴和第二轴的。
9、轴估算处理, 所述第二轴垂直于所述第一轴, 所述笔划数据到 所述第二轴上的累积投影分量的峰值高于所述笔划数据到相对于所述第二轴倾斜的轴上 的累积投影分量的峰值 ; 交点估算处理, 所述交点估算处理基于从所述笔划数据到所述第一轴上的累积投影分 量和所述笔划数据到所述第二轴上的累积投影分量中选择的至少一个, 来估算所述第一格 线与从所述第一轴和所述第二轴中选择的至少一个轴相交的交点 ; 以及 分类处理, 所述分类处理基于在所述估算的交点和所述笔划数据之间的距离将所述笔 划数据分类为格线数据和单元格数据, 所述单元格数据不同于所述格线数据, 以及 在所述第一部分和所述交点之间的距离比所述第二部分和所。
10、述交点之间的距离更短, 并且比所述第三部分和所述交点之间的距离更短。 11. 如权利要求 10 所述的装置, 其特征在于, 所述交点估算处理包含基于从所述笔划 数据到所述第一轴上的所述累积投影分量的峰的位置和所述笔划数据到所述第二轴上的 所述累积投影分量的所述峰的位置中选择的至少一个, 来估算至少一部分所述交点。 12. 如权利要求 10 所述的装置, 其特征在于, 所述交点估算处理包含基于从所述笔划 数据到所述第一轴上的所述累积投影分量的底的位置和所述笔划数据到所述第二轴上的 所述累积投影分量的底的位置中选择的至少一个, 来估算至少一部分所述交点。 13. 如权利要求 7 所述的装置, 其特。
11、征在于, 所述轴估算处理包含估算所述第二轴以使 所述笔划数据到所述第二轴上的所述累积投影分量的熵最小化。 14. 如权利要求 7 所述的装置, 其特征在于, 所述轴估算处理包含估算所述第一轴以使 所述笔划数据到所述第一轴上的所述累积投影分量的熵最小化。 15. 如权利要求 10 所述的装置, 其特征在于, 所述格线数据到所述第一轴上的累积投 影分量的峰值高于第一阈值。 16. 如权利要求 10 所述的装置, 其特征在于, 所述格线数据到所述第二轴上的累积投 影分量的峰值高于第二阈值。 17. 一种手写文档处理装置, 其特征在于, 包含 : 权 利 要 求 书 CN 104346320 A 3 。
12、3/3 页 4 输入/输出控制器, 所述输入/输出控制器被配置成获取手写文档的笔划数据, 所述笔 划数据包含第一部分和第二部分, 所述第一部分沿着第一方向延伸并且包含第一笔划数据 组, 所述第二部分包含第二笔划数据 ; 以及 处理器, 所述处理器被配置成基于所述笔划数据来导出第一表格数据, 并将所述第一 表格数据提供给所述输入 / 输出控制器, 所述第一表格数据包含第一格线和第一单元格数 据, 所述第一格线对应于所述第一部分, 所述第一单元格数据对应于所述第二部分, 所述第一笔划数据组沿所述第一方向被互相分离, 所述第一格线沿着所述第一方向延伸。 18. 如权利要求 17 所述的装置, 其特征。
13、在于, 所述第一笔划数据组之间的间隔比所述 第二部分沿着所述第一方向的长度更短。 19. 一种处理装置的手写文档处理方法, 其特征在于, 包含 : 获取手写文档的笔划数据, 所述笔划数据包含第一部分、 第二部分和第三部分, 所述第 一部分包含第一笔划数据, 所述第二部分包含第二笔划数据, 所述第三部分包含第三笔划 数据 ; 以及 基于所述笔划数据导出第一表格数据, 所述第一表格数据包含第一格线、 第一单元格 数据、 第二单元格数据和第二格线, 所述第一格线对应于所述第一部分, 所述第一单元格数 据对应于所述第二部分, 所述第二单元格数据对应于所述第三部分, 所述第二格线被设置 在所述第一单元格。
14、数据和所述第二单元格数据之间。 20. 一种包含手写文档处理程序的计算机可读的非暂时性存储介质, 其特征在于, 被配 置成 使得计算机获取手写文档的笔划数据, 所述笔划数据包含第一部分、 第二部分和第三 部分, 所述第一部分包含第一笔划数据, 所述第二部分包含第二笔划数据, 所述第三部分包 含第三笔划数据, 以及 使得所述计算机基于所述笔划数据导出第一表格数据, 所述第一表格数据包含第一格 线、 第一单元格数据、 第二单元格数据和第二格线, 所述第一格线对应于所述第一部分, 所 述第一单元格数据对应于所述第二部分, 所述第二单元格数据对应于所述第三部分, 所述 第二格线被设置在所述第一单元格数。
15、据和所述第二单元格数据之间。 权 利 要 求 书 CN 104346320 A 4 1/20 页 5 手写文档处理装置、 手写文档处理方法和手写文档处理程 序 0001 相关申请的交叉引用 0002 此申请基于在 2013 年 8 月 9 日提交的 2013-166367 号日本专利申请并由其要求 优先的利益 ; 其全部内容通过引用被合并在此处。 技术领域 0003 在这里描述的实施例一般地涉及一种手写文档处理装置、 一种手写文档处理方法 以及一种手写文档处理程序。 背景技术 0004 举例来说, 包括表格的信息是使用笔输入界面等等被电子地手写的。手写的表格 被适当地处理以将表格格式化。所希望。
16、的是能够将已经被更自由地手写的表格格式化。 发明内容 0005 本发明提供一种手写文档处理装置, 包含 : 输入 / 输出控制器, 所述输入 / 输出控 制器被配置成获取手写文档的笔划数据, 所述笔划数据包含第一部分、 第二部分和第三部 分, 所述第一部分包含第一笔划数据, 所述第二部分包含第二笔划数据, 所述第三部分包含 第三笔划数据 ; 以及处理器, 所述处理器被配置成基于所述笔划数据导出第一表格数据并 将所述第一表格数据提供给所述输入 / 输出控制器, 所述第一表格数据包含第一格线、 第 一单元格数据、 第二单元格数据和第二格线, 所述第一格线对应于所述第一部分, 所述第一 单元格数据对。
17、应于所述第二部分, 所述第二单元格数据对应于所述第三部分, 所述第二格 线被设置在所述第一单元格数据和所述第二单元格数据之间。 0006 本发明还提供一种手写文档处理装置, 包含 : 输入 / 输出控制器, 所述输入 / 输出 控制器被配置成获取手写文档的笔划数据, 所述笔划数据包含第一部分和第二部分, 所述 第一部分沿着第一方向延伸并且包含第一笔划数据组, 所述第二部分包含第二笔划数据 ; 以及处理器, 所述处理器被配置成基于所述笔划数据来导出第一表格数据, 并将所述第一 表格数据提供给所述输入 / 输出控制器, 所述第一表格数据包含第一格线和第一单元格数 据, 所述第一格线对应于所述第一部。
18、分, 所述第一单元格数据对应于所述第二部分, 所述第 一笔划数据组沿所述第一方向被互相分离, 所述第一格线沿着所述第一方向延伸。 0007 本发明进一步提供一种处理装置的手写文档处理方法, 包含 : 获取手写文档的笔 划数据, 所述笔划数据包含第一部分、 第二部分和第三部分, 所述第一部分包含第一笔划数 据, 所述第二部分包含第二笔划数据, 所述第三部分包含第三笔划数据 ; 以及基于所述笔划 数据导出第一表格数据, 所述第一表格数据包含第一格线、 第一单元格数据、 第二单元格数 据和第二格线, 所述第一格线对应于所述第一部分, 所述第一单元格数据对应于所述第二 部分, 所述第二单元格数据对应于。
19、所述第三部分, 所述第二格线被设置在所述第一单元格 数据和所述第二单元格数据之间。 说 明 书 CN 104346320 A 5 2/20 页 6 0008 本发明又提供一种包含手写文档处理程序的计算机可读的非暂时性存储介质, 被 配置成使得计算机获取手写文档的笔划数据, 所述笔划数据包含第一部分、 第二部分和第 三部分, 所述第一部分包含第一笔划数据, 所述第二部分包含第二笔划数据, 所述第三部分 包含第三笔划数据, 以及使得所述计算机基于所述笔划数据导出第一表格数据, 所述第一 表格数据包含第一格线、 第一单元格数据、 第二单元格数据和第二格线, 所述第一格线对应 于所述第一部分, 所述第。
20、一单元格数据对应于所述第二部分, 所述第二单元格数据对应于 所述第三部分, 所述第二格线被设置在所述第一单元格数据和所述第二单元格数据之间。 附图说明 0009 图 1 是显示根据第一实施例的手写文档处理装置的示意的视图 ; 0010 图 2 是显示根据第一实施例的手写文档处理装置的笔划数据的示意的视图 ; 0011 图 3 是显示根据第一实施例的手写文档处理装置的处理结果的示意的视图 ; 0012 图 4 是显示根据第一实施例的手写文档处理装置的另一个处理结果的示意的视 图 ; 0013 图 5 是显示根据第一实施例的手写文档处理装置的操作的流程图 ; 0014 图6A和图6B是显示根据第一。
21、实施例的手写文档处理装置的一部分操作的示意的 视图 ; 0015 图 7 是显示根据第一实施例的手写文档处理装置的一部分操作的示意的视图 ; 0016 图 8 是显示根据第一实施例的手写文档处理装置的一部分操作的示意的视图 ; 0017 图9A和图9B是显示根据第一实施例的手写文档处理装置的一部分操作的示意的 视图 ; 0018 图 10 是显示根据第一实施例的手写文档处理装置的其它笔划数据的示意的视 图 ; 0019 图 11 是显示根据第一实施例的手写文档处理装置的一部分操作的示意的视图 ; 0020 图 12 是显示根据第一实施例的手写文档处理装置的一部分操作的示意的视图 ; 0021 。
22、图 13 是显示根据第一实施例的手写文档处理装置的一部分操作的示意的视图 ; 0022 图14A和图14B是显示根据第一实施例的手写文档处理装置的一部分操作的示意 的视图 ; 0023 图 15 是显示根据第一实施例的手写文档处理装置的其它笔划数据的示意的视 图 ; 0024 图 16 是显示根据第一实施例的手写文档处理装置的一部分操作的示意的视图 ; 0025 图 17 是显示根据第一实施例的手写文档处理装置的一部分操作的示意的视图 ; 0026 图 18 是显示根据第一实施例的手写文档处理装置的一部分操作的示意的视图 ; 0027 图19A至图19C是显示根据第一实施例的手写文档处理装置的。
23、一部分操作的示意 的视图 ; 0028 图 20 是显示根据第一实施例的手写文档处理装置的其它笔划数据的示意的视 图 ; 0029 图 21 是显示根据第一实施例的手写文档处理装置的一部分操作的示意的视图 ; 0030 图22A和图22B是显示根据第一实施例的手写文档处理装置的处理结果的示意的 说 明 书 CN 104346320 A 6 3/20 页 7 视图 ; 0031 图 23 是显示在根据第一实施例的手写文档处理装置中使用的数据的示意的视 图 ; 0032 图 24 是显示根据第一实施例的手写文档处理装置的示意的视图 ; 0033 图 25 是显示根据第一实施例的手写文档处理装置的示。
24、意的视图 ; 以及 0034 图 26 是显示根据第一实施例的手写文档处理装置的操作的流程图。 具体实施方式 0035 根据一个实施例, 手写文档处理装置包括输入 / 输出单元和处理单元。输入 / 输 出单元被配置成获取手写文档的多个笔划数据组。笔划数据组包括第一部分、 第二部分和 第三部分。第一部分包括第一笔划数据。第二部分包括第二笔划数据。第三部分包括第三 笔划数据。处理单元能够基于由输入 / 输出单元获取的笔划数据组实施导出第一表格数据 和将第一表格数据提供至输入 / 输出单元的第一处理操作。第一表格数据包括第一格线, 第一单元格数据, 第二单元格数据, 和第二格线。第一格线对应于第一部。
25、分。第一单元格数 据对应于第二部分。第二单元格数据对应于第三部分。第二格线被设置在第一单元格数据 和第二单元格数据之间。 0036 以下将参考附图描述不同的实施例。 0037 附图是示意的或概念上的 ; 并且各部分之间的尺寸比例等等不必然与其实际的值 相同。更进一步, 即使对于相同的部分, 也可以在附图之间不同地图解尺寸和 / 或比例。 0038 在本申请的附图和说明书中, 类似于在上文中按照附图描述的那些的组件是用相 似的参考标号标记的, 并且酌情省略详细说明。 0039 第一实施例 0040 图 1 是显示根据第一实施例的手写文档处理装置的示意的视图。 0041 如图 1 中显示的, 根据。
26、本实施例的手写文档处理装置 110 包括输入 / 输出单元 10 和处理单元 20。 0042 举例来说, 处理单元 20 包括诸如运算单元等等的半导体装置。举例来说, 处理单 元 20 包括计算机。举例来说, 输入 / 输出单元 10 包括半导体装置的终端等等。输入 / 输 出单元 10 可以包括计算机的终端 ( 包括界面 )。 0043 输入 / 输出单元 10 获取数据。任何有线的或无线的方法都被用于通过输入 / 输 出单元 10 的数据的获取。举例来说, 被获取的数据包括手写文档的多个笔划数据 80 的组。 笔划数据 80 的实例描述如下。 0044 处理单元20基于由输入/输出单元1。
27、0获取的多个笔划数据80的组进行处理。 处 理单元 20 将处理的结果 ( 数据 ) 提供至输入 / 输出单元 10。 0045 显示单元 70 可连接至手写文档处理装置 110。例如, 显示单元 70 连接到输入 / 输 出单元 10。举例来说, 显示单元 70 包括液晶显示装置、 有机 EL 显示装置、 投影型显示装置 等等。显示单元 70 可以包括打印机。在本实施例中,“显示” 也包括打印。在本实施例中, 显示单元 70 是任意的。显示单元 70 包括显示区域 71。在打印机被用作显示单元 70 的情 况中, 显示区域 71 对应于可打印的区域。举例来说, 显示区域 71 具有边 71s。
28、。 0046 笔划数据 80 是可由显示单元 70 显示的。处理单元 20 的处理的结果 ( 数据 ) 是 说 明 书 CN 104346320 A 7 4/20 页 8 可由显示单元 70 显示的。在下文中, 描述其中由显示单元 70 显示笔划数据 80 和处理的结 果 ( 数据 ) 的状态的实例。 0047 图 2 是显示根据第一实施例的手写文档处理装置的笔划数据的示意的视图。 0048 如在图2中显示的, 举例来说, 多个笔划数据80的组包括具有表格形式的信息。 举 例来说, 用户通过在用于输入的平板上手写来输入表格。例如, 笔、 手指等等被用于输入。 0049 举例来说, 多个笔划数据。
29、 80 的组包括格线输入数据 85。在本实例中, 格线输入数 据 85 包括水平格线输入数据 85a 和竖直格线输入数据 85b。多个笔划数据 80 的组进一步 地包括非格线输入数据 86。在本实例中, 设置了多个非格线输入数据 86 的组。格线输入数 据 85 具有线结构。格线输入数据 85 对应于至少一部分表格的格线。非格线输入数据 86 对应于表格的单元格内部的数据。 0050 例如, 非格线输入数据 86 包括从字符信息和形状信息中选择的至少一个。在该实 例中, 设置了 “AAA1” ,“BBB1” ,“CCC1” ,“aaa11” ,“bbb11” , 和 “DDD1” 的字符信息。。
30、更进一 步, 设置了 “” 和 “” 的形状信息。 0051 举例来说, 多个笔划数据 80 的组包括第一部分 81u、 第二部分 82u 和第三部分 83u。 0052 第一部分 81u 对应于至少一部分格线输入数据 85( 在该实例中, 水平格线输入数 据 85a)。第一部分 81u 包括第一笔划数据 81。第一笔划数据 81 具有线结构。 0053 第二部分82u对应于至少一部分非格线输入数据86。 第二部分82u包括第二笔划 数据 82。举例来说, 第二笔划数据 82 包括至少一部分字符信息和至少一部分形状信息。 0054 第三部分83u对应于至少一部分非格线输入数据86。 第三部分8。
31、3u包括第三笔划 数据 83。举例来说, 第三笔划数据 83 包括至少一部分字符信息和至少一部分形状信息。 0055 这样的手写文档的多个笔划数据 80 的组被提供至输入 / 输出单元 10。 0056 举例来说, 多个笔划数据 80 的组包括多个时间序列数据组。例如, 多个时间序列 数据组分别地对应于多个手写的笔划。每个笔划都包括多个坐标。 0057 举例来说, 一个笔划数据组包括 (x(1,1),y(1,1),(x(1,2),y(1,2),., 和 (x(1,N(1),y(1,N(1) 的数据。另一个笔划数据组包括 (x(2,1),y(2,1),(x(2,2),y(2 ,2),., 和 (。
32、x(2,N(2),y(2,N(2) 的数据。在这里, N(i) 是对于第 i 个笔划采样的点 的数目。笔划数据对应于手写输入的手写数据。笔划数据的数据结构的实例描述如下。 0058 处理单元 20 基于由输入 / 输出单元 10 获取的多个笔划数据 80 的组实施处理操 作。作为一个例子描述第一处理操作。 0059 图 3 是显示根据第一实施例的手写文档处理装置的处理结果的示意的视图。 0060 图 3 显示由处理单元 20 的处理导出的表格数据 ( 第一表格数据 40a)。 0061 如在图 3 中显示的, 例如, 第一表格数据 40a 包括格线输出数据 45。在该实例中, 举例来说, 格线。
33、输出数据 45 包括水平格线输出数据 45a 和竖直格线输出数据 45b。第一表 格数据 40a 进一步地包括非格线输出数据 46。在该实例中, 设置了多个非格线输出数据 46 的组。格线输出数据 45 具有线结构。格线输出数据 45 对应于至少一部分第一表格数据 40a 的格线。非格线输出数据 46 对应于第一表格数据 40a 的单元格内部的数据。至少一 部分格线输出数据 45 对应于至少一部分格线输入数据 85。至少一部分非格线输出数据 46 对应于至少一部分非格线输入数据 86。 说 明 书 CN 104346320 A 8 5/20 页 9 0062 例如, 非格线输出数据 46 包括。
34、第一单元格数据 41c 和第二单元格数据 42c。第一 单元格数据 41c 对应于多个笔划数据 80 的组的第二部分 82u。第二单元格数据 42c 对应于 多个笔划数据 80 的组的第三部分 83u。在该实例中, 第一单元格数据 41c 和第二单元格数 据 42c 被排列在表格的水平方向上。 0063 例如, 格线输出数据 45 包括第一格线 41r 和第二格线 42r。第一格线 41r 对应于 多个笔划数据 80 的组的第一部分 81u。第二格线 42r 被设置在第一单元格数据 41c 和第 二单元格数据 42c 之间。在该实例中, 第一格线 41r 对应于表格的水平格线中的一个。第 二格。
35、线 42r 对应于表格的竖直格线中的一个。例如, 第一格线 41r 大体上平行于第一部分 81u 的延伸方向。 0064 在本实施例中, 第一单元格数据 41c 和第二单元格数据 42c 可以被排列在表格的 竖直方向上。在这种情况下, 第二格线 42r 对应于表格的水平格线中的一个。 0065 这样, 在由处理单元 20 实施的第一处理操作中, 处理单元 20 基于由输入 / 输出单 元 10 获取的多个笔划数据 80 的组导出第一表格数据 40a 并且将第一表格数据 40a 提供至 输入 / 输出单元 10, 在此第一表格数据 40a 包括对应于第一部分 81u 的第一格线 41r、 对应 。
36、于第二部分 82u 的第一单元格数据 41c、 对应于第三部分 83u 的第二单元格数据 42c、 以及 第二格线 42r。第二格线 42r 被设置在第一单元格数据 41c 和第二单元格数据 42c 之间。 0066 通过手写输入的第一部分 81u 具有线结构但不必定是直线。相反地, 在本实例中, 对应于第一部分 81u 的第一格线 41r 具有直线结构。在本实例中, 第一单元格数据 41c 是 由手写输入的多个笔划数据 80 的组的第二部分 82u 的笔划数据。第二单元格数据 42c 是 由手写输入的多个笔划数据 80 的组的第三部分 83u 的笔划数据。在本实施例中, 单元格数 据 ( 非。
37、格线输出数据 46) 可以是被转换的笔划数据。 0067 图 4 是显示根据第一实施例的手写文档处理装置的另一个处理结果的示意的视 图。 0068 在如图 4 中显示的实例中, 非格线输出数据 46 是基于非格线输入数据 86 被导出 ( 产生 ) 的数据。举例来说, 非格线输出数据 46 是通过转换非格线输入数据 86 被获得的。 例如, 进行非格线输入数据 86 的图案识别 ; 并且基于图案识别数据获得非格线输出数据 46。举例来说, 非格线输出数据 46 包括字体的信息等等。 0069 例如, 第一单元格数据 41c 是基于第二部分 82u 的笔划数据被导出 ( 产生 ) 的数 据。第二。
38、单元格数据 42c 是基于第二部分 82u 的笔划数据被导出 ( 产生 ) 的数据。 0070 这样, 单元格数据 ( 非格线输出数据 46) 可以包括被转换的笔划数据。 0071 现在将描述在第一处理操作中包括的处理的实例。 0072 图 5 是显示根据第一实施例的手写文档处理装置的操作的流程图。 0073 如图5中显示的, 举例来说, 第一处理操作包括轴估算处理(步骤S110), 交点估算 处理 ( 步骤 S120), 以及分类处理 ( 步骤 S130)。 0074 图6A和图6B是显示根据第一实施例的手写文档处理装置的一部分操作的示意的 视图。 0075 这些附图显示轴估算处理。 007。
39、6 如图 6A 中显示的, 轴估算处理估算第一轴 51 和第二轴 52。第二轴 52 垂直于第一 轴 51。例如, 第二轴 52 与第一轴正交。第一轴 51 和第二轴 52 被设置在由手写输入的平面 说 明 书 CN 104346320 A 9 6/20 页 10 中。例如, 当笔划数据 80 是由显示单元 70 显示时, 第一轴 51 和第二轴 52 被设置在显示单 元 70 的显示区域 71 的平面中。 0077 例如, 第一轴 51 是表格的主轴 ; 而第二轴 52 是表格的副轴。第一轴 51 可以是表 格的副轴 ; 而第二轴 52 可以是表格的主轴。 0078 在表格中, 竖直格线和水。
40、平格线被画为正交。主轴沿着从竖直格线的方向和水平 格线的方向中选择的一个方向延伸。 副轴沿着从竖直格线的方向和水平格线的方向中选择 的另一个方向延伸。 0079 例如, 对应于格线的笔划数据 ( 即, 格线输入数据 85, 并且在本实例中, 水平格线 输入数据 85a) 具有垂直于第二轴 52 的分量。当垂直分量被投影到第二轴 52 上时, 该分量 集中在第二轴 52 上的指定的坐标处。换句话说, 投影分量的峰 52p 出现在第二轴 52 上。 0080 例如, 对应于格线的笔划数据 ( 即, 格线输入数据 85, 并且在本实例中, 竖直格线 输入数据 85b) 具有垂直于第一轴 51 的分量。
41、。当垂直分量被投影到第一轴 51 上时, 该分量 集中在第一轴 51 上的指定的坐标处。换句话说, 投影分量的峰 51p 出现在第一轴 51 上。 0081 另一方面, 当对应于格线的笔划数据的分量被投影到相对于竖直格线或水平格线 被倾斜的倾斜轴上时, 投影分量被投影到大范围坐标上。所以, 投影分量的峰是不清楚的。 例如, 出现平滑的山 (hill) 和谷。通过集中于这个方面, 能够使用笔划数据在轴上的投影 分量的峰作为确定标准来估算表格的轴的方向。 0082 例如, 在轴估算处理中, 作为主轴的候选的轴在 0 度至 180 度的范围中被旋转 ; 并 且投影分量被确定。例如, 作为主轴候选的轴。
42、以规定角度的间隔被旋转。作为副轴候选的 轴也和作为主轴候选的轴的旋转一起被旋转。 0083 如在图 6B 中显示的, 轴估算处理设置第一候选轴 51o 和第二候选轴 52o。第二候 选轴 52o 垂直于第一候选轴 51o。在本实例中, 第一候选轴 51o 和第二候选轴 52o 相对于表 格的轴被倾斜。 0084 对于多个笔划数据 80 的组在第一候选轴 51o 上的投影分量的累积投影分量 51h 未出现清楚的峰。类似地, 对于多个笔划数据 80 的组在第二候选轴 52o 上的投影分量的累 积投影分量 52h 未出现清楚的峰。这是因为第一候选轴 51o 的延伸方向和第二候选轴 52o 的延伸方向。
43、相对于格线输入数据 85( 水平格线输入数据 85a 和竖直格线输入数据 85b) 的 延伸方向被倾斜。换句话说, 格线输入数据 85 和非格线输入数据 86 的平均数据被投影到 第一候选轴 51o 上并且被投影到第二候选轴 52o 上。因此, 没有出现清楚的峰。 0085 相反地, 如在图 6A 中显示的, 当第一候选轴 51o 和第二候选轴 52o 与表格的轴对 齐时出现清楚的峰 51p 和清楚的峰 52p。 0086 这样, 在被投影到在规定方向上延伸的第一候选轴 51o 和第二候选轴 52o 上的笔 划数据 80 的累积分量的直方图 ( 累积投影分量 51h 和累积投影分量 52h) 。
44、中形成峰 51p 和 峰 52p。峰 51p 和峰 52p 对应于表格的格线输入数据 85。 0087 如在图 6A 中显示的, 非格线输入数据 86 的投影分量的累积投影分量 51h 和累积 投影分量 52h 小于峰 51p 和峰 52p 的值。 0088 因此, 第一候选轴51o和第二候选轴52o被设置为在规定方向上延伸 ; 并且在这时 候计算峰的高度。改变候选轴延伸方向的角度 ; 并且在该角度下确定峰的高度。在峰的高 度是较高的角度下的候选轴被用作第一轴 51 和第二轴 52。 说 明 书 CN 104346320 A 10 7/20 页 11 0089 例如, 包括在第一部分 81u 。
45、中的第一笔划数据 81 在规定方向上 ( 在本实例中, 水 平方向 ) 延伸。在这种情况下, 多个笔划数据 80 的组到在竖直方向上延伸的第二轴 52 上 的投影分量的累积投影分量 52h 的峰值 ( 峰 52p 的高度 ) 高于多个笔划数据 80 的组到相 对于第二轴52被倾斜的倾斜轴(例如, 第二候选轴52o)上的投影分量的累积投影分量52h 的峰值。 0090 例如, 其它的笔划数据 ( 例如, 竖直格线输入数据 85b) 在规定方向上 ( 在本实例 中, 竖直方向 ) 延伸。在这种情况下, 多个笔划数据 80 的组到在水平方向上延伸的第一轴 51 上的投影分量的累积投影分量 51h 的。
46、峰值 ( 峰 51p 的高度 ) 高于多个笔划数据 80 的组 到相对于第一轴 51 被倾斜的倾斜轴 ( 例如, 第一候选轴 51o) 上的投影分量的累积投影分 量 51h 的峰值。 0091 进一步地, 多个笔划数据 80 的组到第二轴 52 上的投影分量的累积投影分量 52h 的峰值 ( 峰 52p 的高度 ) 可以高于多个笔划数据 80 的组到相对于第二轴 52 被倾斜的第一 候选轴 51o( 倾斜轴 ) 上的投影分量的累积投影分量 51h 的峰值。 0092 类似地, 多个笔划数据 80 的组到第一轴 51 上的投影分量的累积投影分量 51h 的 峰值 ( 峰 51p 的高度 ) 可以。
47、高于多个笔划数据 80 的组到相对于第一轴 51 被倾斜的第二候 选轴 52o( 垂直于倾斜轴的轴 ) 上的投影分量的累积投影分量 52h 的峰值。 0093 例如, 熵从多个笔划数据 80 的组对于第一候选轴 51o 和第二候选轴 52o 的投影分 量的累积投影分量 ( 直方图 ) 被计算出来。熵是对随机性的衡量。偏差随着熵的值降低而 增加。对于直方图, 随着存在更多的投影分量的局部峰, 信息熵的值降低。在熵为最低处的 轴候选可以被选择作为第一轴 51 和第二轴 52 的组合。换句话说, 举例来说, 轴估算处理可 以包括估算第二轴 52 以最小化多个笔划数据 80 的组到第二轴 52 上的投。
48、影分量的累积投 影分量 52h 的熵。例如, 在具有互相不同的延伸方向的多个候选轴当中, 第二轴 52 被估算 以最小化累积投影分量 52h 的熵。 0094 举例来说, 轴估算处理可以包括估算第一轴 51 以最小化多个笔划数据 80 的组到 第一轴 51 上的投影分量的累积投影分量 51h 的熵。例如, 在具有互相不同的延伸方向的多 个候选轴当中, 第一轴 51 被估算以最小化累积投影分量 51h 的熵。 0095 例如, 可以选择对应于在其中不少于预定值的熵被获得的范围中的轴候选的角度 的中心处的角度的轴方向作为第一轴 51 和第二轴 52 的组合。 0096 换句话说, 第一轴51或第二。
49、轴52的直方图的偏差大于倾斜轴的直方图的偏差。 第 一轴 51 或第二轴 52 的类似主轴的性质高于倾斜轴的类似主轴的性质。 0097 图 7 是显示根据第一实施例的手写文档处理装置的一部分操作的示意的视图。 0098 图 7 显示交点估算处理。在图 7 中, 为了更便于查看附图, 显示笔划数据 80 的格 线输入数据 85, 而不显示笔划数据 80 的非格线输入数据 86。 0099 在如图 7 中显示的交点估算处理中, 例如, 估算第一轴 51 和格线输入数据 85 之间 的交点的位置以及第二轴 52 和格线输入数据 85 之间的交点的位置。例如, 估算第一轴 51 和竖直格线输入数据 85b 之间的交点 85bc 的位置以及第二轴 52 和水平格线输入数据 85a 之间的交点 85ac 的位置。 0100 对应于格线输入数据 85 的笔划数据的投影分量在指定的。