《文档图像处理装置及文档图像处理方法.pdf》由会员分享,可在线阅读,更多相关《文档图像处理装置及文档图像处理方法.pdf(71页珍藏版)》请在专利查询网上搜索。
抽取出文档图像中字符数为M的字符串,将其1个字符1个字符地分割,抽出各字符图像的图像特征,根据该图像特征,利用以1个字符为单位储存字符图像的图像特征的字形特征字典15,按照匹配度从高到低的顺序选择N个(N1的整数)字符图像作为候选字符,创建抽取出的字符串的字符数MN维的第1索引矩阵。从创建的第1索引矩阵作成字符组合,根据基于概念词典的意义解析,抽出主题词。抽出的主题词按照基于规定的权重信息、统计信。