图像分文档方法技术领域
本发明是有关于一种扫描仪,且特别是有关于一种用于扫描仪的图
像分文档方法。
背景技术
在电子化的时代,文档管理的作业采用图像数据来储存是不可避免
的趋势,以减少纸本的库存量及纸本容易损毁的风险。将纸本的数据电子化
之后,可以保存文稿来往的记录、建立电子文档,以利于文稿归档及查询。
但是,为了将大量的文稿输进计算机并分类、归档命名,常常耗掉相当大的
人力与成本。传统的扫描仪扫描多个文稿,可以将每页扫描图像数据各自建
立一个文档,或是将所有图像数据合并成一个文档。无论是哪一种,对使用
者而言都并不方便。前者须检视文档后重新命名,后者须自行分割文档,其
手续既繁琐又没有效率。
为了解决这个问题,于是有自动归档的概念出现。例如,当有一叠
文稿准备扫描时,先在文稿中预定分档的地方安插空白页、特定颜色页或贴
上条形码(barcode)等。当扫描仪扫到空白页、特定颜色页或条形码,则
将已扫描的多个图像数据合并成一个独立的文档。然而,这样的归档方式仍
须要手动加入特殊的辨识特征,例如人工先整理文稿把空白页或barcode放
到或贴到特定位置,而这步骤需要消耗许多时间。
发明内容
本发明是有关于一种图像分文档方法,其通过辨识扫描图像数据,
自动判断数据的窗体格式(例如申请表、签呈、单据等制式格式),当找到
相同类型的窗体格式或符合系统设定的制式格式时,可将扫描图像数据分割
为多个群组后,储存为各自独立的文档,并可建立相对应的文档名。
根据本发明的一方面,提出一种图像分文档方法,包括下列步骤。
依序扫描多个文稿,以对应产生多个扫描图像数据。从这些扫描图像数据中
寻找窗体格式。当有M个窗体格式出现于这些扫描图像数据中,将这些扫描
图像数据分为M个群组,并将窗体格式设在每一群组的首页,其中M为大于
1的正整数。建立对应于这些群组的M个文档。
根据本发明的一方面,提出一种图像分文档方法,包括下列步骤。
从初始扫描图像数据中寻找窗体格式。当窗体格式出现于初始扫描图像数据
中,将包含窗体格式的初始扫描图像数据设为首页。建立对应于初始扫描图
像数据的初始文档。
为了对本发明的上述及其他方面有更佳的了解,下文特举较佳实施
例,并配合附图,作详细说明如下:
附图说明
图1绘示依照本发明第一实施例的图像分文档方法的流程图。
图2绘示建立文档名的流程图。
图3绘示依照本发明第二实施例的图像分文档方法的流程图。
图4绘示依照本发明第三实施例的图像分文档方法的流程图。
图5为分为不同群组的扫描图像数据及文档的示意图。
图6绘示依照本发明第四实施例的图像分文档方法的流程图。
图7绘示依照本发明第五实施例的图像分文档方法的流程图。
图8绘示依照本发明第六实施例的图像分文档方法的流程图。
具体实施方式
为方便理解,实施例提到的“文稿”指的是实体纸本文稿,“文档”指的是实
体文稿经扫描后形成的电子文档。根据本实施例的范例,提出一种图像分文档方
法,用于扫描图像数据的归档及管理。当一叠文稿被扫描后,在这些扫描图
像数据中找到相同类型的M个窗体格式或找到符合系统设定的M个窗体格式
时,系统自动判断此叠文稿中至少有M个相同类型的群组,因此,可将扫描
图像数据分割为M个群组后,各个群组储存为各自独立的文档,并且各个群
组可建立相对应的文档名,以加快扫描图像数据的分文档作业。
例如:扫描图像数据为医院的个人病历资料,第一页为个人基本资
料或第一次看诊资料,后续历史的看诊资料通常会附在个人基本数据之后,
做为附加的图像数据。一般而言,为了方便建立个人基本数据,第一次看诊
数据的首页为制式格式的窗体或申请表,以记载个人的基本数据及建文档编
号等。每一个人都会有属于个人的首页窗体,因此当系统扫描并判断一叠看
诊数据时,只要出现第一次看诊数据,表示系统已经扫描完前一个人的看诊
数据,现在正在对下一个人的看诊数据进行扫描,此时,系统自动依照首页
窗体分割为不同的群组,并将第一次看诊数据设为首页后建立个人文档,以
区分不同病人的看诊数据。
另外,扫描图像数据可为政府机关的公文或签呈,每个部门都会有
专属的首页窗体,因此当收件单位收到各个部门寄来的文稿时,经过扫描后
可判断其首页窗体的格式,自动依照发送部门分割为不同的群组,并建立相
对应群组的文档,以加快扫描图像数据的分文档作业。
再者,扫描图像数据可为银行的请款单据或放款单据,每个银行都
会有专属的首页窗体,因此当会计单位收到各个银行寄来的单据时,经过扫
描后可判断其首页窗体的格式,自动依照发送银行分割为不同的群组,并建
立相对应群组的文档,以加快扫描图像数据的分文档作业。
因此,不论是统一格式的首页窗体或是专属格式的首页窗体,均可
通过上述的图像分文档方法,将扫描图像数据分割为不同的群组,再建立相
对应群组的文档。
以下是提出实施例进行详细说明,实施例仅用以作为范例说明,并
非用以限缩本发明想要保护的范围。
第一实施例
请参照图1,其绘示依照本发明第一实施例的图像分文档方法的流
程图。图像分文档方法包括下列步骤S11~S14。在步骤S11中,将一叠文稿
放入扫描仪中扫描,以产生多个扫描图像数据。扫描图像数据的文档格式可
为pdf或rtf等具有文字形式格式的电子文档。在步骤S12中,从这些扫描
图像数据中寻找窗体格式。窗体格式可为申请表、签呈或单据等制式格式。
在步骤S13中,当有M个窗体格式出现于这些扫描图像数据中,将这些扫描
图像数据分为M个群组,并将窗体格式设在每一群组的首页。
例如:扫描图像数据为医院的个人病历资料,第一页为个人基本资
料或第一次看诊数据,此时,首页的窗体格式可做为文档设定时的参考,以
依照首页窗体分为不同群组。
在步骤S14中,建立对应于这些群组的M个文档。因此,这些扫描
图像数据可以依照首页窗体进行分文档,并为这些文档命名,以建立各别的
文档名。
请参照图2,其绘示建立文档名的流程图。在实施例中,文档的命
名方法包括下列步骤S21~S23。在步骤S21中,从每一群组的首页中寻找关
键词字符串,以及辨认排序于关键词字符串之后的编码字符串。例如:在图
5中,扫描图像数据被分为三个群组G1~G3,每一群组的首页具有相同的窗
体格式。
在第1群组G1的首页窗体中有一段文字为编号:001,若[编号:]
为关键词字符串,则001为他的编码字符串。在步骤S22中,建立对应于这
些群组的M个文档。在步骤S23中,若寻找到关键词字符串,自动按编码字
符串订定这些文档的文档名。文档名不限于完全依照编码字符串,也可以以
该编码字符串为基础而有其他变化。例如:编码字符串为001,文档名可以
为001-1、PR-001、数据001等等。
第2群组G2的文档名可以为002.pdf或其他变化,例如002-1、
PR-002、数据002等等。第3群组G3的文档名可以为003.pdf或其他变化,
例如003-1、PR-003、数据003等等。
第二实施例
此外,本发明又提出第二实施例。请参照图3,其绘示依照本发明
第二实施例的图像分文档方法的流程图,包括步骤S31~S34。其中,步骤
S33~S34与第一实施例的步骤S23~S24相同。在步骤S31~S32中,本发明
更包括扫描比对文稿,以产生比对图像数据,并依据此比对图像数据,从这
些扫描图像数据中寻找窗体格式。在步骤S32中,若寻找到符合的窗体格式,
则进行步骤S33的分组作业以及步骤S34的建文档作业。
比对图像数据可以为具有空白窗体格式的图像数据。若只有一种窗
体格式可供比对,则系统只会寻找与此种窗体格式相同的图像数据,然而,
若有两种或两种以上的窗体格式可供比对,则系统会寻找符合上述各种窗体
格式的图像数据。例如,在图5中,若第1群组G1具有第一种窗体格式,
第2群组G2具有第二种窗体格式,而第3群组G3具有第三种窗体格式,则
系统会从扫描图像数据中寻找这三种窗体格式,再按照这三种窗体格式至少
分为三个群组G1~G3,以进行扫描图像数据的分文档作业。
有关第一实施例中的文档命名方法也可应用在第二实施例中,相关
的内容请一并参照图2的说明,在此不再赘述。
第三实施例
此外,本发明又提出第三实施例。请参照图4,其绘示依照本发明
第三实施例的图像分文档方法的流程图,包括步骤S41~S44。其中,步骤
S43~S44与第一实施例的步骤S23~S24相同。在步骤S41~S42中,本发明
更包括接收窗体格式设定指示,并依据窗体格式设定指示,寻找这些扫描图
像数据中的窗体格式。
窗体格式设定例如显示在用户操作接口上,以供用户在该用户操作
接口上设定寻找窗体格式的指示。用户操作接口可以是扫描仪或事务机上的
显示屏幕与输入设备,或是一台连接到扫描仪的计算机,用户利用计算机上
的软件操作、指示扫描仪。在步骤S42中,依据窗体格式设定指示,寻找这
些扫描图像数据中的窗体格式。在步骤S42中,若寻找到符合的窗体格式,
则进行步骤S43的分组作业以及步骤S44的建文档作业。
窗体格式设定可以设定预先储存在计算机中的一种窗体格式或多
种窗体格式。若只有一种窗体格式可供设定,则系统只会寻找与此种窗体格
式相同的图像数据,然而,若有两种或两种以上的窗体格式可供设定,则系
统会寻找符合上述各种窗体格式的图像数据。例如,在图5中,若第1群组
G1具有第一种窗体格式,第2群组G2具有第二种窗体格式,而第3群组G3
具有第三种窗体格式,则系统会从扫描图像数据中寻找这三种窗体格式,再
依照这三种窗体格式至少分为三个群组G1~G3,以加快扫描图像数据的分文
档作业。
有关第一实施例中的文档命名方法也可应用在第三实施例中,相关
的内容请一并参照图2的说明,在此不再赘述。
第四实施例
此外,本发明又提出第四实施例。请参照图6,其绘示依照本发明
第四实施例的图像分文档方法的流程图,包括下列步骤S51~S54。在步骤
S51中,从初始扫描图像数据中寻找窗体格式。在步骤S52中,当窗体格式
出现于初始扫描图像数据中,将包含窗体格式的初始扫描图像数据设为首
页。在步骤S53中,建立对应于初始扫描图像数据的初始文档。在步骤S54
中,从初始扫描图像数据中寻找关键词字符串,以及辨认排序于关键词字符
串之后的第一编码字符串,若寻找到关键词字符串,自动按第一编码字符串
订定初始文档的文档名。
例如:初始扫描图像数据为医院的个人病历资料、各部门的公文或
签呈,或各家银行的单据等,此时,首页的窗体格式可做为文档设定时的参
考,并可按照首页的关键词字符串来建立初始文档。在实施例中,窗体格式
可为申请表、签呈或单据等制式格式。
第五实施例
另外,本发明又提出第五实施例。请参照图7,其绘示依照本发明
第五实施例的图像分文档方法的流程图,包括下列步骤S61~S70。其中,步
骤S61~S64与第四实施例的步骤S51~S54相同。在步骤S65中,本发明更
包括从第二扫描图像数据中寻找关键词字符串,以及辨认排序于关键词字符
串之后的第二编码字符串。第二扫描图像数据可为接续在初始扫描图像数据
后的另一份扫描图像数据。在步骤S66中,若在第二扫描图像数据中寻找到
关键词字符串,且第二编码字符串经步骤S68的辨认与步骤S64中初始扫描
图像数据的编码字符串不相同,则进行步骤S69,建立对应于第二扫描图像
数据的第二文档,并且自动按第二编码字符串订定第二文档的文档名。第二
文档的文档名可依照初始文档的命名方法,以形成一系列的文档。举例来说,
初始扫描图像数据与第二扫描图像数据的编码字符串分别为001、002,若初
始文档名订为001-1,则第二文档名订为002-1;若初始文档名订为资料001,
则第二文档名订为资料002。依照此方法,一叠具有关键词的多个文档经扫
描后可依序自动地建立文档并命名。
在步骤S66中,若在第二扫描图像数据中寻找到关键词字符串,且
第二编码字符串经步骤S68的辨认与步骤S64中初始扫描图像数据的编码字
符串相同,则进行步骤S70,附加第二扫描图像数据至初始文档,而不是产
生独立的第二文档。例如,初始文档原为包含初始扫描图像数据的PDF格式
文档,共一页;当第二扫描图像数据被附加至该初始文档后,初始扫描图像
数据与第二扫描图像数据分别为该PDF的第一页与第二页。若在第二扫描图
像数据后的第三扫描图像数据,也同样具有与初始扫描图像数据相同的关键
词与编码字符串,则继续附加至初始文档,形成第三页,直到下一份首页窗
体出现而进行文档分割,以建立新的文档为止。
在步骤S66中,若在第二扫描图像数据中未寻找到关键词字符串,
则进行步骤S67,附加第二扫描图像数据至初始文档,而合并成同一文档。
并且,该未包含关键词字符串的第二扫描图像数据,为接续初始扫描图像数
据所产生的扫描图像数据。也就是说,初始扫描图像数据与第二扫描图像数
据,是在一次扫描多个文档的扫描过程中,分别为第一份文稿与接续的第二
份文稿所产生的扫描图像数据。该扫描过程通常是在馈纸式扫描仪中执行。
初始扫描图像数据具有关键词字符串而第二扫描图像数据没有,此情形例如
发生在扫描主文稿与其未含关键词的附件。
第六实施例
此外,本发明又提出第六实施例。请参照图8,其绘示根据本发明
第六实施例的图像分文档方法的流程图,包括下列步骤S71~S75。其中,步
骤S73~S75与第四实施例的步骤S52~S54相同。在步骤S71~S72中,本
发明更包括接收窗体格式设定指示,并依据窗体格式设定指示,寻找初始扫
描图像数据中的窗体格式。在步骤S73中,若寻找到符合的窗体格式,则进
行步骤S74的建档步骤以及步骤S74的命名作业。
有关窗体格式设定请参照说明书第[0025]及[0026]段的说明,在此
不再赘述。
本发明上述实施例所揭露的图像分文档方法,是用于图像数据的归
档及管理,可自动地将扫描图像数据依照窗体格式建立文档,不需在文稿中
安插空白页、特定颜色页或贴上条形码,以节省人力。且从文档名中可直接
辨别该文档中所存放的图像数据是什么,以利于后续文档的管理。
综上所述,虽然本发明已以较佳实施例揭露如上,然而其并非用以
限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精
神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视附后
的权利要求所界定的范围为准。