数据定位识别和存储方法及系统.pdf

上传人:柴****2 文档编号:4904218 上传时间:2018-11-26 格式:PDF 页数:11 大小:462.52KB
返回 下载 相关 举报
摘要
申请专利号:

CN201310266337.2

申请日:

2013.06.28

公开号:

CN103399854A

公开日:

2013.11.20

当前法律状态:

授权

有效性:

有权

法律详情:

登录超时

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

中国中医科学院中医临床基础医学研究所

发明人:

文天才; 刘保延; 何丽云; 李洪皎

地址:

100700 北京市东城区东直门内小街16号

优先权:

专利代理机构:

北京三聚阳光知识产权代理有限公司 11250

代理人:

彭秀丽;寇海侠

PDF下载: PDF下载
内容摘要

本发明的数据定位识别和存储方法及系统:获取受试者的病例图像;根据预先定义的病例模板定位出每一个识别项,并根据该识别项对应的数据类型调用对应的识别引擎进行识别,并将识别结果进行数据类型的判断,最终将判断后的识别结果存入数据库对应的数据表里,方便后续有针对性的核对和校验,减少核对的工作量,省事省力,大大降低了使用成本;具体识别时,对识别项的通用名称,例如“性别”、“出生日期”等这种固定的字符不进行识别,只识别其后面的字符存入相应的数据表中,从而进行快速识别,节省了识别的时间。

权利要求书

权利要求书
1.  一种数据定位识别和存储方法,其特征在于,包括以下步骤:
S1:获取受试者的病例图像并输出;
S2:接收所述病例图像并根据预先定义的病例模板定位出每一个识别项,根据该识别项对应的数据类型调用对应的识别引擎进行识别并将识别结果输出;
S3:接收所述识别结果并判断识别结果是否为预设数据类型,如果为预设的数据类型,则将识别结果输出;否则,对该识别结果进行数据类型错误标记后输出;
S4;接收所述识别结果并存入数据库对应的数据表里,其中,所述数据表被根据所述病例模板预先定义,所述数据表的每一个存储项与所述病例模板中的每一个识别项一一对应;
S5:结束本次识别任务。

2.  根据权利要求1所述的数据定位识别和存储方法,其特征在于,所述步骤S2之后和所述步骤S4之前包括以下步骤:
S303:根据预先存储的每个病例上不同识别项之间存在的逻辑关系,对新识别出的识别结果根据已经识别出的识别项的内容进行逻辑判断; 
S304:判断是否符合预设的逻辑关系,若是,则将所述识别结果输出; 否则,对该识别结果进行逻辑关系错误标记后输出。

3.  根据权利要求1或2所述的数据定位识别和存储方法,其特征在于,所述步骤S1之后步骤S2之前还包括以下步骤:
S101:判断所述病例图像是否为多页,若是,则将所述病例图像拆分成单页病例图像;并将拆分后的单页图像输出然后转入步骤S2;否则,直接输出所述病例图像并转入步骤S2。

4.  根据权利要求1-3任一所述的数据定位识别和存储方法,其特征在于,所述步骤S1之后步骤S2之前还包括以下步骤:
S102:判断所述病例图像是否发生倾斜,若是,则校正为正常图像,并将校正后的正常图像输出并转入步骤S2;否则,直接转入步骤S2。

5.  一种数据定位识别和存储系统,其特征在于,包括:
获取模块,用于获取受试者的病例图像并输出给识别模块;
识别模块,用于根据预先定义的病例模板定位出每一个识别项,根据该识别项对应的数据类型调用对应的识别引擎进行识别并将识别结果输出;
数据类型核对模块,用于接收所述识别结果并判断识别结果是否为预设数据类型,如果为预设的数据类型,则将识别结果输出给存储模块;否则,对该识别结果进行数据类型错误标记后输出给存储模块;
存储模块,用于接收数据类型核对模块输出的所述识别结果并存入数据库对应的数据表里,其中,所述数据表被根据所述病例模板预先定义,所述数据表的每一个存储项与所述病例模板中的每一个识别项一一对应;;
结束模块,用于结束本次识别任务。

6.  根据权利要求5所述的一种数据定位识别和存储系统,其特征在于,在所述识别模块和所述存储模块之间还包括:
逻辑判断模块,用于根据预先存储的每个病例上不同识别项之间存在的逻辑关系,对新识别出的识别结果根据已经识别出的识别项的内容进行逻辑判断;判断是否符合预设的逻辑关系,若是,则将识别结果输出给存储模块; 否则,对该识别结果进行逻辑关系错误标记后输出给存储模块。

7.  根据权利要求5或6所述的一种数据定位识别和存储系统,其特征在于,在所述获取模块和识别模块之间还包括:
多页判断模块,用于判断所述病例图像是否为多页病例图像,并且当是多页病例图像时,则将所述病例图像拆分成单页病例图像,并将拆分后的单页病例图像发送给所述识别模块。

8.  根据权利要求5或6所述的一种数据定位识别和存储系统,其特征在于,在所述获取模块和识别模块之间还包括:
倾斜判断模块,用于判断所述图像是否发生倾斜,并且当所述图像发生倾斜时校正为正常图像,并将校正后的所述病例图像发送给所述识别模块。

说明书

说明书数据定位识别和存储方法及系统
技术领域
本发明涉及计算机数据处理领域,具体涉及一种数据定位识别和存储方法及系统。
背景技术
CRF(Case Report Form,病例报告表)是临床研究或药品临床试验中的原始数据载体和法律文件,CRF通常是由预定的研究组根据研究需要拟定,然后打印成纸档发送给预定的医生填写,最后再将医生填写后的CRF收集;实际中的研究都需要对上述CRF中的内容进行统计分析,而分析对象必须是格式化、结构化的电子数据,因此必须将所述CRF纸档转化成可编辑的电子档。目前,在国内大多数CRO(Contract Research Organization,合同研究组织)和临床研究数据中心中,还是通过手工录入的方式将纸质CRF中的数据输入到计算机系统中。为了保障数据的准确性,通常需经过两次录入甚至三次录入,并对各次录入的数据进行相互校正以期纠正在人工录入过程中引入的数据错误。这样,纸质CRF中的数据输入到计算机系统中的工作都由人工完成,需要大量人力成本;同时,由于录入由人工完成,工作效率低,数据发生错误的可能性大。    
载自中国期刊《医学信息》2007年11月第20卷第11期的名称为《利用光学识别技术构建临床研究数据管理系统》文章,公开了一种利用光学识别技术构建临床研究数据管理系统,其中,临床研究中的CRF在课题设计时产生,经过临床研究人员内容设计后交由数据管理人员进行格式设计。印刷形成纸质CRF用于临床研究人员收集信息,填写后的纸质CRF转化为电子CRF图像进行识别,识别结果经确认无误后形成数据库,包括步骤如下:图像分页,多页将电子CRF图像拆分为多个单页图像文件;图像定位,对CRF图像进行倾斜较正;唯一号识别,识别每页CRF的唯一号;内容识别,根据预先定义的病例模板来定位识别定义每一个识别项并判断其数据类型,再调用相应类型的识别引擎来完成识别;最后对识别结果进行人工核对,将核对无误的每页CRF的识别结果存储在系统中。可见,上述文章公开的识别存储过程中需要人工对识别结果进行核对,费时费力,使用成本高。
发明内容
为此,本发明所要解决的是现有技术中的临床数据识别系统人工核对识别结果使用成本高的技术问题,提供一种能够进行逻辑判断的数据定位识别和存储方法及系统。
为解决上述技术问题,本发明采用的技术方案如下:
一种数据定位识别和存储方法,包括以下步骤:
S1:获取受试者的病例图像并输出;
S2:接收所述病例图像并根据预先定义的病例模板定位出每一个识别项,根据该识别项对应的数据类型调用对应的识别引擎进行识别并将识别结果输出;
S3:接收所述识别结果并判断识别结果是否为预设数据类型,如果为预设的数据类型,则将识别结果输出;否则,对该识别结果进行数据类型错误标记后输出;
S4;接收所述识别结果并存入数据库对应的数据表里,其中,所述数据表被根据所述病例模板预先定义,所述数据表的每一个存储项与所述病例模板中的每一个识别项一一对应;
S5:结束本次识别任务。
所述步骤S2之后和所述步骤S4之前包括以下步骤:
S303:根据预先存储的每个病例上不同识别项之间存在的逻辑关系,对新识别出的识别结果根据已经识别出的识别项的内容进行逻辑判断; 
S304:判断是否符合预设的逻辑关系,若是,则执行步骤S4; 否则,对该识别结果进行逻辑关系错误标记后转入步骤S4。
所述步骤S1之后步骤S2之前还包括以下步骤:
S101:判断所述病例图像是否为多页,若是,则将所述病例图像拆分成单页病例图像;并将拆分后的单页图像输出然后转入步骤S2;否则,直接输出所述病例图像并转入步骤S2。
所述步骤S1之后步骤S2之前还包括以下步骤:
S102:判断所述病例图像是否发生倾斜,若是,则校正为正常图像,并将校正后的正常图像输出并转入步骤S2;否则,直接转入步骤S2。
同时,提供一种数据定位识别和存储系统,包括:
获取模块,用于获取受试者的病例图像并输出给识别模块;
识别模块,用于根据预先定义的病例模板定位出每一个识别项,根据该识别项对应的数据类型调用对应的识别引擎进行识别并将识别结果输出;
数据类型核对模块,用于接收所述识别结果并判断识别结果是否为预设数据类型,如果为预设的数据类型,则将识别结果输出给存储模块;否则,对该识别结果进行数据类型错误标记后输出给存储模块;
存储模块,用于接收数据类型核对模块输出的所述识别结果并存入数据库对应的数据表里,其中,所述数据表被根据所述病例模板预先定义,所述数据表的每一个存储项与所述病例模板中的每一个识别项一一对应;;
结束模块,用于结束本次识别任务。
在所述识别模块和所述存储模块之间还包括:
逻辑判断模块,用于根据预先存储的每个病例上不同识别项之间存在的逻辑关系,对新识别出的识别结果根据已经识别出的识别项的内容进行逻辑判断;判断是否符合预设的逻辑关系,若是,则将识别结果输出给存储模块; 否则,对该识别结果进行逻辑关系错误标记后输出给存储模块。
在所述获取模块和识别模块之间还包括:
多页判断模块,用于判断所述病例图像是否为多页病例图像,并且当是多页病例图像时,则将所述病例图像拆分成单页病例图像,并将拆分后的单页病例图像发送给所述识别模块;
在所述获取模块和识别模块之间还包括:
倾斜判断模块,用于判断所述图像是否发生倾斜,并且当所述图像发生倾斜时校正为正常图像,并将校正后的所述病例图像发送给所述识别模块。
本发明的上述技术方案相比现有技术具有以下优点:
(1)本发明的数据定位识别和存储方法及系统:获取受试者的病例图像;根据预先定义的病例模板定位出每一个识别项,并根据该识别项对应的数据类型调用对应的识别引擎进行识别,并将识别结果进行数据类型的判断,最终将判断后的识别结果存入数据库对应的数据表里,方便后续有针对性的核对和校验,减少核对的工作量,省事省力,大大降低了使用成本;具体识别时,对识别项的通用名称,例如“性别”、“出生日期”等这种固定的字符不进行识别,只识别其后面的字符存入相应的数据表中,从而进行快速识别,节省了识别的时间。
(2)本发明的数据定位识别和存储方法及系统,对识别结果进行逻辑关系判断,当不符合逻辑关系时,对识别结果进行逻辑关系错误标记后输出识别结果;本方法对识别出来的项进行是否符合逻辑的判断,受试者在临床试验中很多信息是不公开的,仅根据最基本的性别年龄来给受试者分配药物,由于存在个别项信息录入错误的问题,有可能导致用药错误,一方面可能导致临床药物试验不准确,另一方面还可能对人体健康造成损害;更为重要的是,进一步方便后续有针对性的核对和校验,减少核对的工作量,省事省力,更进一步降低了使用成本。 
(3)本发明的数据定位识别和存储方法及系统,还包括判断所述图像是否为多页病例图像以及判断所述图像是否发生倾斜的步骤和模块,存在一页纸可能包含多页图像的情况,会影响识别结果,在识别之前将多页图像拆分成单页图像,提高识别准确率;由于各临床试验分中心可能分散在各个地方,甚至偏远地区,只是将病例传真到临床试验数据中心计算机中,或将纸质问题直接扫描成图像存储在计算机中,在传真和扫描时,极易发生图像倾斜的情况,也会影响识别的定性准确性,因此将倾斜的图像先进行校正,再识别,提高识别定位的准确性。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中:
图1为本发明一个实施例的数据定位识别和存储方法的流程图;
图2为本发明一个实施例的数据定位识别和存储系统的结构示意图。
具体实施方式
参见图1,本发明一个实施例的数据定位识别和存储方法的流程图,包括以下步骤:
S1:判断所述病例图像是否为多页,若是,则执行步骤S2;否则,执行步骤S3。
S2:将所述病例图像拆分成单页图像并输出。
S3:判断所述病例图像是否发生倾斜,若是,则执行步骤S4;否则,执行步骤S5。
S4:将所述病例图像校正为正常图像并输出。
S5:获取受试者的病例图像。
S6:根据预先定义的病例模板定位出每一个识别项,并根据该识别项对应的数据类型调用对应的识别引擎进行识别,并将识别结果输出。
S7:接收所述识别结果并判断所述识别结果是否为预设数据类型以及是否符合逻辑,若否,则执行步骤S8;否则,则结束本次判断,并将判断后的识别结果输出;数据类型的核对断和逻辑关系的判断先后顺序可任意,也可以同时进行,不影响实现本发明的目的。
S8:接收所述识别结果进行数据类型错误标记或者逻辑关系错误标记后输出存储到数据中的数据表里;其中,所述数据表被根据所述病例模板预先定义,所述数据表的每一个存储项与所述病例模板中的每一个识别项一一对应。
S9:结束本次识别任务。
对所述识别结果逻辑关系的判断举例如下:对于用药,事先输入逻辑关系,对于性别为女的,不能用男性药,对于性别为男的不能用女性药,具体步骤如下:
S601:判断所识别的项中性别项的值是否为男,若是,则执行步骤S602;否则,则执行步骤S603; 
S602:判断所识别的项中药物项所识别的药物名称是否为仅针对女性的药物列表中的项,若是,则对所述识别结果进行逻辑错误标记后输出;若否,则执行步骤S604,
S603:判断所述药物项所识别的药物名称是否为仅针对男性的药物列表中的项,若是,则对所述识别结果进行逻辑错误标记后输出;若否,则执行步骤S604
S604:将判断后的识别结果直接输出,并结束本次判断任务。
在其他不同的实施例中,根据试验内容,定制不同的逻辑关系,并根据不同的逻辑关系自动查找逻辑错误的识别结果并标注,方便后续核对。
本发明方法中,所有病例的格式是根据预先的病例模板预先设定好的,在识别引擎中预先设定病例中各项的位置,顺序识别各项的内容信息,并存入数据库对应的数据表里,而对于识别项的名称,例如“性别”、“出生日期”等这种固定的字符不进行识别,只识别其后面的字符存入相应的数据表中,从而进行快速识别,节省了识别的时间。
作为本发明其他实施例的数据定位识别和存储方法,可以只包含上述实施例中的步骤S5-S9,同样,能实现本发明的目的,属于本发明的保护范围。
作为本发明其他实施例的数据定位识别和存储方法,包括以下步骤:
S5:获取受试者的病例图像。
S6:根据预先定义的病例模板定位出每一个识别项,并根据该识别项对应的数据类型调用对应的识别引擎进行识别,并将识别结果输出。
S7:接收所述识别结果并判断所述识别结果是否为预设数据类型,若否,则执行步骤S8;否则,则结束本次判断,并将判断后的识别结果输出。 
S8:对所述识别结果进行数据类型错误标记输出存储到数据中的数据表里;其中,所述数据表被根据所述病例模板预先定义,所述数据表的每一个存储项与所述病例模板中的每一个识别项一一对应。
S9:结束本次识别任务。
基于同一发明构思,参见图2所示,本发明还提供一种数据定位识别和存储系统,包括:
获取模块,用于获取受试者的病例图像并输出给识别模块。
识别模块,用于根据预先定义的病例模板定位出每一个识别项,根据该识别项对应的数据类型调用对应的识别引擎进行识别并将识别结果输出。
数据类型核对模块,用于接收所述识别结果并判断识别结果是否为预设数据类型,如果为预设的数据类型,则将识别结果输出给存储模块;否则,对该识别结果进行数据类型错误标记后输出给存储模块。
存储模块,用于接收数据类型核对模块输出的所述识别结果并存入数据库对应的数据表里,其中,所述数据表被根据所述病例模板预先定义,所述数据表的每一个存储项与所述病例模板中的每一个识别项一一对应。
结束模块,用于结束本次识别任务。
作为本发明其他实施例的一种数据定位识别和存储系统,在上述实施例的一种数据定位识别和存储系统结构的基础上,本实施例在所述识别模块和所述存储模块之间还包括:
逻辑判断模块,用于根据预先存储的每个病例上不同识别项之间存在的逻辑关系,对新识别出的识别结果根据已经识别出的识别项的内容进行逻辑判断;判断是否符合预设的逻辑关系,若是,则将识别结果输出给存储模块; 否则,对该识别结果进行逻辑关系错误标记后输出给存储模块。
作为本发明其他实施例的一种数据定位识别和存储系统,在上述实施例的一种数据定位识别和存储系统结构的基础上,在所述获取模块和识别模块之间还包括:
多页判断模块,用于判断所述病例图像是否为多页病例图像,并且当是多页病例图像时,则将所述病例图像拆分成单页病例图像,并将拆分后的单页病例图像发送给所述识别模块;
作为本发明其他实施例的一种数据定位识别和存储系统,在上述实施例的一种数据定位识别和存储系统结构的基础上,在所述获取模块和识别模块之间还包括:
倾斜判断模块,用于判断所述图像是否发生倾斜,并且当所述图像发生倾斜时校正为正常图像,并将校正后的所述病例图像发送给所述识别模块。
在本实施例中,所述识别引擎中包括病例模板,所述病例是由病例模板打印出来而成的纸质病例,由于各临床试验分中心分散在不同的地区,他们将纸质病例传真到临床试验数据中心再扫描(也可以扫描成电子件通过网络发送到临床试验数据中心)形成病例图像,病例模板和病例图像的格式应为一一对应的;所述病例模板包括有四根定位线,识别的时候,计算机根据定位线对所述病例图像确定是否为多页,并根据定位线进行校正,每张病例具有唯一的标识号,在识别的时候识别引擎根据病例模板对应标识号的位置首先识别病例图像的标识号,再完成其他项的识别,这里病例模板主要起到定位的作用。
本实施例中,由于各临床试验分中心可能分散在各个地方,甚至偏远地区,只是将病例传真到临床试验数据中心,再扫描成图像存储在计算机中,在传真和扫描时,极易发生图像倾斜的情况,也会影响识别的定性准确性,因此将倾斜的图像先进行校正,再识别,提高识别定位的准确性。
本发明中,所有病例的格式是根据病例模板预先设定的,在识别引擎中预先设定病例中各项的位置,顺序识别各项的内容信息,并存入数据库对应的数据表里,而对于识别项的名称这种固定的字符不进行识别,只识别其后面的字符存入相应的数据表中,从而进行快速识别,节省了识别的时间,同时本发明还具有逻辑判断功能,边识别边进行逻辑判断,在逻辑不相符的时候进行报警,避免临床药物实验录入时候发生错误,提高临床药物实验的准备性。
本发明的数据定位识别和存储方法及系统:获取受试者的病例图像;根据预先定义的病例模板定位出每一个识别项,并根据该识别项对应的数据类型调用对应的识别引擎进行识别,并将识别结果进行数据类型的判断,最终将判断后的识别结果存入数据库对应的数据表里,方便后续有针对性的核对和校验,减少核对的工作量,省事省力,大大降低了使用成本;具体识别时,对识别项的通用名称,例如“性别”、“出生日期”等这种固定的字符不进行识别,只识别其后面的字符存入相应的数据表中,从而进行快速识别,节省了识别的时间。
本发明的数据定位识别和存储方法及系统,对识别结果进行逻辑关系判断,当不符合逻辑关系时,对识别结果进行逻辑关系错误标记后输出识别结果;本方法对识别出来的项进行是否符合逻辑的判断,受试者在临床试验中很多信息是不公开的,仅根据最基本的性别年龄来给受试者分配药物,由于存在个别项信息录入错误的问题,有可能导致用药错误,一方面可能导致临床药物试验不准确,另一方面还可能对人体健康造成损害;更为重要的是,进一步方便后续有针对性的核对和校验,减少核对的工作量,省事省力,更进一步降低了使用成本。 
本发明的数据定位识别和存储方法及系统,还包括判断所述图像是否为多页病例图像以及判断所述图像是否发生倾斜的步骤和模块,存在一页纸可能包含多页图像的情况,会影响识别结果,在识别之前将多页图像拆分成单页图像,提高识别准确率;由于各临床试验分中心可能分散在各个地方,甚至偏远地区,只是将病例传真到临床试验数据中心,再扫描成图像存储在计算机中,在传真和扫描时,极易发生图像倾斜的情况,也会影响识别的定性准确性,因此将倾斜的图像先进行校正,再识别,提高识别定位的准确性。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

数据定位识别和存储方法及系统.pdf_第1页
第1页 / 共11页
数据定位识别和存储方法及系统.pdf_第2页
第2页 / 共11页
数据定位识别和存储方法及系统.pdf_第3页
第3页 / 共11页
点击查看更多>>
资源描述

《数据定位识别和存储方法及系统.pdf》由会员分享,可在线阅读,更多相关《数据定位识别和存储方法及系统.pdf(11页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103399854 A (43)申请公布日 2013.11.20 CN 103399854 A *CN103399854A* (21)申请号 201310266337.2 (22)申请日 2013.06.28 G06F 17/30(2006.01) (71)申请人 中国中医科学院中医临床基础医学 研究所 地址 100700 北京市东城区东直门内小街 16 号 (72)发明人 文天才 刘保延 何丽云 李洪皎 (74)专利代理机构 北京三聚阳光知识产权代理 有限公司 11250 代理人 彭秀丽 寇海侠 (54) 发明名称 数据定位识别和存储方法及系统 (57) 摘要 本发。

2、明的数据定位识别和存储方法及系统 : 获取受试者的病例图像 ; 根据预先定义的病例模 板定位出每一个识别项, 并根据该识别项对应的 数据类型调用对应的识别引擎进行识别, 并将识 别结果进行数据类型的判断, 最终将判断后的识 别结果存入数据库对应的数据表里, 方便后续有 针对性的核对和校验, 减少核对的工作量, 省事省 力, 大大降低了使用成本 ; 具体识别时, 对识别项 的通用名称, 例如 “性别” 、“出生日期” 等这种固定 的字符不进行识别, 只识别其后面的字符存入相 应的数据表中, 从而进行快速识别, 节省了识别的 时间。 (51)Int.Cl. 权利要求书 2 页 说明书 6 页 附图。

3、 2 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书6页 附图2页 (10)申请公布号 CN 103399854 A CN 103399854 A *CN103399854A* 1/2 页 2 1. 一种数据定位识别和存储方法, 其特征在于, 包括以下步骤 : S1 : 获取受试者的病例图像并输出 ; S2 : 接收所述病例图像并根据预先定义的病例模板定位出每一个识别项, 根据该识别 项对应的数据类型调用对应的识别引擎进行识别并将识别结果输出 ; S3: 接收所述识别结果并判断识别结果是否为预设数据类型 , 如果为预设的数据类 型, 则将识别结果输出 ;。

4、 否则, 对该识别结果进行数据类型错误标记后输出 ; S4 ; 接收所述识别结果并存入数据库对应的数据表里, 其中, 所述数据表被根据所述 病例模板预先定义, 所述数据表的每一个存储项与所述病例模板中的每一个识别项一一对 应 ; S5 : 结束本次识别任务。 2. 根据权利要求 1 所述的数据定位识别和存储方法, 其特征在于, 所述步骤 S2 之后和 所述步骤 S4 之前包括以下步骤 : S303 : 根据预先存储的每个病例上不同识别项之间存在的逻辑关系, 对新识别出的识 别结果根据已经识别出的识别项的内容进行逻辑判断 ; S304 : 判断是否符合预设的逻辑关系, 若是, 则将所述识别结果输。

5、出 ; 否则, 对该识别 结果进行逻辑关系错误标记后输出。 3. 根据权利要求 1 或 2 所述的数据定位识别和存储方法, 其特征在于, 所述步骤 S1 之 后步骤 S2 之前还包括以下步骤 : S101 : 判断所述病例图像是否为多页, 若是, 则将所述病例图像拆分成单页病例图像 ; 并将拆分后的单页图像输出然后转入步骤 S2 ; 否则, 直接输出所述病例图像并转入步骤 S2。 4. 根据权利要求 1-3 任一所述的数据定位识别和存储方法, 其特征在于, 所述步骤 S1 之后步骤 S2 之前还包括以下步骤 : S102 : 判断所述病例图像是否发生倾斜, 若是, 则校正为正常图像, 并将校正。

6、后的正常 图像输出并转入步骤 S2; 否则, 直接转入步骤 S2。 5. 一种数据定位识别和存储系统, 其特征在于, 包括 : 获取模块, 用于获取受试者的病例图像并输出给识别模块 ; 识别模块, 用于根据预先定义的病例模板定位出每一个识别项, 根据该识别项对应的 数据类型调用对应的识别引擎进行识别并将识别结果输出 ; 数据类型核对模块, 用于接收所述识别结果并判断识别结果是否为预设数据类型 , 如 果为预设的数据类型, 则将识别结果输出给存储模块 ; 否则, 对该识别结果进行数据类型错 误标记后输出给存储模块 ; 存储模块, 用于接收数据类型核对模块输出的所述识别结果并存入数据库对应的数据 。

7、表里, 其中, 所述数据表被根据所述病例模板预先定义, 所述数据表的每一个存储项与所述 病例模板中的每一个识别项一一对应 ; 结束模块, 用于结束本次识别任务。 6. 根据权利要求 5 所述的一种数据定位识别和存储系统, 其特征在于, 在所述识别模 块和所述存储模块之间还包括 : 逻辑判断模块, 用于根据预先存储的每个病例上不同识别项之间存在的逻辑关系, 对 权 利 要 求 书 CN 103399854 A 2 2/2 页 3 新识别出的识别结果根据已经识别出的识别项的内容进行逻辑判断 ; 判断是否符合预设的 逻辑关系, 若是, 则将识别结果输出给存储模块 ; 否则, 对该识别结果进行逻辑关系。

8、错误 标记后输出给存储模块。 7.根据权利要求5或6所述的一种数据定位识别和存储系统, 其特征在于, 在所述获取 模块和识别模块之间还包括 : 多页判断模块, 用于判断所述病例图像是否为多页病例图像, 并且当是多页病例图像 时, 则将所述病例图像拆分成单页病例图像, 并将拆分后的单页病例图像发送给所述识别 模块。 8.根据权利要求5或6所述的一种数据定位识别和存储系统, 其特征在于, 在所述获取 模块和识别模块之间还包括 : 倾斜判断模块, 用于判断所述图像是否发生倾斜, 并且当所述图像发生倾斜时校正为 正常图像, 并将校正后的所述病例图像发送给所述识别模块。 权 利 要 求 书 CN 103。

9、399854 A 3 1/6 页 4 数据定位识别和存储方法及系统 技术领域 0001 本发明涉及计算机数据处理领域, 具体涉及一种数据定位识别和存储方法及系 统。 背景技术 0002 CRF(Case Report Form, 病例报告表) 是临床研究或药品临床试验中的原始数据 载体和法律文件, CRF 通常是由预定的研究组根据研究需要拟定, 然后打印成纸档发送给预 定的医生填写, 最后再将医生填写后的CRF收集 ; 实际中的研究都需要对上述CRF中的内容 进行统计分析, 而分析对象必须是格式化、 结构化的电子数据, 因此必须将所述 CRF 纸档转 化成可编辑的电子档。目前, 在国内大多数 。

10、CRO(Contract Research Organization, 合同 研究组织) 和临床研究数据中心中, 还是通过手工录入的方式将纸质 CRF 中的数据输入到 计算机系统中。 为了保障数据的准确性, 通常需经过两次录入甚至三次录入, 并对各次录入 的数据进行相互校正以期纠正在人工录入过程中引入的数据错误。这样, 纸质 CRF 中的数 据输入到计算机系统中的工作都由人工完成, 需要大量人力成本 ; 同时, 由于录入由人工完 成, 工作效率低, 数据发生错误的可能性大。 载自中国期刊 医学信息 2007 年 11 月第 20 卷第 11 期的名称为 利用光学识别技术 构建临床研究数据管理系。

11、统 文章, 公开了一种利用光学识别技术构建临床研究数据管理 系统, 其中, 临床研究中的 CRF 在课题设计时产生, 经过临床研究人员内容设计后交由数据 管理人员进行格式设计。 印刷形成纸质CRF用于临床研究人员收集信息, 填写后的纸质CRF 转化为电子 CRF 图像进行识别, 识别结果经确认无误后形成数据库, 包括步骤如下 : 图像分 页, 多页将电子 CRF 图像拆分为多个单页图像文件 ; 图像定位, 对 CRF 图像进行倾斜较正 ; 唯一号识别, 识别每页 CRF 的唯一号 ; 内容识别, 根据预先定义的病例模板来定位识别定义 每一个识别项并判断其数据类型 , 再调用相应类型的识别引擎来。

12、完成识别 ; 最后对识别结 果进行人工核对, 将核对无误的每页 CRF 的识别结果存储在系统中。可见, 上述文章公开的 识别存储过程中需要人工对识别结果进行核对, 费时费力, 使用成本高。 发明内容 0003 为此, 本发明所要解决的是现有技术中的临床数据识别系统人工核对识别结果使 用成本高的技术问题, 提供一种能够进行逻辑判断的数据定位识别和存储方法及系统。 0004 为解决上述技术问题, 本发明采用的技术方案如下 : 一种数据定位识别和存储方法, 包括以下步骤 : S1 : 获取受试者的病例图像并输出 ; S2 : 接收所述病例图像并根据预先定义的病例模板定位出每一个识别项, 根据该识别 。

13、项对应的数据类型调用对应的识别引擎进行识别并将识别结果输出 ; S3: 接收所述识别结果并判断识别结果是否为预设数据类型 , 如果为预设的数据类 型, 则将识别结果输出 ; 否则, 对该识别结果进行数据类型错误标记后输出 ; 说 明 书 CN 103399854 A 4 2/6 页 5 S4 ; 接收所述识别结果并存入数据库对应的数据表里, 其中, 所述数据表被根据所述 病例模板预先定义, 所述数据表的每一个存储项与所述病例模板中的每一个识别项一一对 应 ; S5 : 结束本次识别任务。 0005 所述步骤 S2 之后和所述步骤 S4 之前包括以下步骤 : S303 : 根据预先存储的每个病例。

14、上不同识别项之间存在的逻辑关系, 对新识别出的识 别结果根据已经识别出的识别项的内容进行逻辑判断 ; S304 : 判断是否符合预设的逻辑关系, 若是, 则执行步骤 S4 ; 否则, 对该识别结果进行 逻辑关系错误标记后转入步骤 S4。 0006 所述步骤 S1 之后步骤 S2 之前还包括以下步骤 : S101 : 判断所述病例图像是否为多页, 若是, 则将所述病例图像拆分成单页病例图像 ; 并将拆分后的单页图像输出然后转入步骤 S2 ; 否则, 直接输出所述病例图像并转入步骤 S2。 0007 所述步骤 S1 之后步骤 S2 之前还包括以下步骤 : S102 : 判断所述病例图像是否发生倾斜。

15、, 若是, 则校正为正常图像, 并将校正后的正常 图像输出并转入步骤 S2; 否则, 直接转入步骤 S2。 0008 同时, 提供一种数据定位识别和存储系统, 包括 : 获取模块, 用于获取受试者的病例图像并输出给识别模块 ; 识别模块, 用于根据预先定义的病例模板定位出每一个识别项, 根据该识别项对应的 数据类型调用对应的识别引擎进行识别并将识别结果输出 ; 数据类型核对模块, 用于接收所述识别结果并判断识别结果是否为预设数据类型 , 如 果为预设的数据类型, 则将识别结果输出给存储模块 ; 否则, 对该识别结果进行数据类型错 误标记后输出给存储模块 ; 存储模块, 用于接收数据类型核对模块。

16、输出的所述识别结果并存入数据库对应的数据 表里, 其中, 所述数据表被根据所述病例模板预先定义, 所述数据表的每一个存储项与所述 病例模板中的每一个识别项一一对应 ; 结束模块, 用于结束本次识别任务。 0009 在所述识别模块和所述存储模块之间还包括 : 逻辑判断模块, 用于根据预先存储的每个病例上不同识别项之间存在的逻辑关系, 对 新识别出的识别结果根据已经识别出的识别项的内容进行逻辑判断 ; 判断是否符合预设的 逻辑关系, 若是, 则将识别结果输出给存储模块 ; 否则, 对该识别结果进行逻辑关系错误 标记后输出给存储模块。 0010 在所述获取模块和识别模块之间还包括 : 多页判断模块,。

17、 用于判断所述病例图像是否为多页病例图像, 并且当是多页病例图像 时, 则将所述病例图像拆分成单页病例图像, 并将拆分后的单页病例图像发送给所述识别 模块 ; 在所述获取模块和识别模块之间还包括 : 倾斜判断模块, 用于判断所述图像是否发生倾斜, 并且当所述图像发生倾斜时校正为 正常图像, 并将校正后的所述病例图像发送给所述识别模块。 说 明 书 CN 103399854 A 5 3/6 页 6 0011 本发明的上述技术方案相比现有技术具有以下优点 : (1) 本发明的数据定位识别和存储方法及系统 : 获取受试者的病例图像 ; 根据预先定 义的病例模板定位出每一个识别项, 并根据该识别项对应。

18、的数据类型调用对应的识别引擎 进行识别, 并将识别结果进行数据类型的判断, 最终将判断后的识别结果存入数据库对应 的数据表里, 方便后续有针对性的核对和校验, 减少核对的工作量, 省事省力, 大大降低了 使用成本 ; 具体识别时, 对识别项的通用名称, 例如 “性别” 、“出生日期” 等这种固定的字符 不进行识别, 只识别其后面的字符存入相应的数据表中, 从而进行快速识别, 节省了识别的 时间。 0012 (2) 本发明的数据定位识别和存储方法及系统, 对识别结果进行逻辑关系判断, 当 不符合逻辑关系时, 对识别结果进行逻辑关系错误标记后输出识别结果 ; 本方法对识别出 来的项进行是否符合逻辑。

19、的判断, 受试者在临床试验中很多信息是不公开的, 仅根据最基 本的性别年龄来给受试者分配药物, 由于存在个别项信息录入错误的问题, 有可能导致用 药错误, 一方面可能导致临床药物试验不准确, 另一方面还可能对人体健康造成损害 ; 更为 重要的是, 进一步方便后续有针对性的核对和校验, 减少核对的工作量, 省事省力, 更进一 步降低了使用成本。 0013 (3) 本发明的数据定位识别和存储方法及系统, 还包括判断所述图像是否为多页 病例图像以及判断所述图像是否发生倾斜的步骤和模块, 存在一页纸可能包含多页图像的 情况, 会影响识别结果, 在识别之前将多页图像拆分成单页图像, 提高识别准确率 ; 。

20、由于各 临床试验分中心可能分散在各个地方, 甚至偏远地区, 只是将病例传真到临床试验数据中 心计算机中, 或将纸质问题直接扫描成图像存储在计算机中, 在传真和扫描时, 极易发生图 像倾斜的情况, 也会影响识别的定性准确性, 因此将倾斜的图像先进行校正, 再识别, 提高 识别定位的准确性。 附图说明 0014 为了使本发明的内容更容易被清楚的理解, 下面根据本发明的具体实施例并结合 附图, 对本发明作进一步详细的说明, 其中 : 图 1 为本发明一个实施例的数据定位识别和存储方法的流程图 ; 图 2 为本发明一个实施例的数据定位识别和存储系统的结构示意图。 具体实施方式 0015 参见图 1, 。

21、本发明一个实施例的数据定位识别和存储方法的流程图, 包括以下步 骤 : S1 : 判断所述病例图像是否为多页, 若是, 则执行步骤 S ; 否则, 执行步骤 S3。 0016 S2 : 将所述病例图像拆分成单页图像并输出。 0017 S3 : 判断所述病例图像是否发生倾斜, 若是, 则执行步骤 S4 ; 否则, 执行步骤 S5。 0018 S4 : 将所述病例图像校正为正常图像并输出。 0019 S5 : 获取受试者的病例图像。 0020 S6 : 根据预先定义的病例模板定位出每一个识别项, 并根据该识别项对应的数据 类型调用对应的识别引擎进行识别, 并将识别结果输出。 说 明 书 CN 10。

22、3399854 A 6 4/6 页 7 0021 S7 : 接收所述识别结果并判断所述识别结果是否为预设数据类型以及是否符合逻 辑, 若否, 则执行步骤 S ; 否则, 则结束本次判断, 并将判断后的识别结果输出 ; 数据类型 的核对断和逻辑关系的判断先后顺序可任意, 也可以同时进行, 不影响实现本发明的目的。 0022 S8 : 接收所述识别结果进行数据类型错误标记或者逻辑关系错误标记后输出存储 到数据中的数据表里 ; 其中, 所述数据表被根据所述病例模板预先定义, 所述数据表的每一 个存储项与所述病例模板中的每一个识别项一一对应。 0023 S9 : 结束本次识别任务。 0024 对所述识。

23、别结果逻辑关系的判断举例如下 : 对于用药, 事先输入逻辑关系, 对于性 别为女的, 不能用男性药, 对于性别为男的不能用女性药, 具体步骤如下 : S601 : 判断所识别的项中性别项的值是否为男, 若是, 则执行步骤 S602 ; 否则, 则执行 步骤 S603; S602 : 判断所识别的项中药物项所识别的药物名称是否为仅针对女性的药物列表中的 项, 若是, 则对所述识别结果进行逻辑错误标记后输出 ; 若否, 则执行步骤 S604, S603 : 判断所述药物项所识别的药物名称是否为仅针对男性的药物列表中的项, 若是, 则对所述识别结果进行逻辑错误标记后输出 ; 若否, 则执行步骤 S6。

24、04 S604 : 将判断后的识别结果直接输出, 并结束本次判断任务。 0025 在其他不同的实施例中, 根据试验内容, 定制不同的逻辑关系, 并根据不同的逻辑 关系自动查找逻辑错误的识别结果并标注, 方便后续核对。 0026 本发明方法中, 所有病例的格式是根据预先的病例模板预先设定好的, 在识别引 擎中预先设定病例中各项的位置, 顺序识别各项的内容信息, 并存入数据库对应的数据表 里, 而对于识别项的名称, 例如 “性别” 、“出生日期” 等这种固定的字符不进行识别, 只识别 其后面的字符存入相应的数据表中, 从而进行快速识别, 节省了识别的时间。 0027 作为本发明其他实施例的数据定位。

25、识别和存储方法, 可以只包含上述实施例中的 步骤 S5-S9, 同样, 能实现本发明的目的, 属于本发明的保护范围。 0028 作为本发明其他实施例的数据定位识别和存储方法, 包括以下步骤 : S5 : 获取受试者的病例图像。 0029 S6 : 根据预先定义的病例模板定位出每一个识别项, 并根据该识别项对应的数据 类型调用对应的识别引擎进行识别, 并将识别结果输出。 0030 S7 : 接收所述识别结果并判断所述识别结果是否为预设数据类型, 若否, 则执行步 骤 S ; 否则, 则结束本次判断, 并将判断后的识别结果输出。 0031 S8 : 对所述识别结果进行数据类型错误标记输出存储到数据。

26、中的数据表里 ; 其 中, 所述数据表被根据所述病例模板预先定义, 所述数据表的每一个存储项与所述病例模 板中的每一个识别项一一对应。 0032 S9 : 结束本次识别任务。 0033 基于同一发明构思, 参见图 2 所示, 本发明还提供一种数据定位识别和存储系统, 包括 : 获取模块, 用于获取受试者的病例图像并输出给识别模块。 0034 识别模块, 用于根据预先定义的病例模板定位出每一个识别项, 根据该识别项对 应的数据类型调用对应的识别引擎进行识别并将识别结果输出。 说 明 书 CN 103399854 A 7 5/6 页 8 0035 数据类型核对模块, 用于接收所述识别结果并判断识别。

27、结果是否为预设数据类 型 , 如果为预设的数据类型, 则将识别结果输出给存储模块 ; 否则, 对该识别结果进行数据 类型错误标记后输出给存储模块。 0036 存储模块, 用于接收数据类型核对模块输出的所述识别结果并存入数据库对应的 数据表里, 其中, 所述数据表被根据所述病例模板预先定义, 所述数据表的每一个存储项与 所述病例模板中的每一个识别项一一对应。 0037 结束模块, 用于结束本次识别任务。 0038 作为本发明其他实施例的一种数据定位识别和存储系统, 在上述实施例的一种数 据定位识别和存储系统结构的基础上, 本实施例在所述识别模块和所述存储模块之间还包 括 : 逻辑判断模块, 用于。

28、根据预先存储的每个病例上不同识别项之间存在的逻辑关系, 对 新识别出的识别结果根据已经识别出的识别项的内容进行逻辑判断 ; 判断是否符合预设的 逻辑关系, 若是, 则将识别结果输出给存储模块 ; 否则, 对该识别结果进行逻辑关系错误 标记后输出给存储模块。 0039 作为本发明其他实施例的一种数据定位识别和存储系统, 在上述实施例的一种数 据定位识别和存储系统结构的基础上, 在所述获取模块和识别模块之间还包括 : 多页判断模块, 用于判断所述病例图像是否为多页病例图像, 并且当是多页病例图像 时, 则将所述病例图像拆分成单页病例图像, 并将拆分后的单页病例图像发送给所述识别 模块 ; 作为本发。

29、明其他实施例的一种数据定位识别和存储系统, 在上述实施例的一种数据定 位识别和存储系统结构的基础上, 在所述获取模块和识别模块之间还包括 : 倾斜判断模块, 用于判断所述图像是否发生倾斜, 并且当所述图像发生倾斜时校正为 正常图像, 并将校正后的所述病例图像发送给所述识别模块。 0040 在本实施例中, 所述识别引擎中包括病例模板, 所述病例是由病例模板打印出来 而成的纸质病例, 由于各临床试验分中心分散在不同的地区, 他们将纸质病例传真到临床 试验数据中心再扫描 (也可以扫描成电子件通过网络发送到临床试验数据中心) 形成病例 图像, 病例模板和病例图像的格式应为一一对应的 ; 所述病例模板包。

30、括有四根定位线, 识别 的时候, 计算机根据定位线对所述病例图像确定是否为多页, 并根据定位线进行校正, 每张 病例具有唯一的标识号, 在识别的时候识别引擎根据病例模板对应标识号的位置首先识别 病例图像的标识号, 再完成其他项的识别, 这里病例模板主要起到定位的作用。 0041 本实施例中, 由于各临床试验分中心可能分散在各个地方, 甚至偏远地区, 只是将 病例传真到临床试验数据中心, 再扫描成图像存储在计算机中, 在传真和扫描时, 极易发生 图像倾斜的情况, 也会影响识别的定性准确性, 因此将倾斜的图像先进行校正, 再识别, 提 高识别定位的准确性。 0042 本发明中, 所有病例的格式是根。

31、据病例模板预先设定的, 在识别引擎中预先设定 病例中各项的位置, 顺序识别各项的内容信息, 并存入数据库对应的数据表里, 而对于识别 项的名称这种固定的字符不进行识别, 只识别其后面的字符存入相应的数据表中, 从而进 行快速识别, 节省了识别的时间, 同时本发明还具有逻辑判断功能, 边识别边进行逻辑判 断, 在逻辑不相符的时候进行报警, 避免临床药物实验录入时候发生错误, 提高临床药物实 说 明 书 CN 103399854 A 8 6/6 页 9 验的准备性。 0043 本发明的数据定位识别和存储方法及系统 : 获取受试者的病例图像 ; 根据预先定 义的病例模板定位出每一个识别项, 并根据该。

32、识别项对应的数据类型调用对应的识别引擎 进行识别, 并将识别结果进行数据类型的判断, 最终将判断后的识别结果存入数据库对应 的数据表里, 方便后续有针对性的核对和校验, 减少核对的工作量, 省事省力, 大大降低了 使用成本 ; 具体识别时, 对识别项的通用名称, 例如 “性别” 、“出生日期” 等这种固定的字符 不进行识别, 只识别其后面的字符存入相应的数据表中, 从而进行快速识别, 节省了识别的 时间。 0044 本发明的数据定位识别和存储方法及系统, 对识别结果进行逻辑关系判断, 当不 符合逻辑关系时, 对识别结果进行逻辑关系错误标记后输出识别结果 ; 本方法对识别出来 的项进行是否符合逻。

33、辑的判断, 受试者在临床试验中很多信息是不公开的, 仅根据最基本 的性别年龄来给受试者分配药物, 由于存在个别项信息录入错误的问题, 有可能导致用药 错误, 一方面可能导致临床药物试验不准确, 另一方面还可能对人体健康造成损害 ; 更为重 要的是, 进一步方便后续有针对性的核对和校验, 减少核对的工作量, 省事省力, 更进一步 降低了使用成本。 0045 本发明的数据定位识别和存储方法及系统, 还包括判断所述图像是否为多页病例 图像以及判断所述图像是否发生倾斜的步骤和模块, 存在一页纸可能包含多页图像的情 况, 会影响识别结果, 在识别之前将多页图像拆分成单页图像, 提高识别准确率 ; 由于各。

34、临 床试验分中心可能分散在各个地方, 甚至偏远地区, 只是将病例传真到临床试验数据中心, 再扫描成图像存储在计算机中, 在传真和扫描时, 极易发生图像倾斜的情况, 也会影响识别 的定性准确性, 因此将倾斜的图像先进行校正, 再识别, 提高识别定位的准确性。 0046 显然, 上述实施例仅仅是为清楚地说明所作的举例, 而并非对实施方式的限定。 对 于所属领域的普通技术人员来说, 在上述说明的基础上还可以做出其它不同形式的变化或 变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或 变动仍处于本发明创造的保护范围之中。 说 明 书 CN 103399854 A 9 1/2 页 10 图 1 说 明 书 附 图 CN 103399854 A 10 2/2 页 11 图 2 说 明 书 附 图 CN 103399854 A 11 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1