一种病人姓名模糊语义查询的方法.pdf

上传人:111****112 文档编号:623400 上传时间:2018-02-26 格式:PDF 页数:8 大小:4.59MB
返回 下载 相关 举报
摘要
申请专利号:

CN201310148778.2

申请日:

2013.04.25

公开号:

CN104123295A

公开日:

2014.10.29

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20130425|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

上海联影医疗科技有限公司

发明人:

张绪广; 陈文娟

地址:

201815 上海市嘉定区嘉定工业区兴贤路1180号8幢

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

本发明提供一种病人姓名模糊语义查询的方法,包括:(1)为拼音字母设置对应的整型常量权值;(2)根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值和;(3)将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引;(4)将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若匹配,则查询结束;若不匹配,则根据所述步骤(2)和步骤(3)建立所述待匹配病人的姓索引和名索引,查询结束。本发明通过建立权值表和索引模型,不仅查询速度快、匹配性强,而且能有效地屏蔽了发音不准、口音、位置和大小写等因素。

权利要求书

1.  一种病人姓名模糊语义查询的方法,其特征在于,包括如下步骤:
(1)为拼音字母设置对应的整型常量权值;
(2)根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值和;
(3)将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引;
(4)将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若匹配,则查询结束;若不匹配,则根据所述步骤(2)和步骤(3)建立所述待匹配病人的姓索引和名索引,查询结束。

2.
  如权利要求1所述的病人姓名模糊语义查询的方法,其特征在于,所述拼音字母为声母、单韵母和复韵母。

3.
  如权利要求2所述的病人姓名模糊语义查询的方法,其特征在于,将所述拼音字母中易出错的拼音字母设置为相同的或差额小的整形常量权值。

4.
  如权利要求2所述的病人姓名模糊语义查询的方法,其特征在于,所述声母的整型常量权值大于所述复韵母的整型常量权值,所述复韵母的整型常量权值大于所述单韵母的整型常量权值。

5.
  如权利要求2所述的病人姓名模糊语义查询的方法,其特征在于,所述单韵母在常用汉字中出现的次数和所述单韵母的整型常量权值成反比。

6.
  如权利要求2所述的病人姓名模糊语义查询的方法,其特征在于,所述拼音字母的整型权值以质数序列按位分布。

7.
  如权利要求1所述的病人姓名模糊语义查询的方法,其特征在于,若所述病人姓名的字符集是中文,则将所述病人的姓名转换为标准拼音形式。

8.
  如权利要求1所述的病人姓名模糊语义查询的方法,其特征在于,所述向右移位操作可配置。

说明书

一种病人姓名模糊语义查询的方法
技术领域
本发明涉及一种病人姓名查询的方法,尤其涉及一种对DICOM影像服务器中病人姓名模糊语义查询的方法。
背景技术
对于DICOM影像生成前的病人姓名登录,常见的场景有:(1)病人在纸上写上或者说出自己中文姓名;(2)医院预约登记人员录入原始姓名的中文汉字或者拼音;(3)医院预约登记人员根据录入系统反馈结果,或者自行判断增加内容,比如BB(表示婴儿)。以上场景都存在一定的问题,场景(1)由于病人口音,录入人员理解偏差,可能录入错误;场景(2)由于影像设备的中文汉字支持功能弱,必须用拼音做病人姓名,中文汉字到拼音的转换过程可能会出现差错;场景(3)增加的内容会有差异。而在实际医用环境中,病人很多,要求DICOM影像服务器操作人员在较短时间内,一次查询找到相近的目标病人记录供选择确认。
DICOM3.0规范要求的常用查询检索匹配有:单值匹配、唯一标识符列表匹配、通用匹配、通配符匹配、范围匹配和序列匹配。当病人、检查、序列和图像等信息确定时,查询操作是非常容易的,而且数据库也能够用通用语句轻易实现。但是当上述信息部确定时,通常的匹配方法有两种,一种方法是通用匹配、通配符匹配和范围匹配组合查询,这种方式的缺点是计算运算量大,用户往往需要多次反复,才能得到需要的记录,用户体验差;二是单值匹配下的病人姓名模糊语义,这种方式的实现需要屏蔽大小写、位置、口音和字符编码,甚至语音。比如,DICOM3.0规范提供的例子就是:查询“Swain” 需要返回“Swayne”,查询“Smith^Mary”需要返回“Mary^Smith”或“Mary Smith”或“Smith,Mary”。
在查询、检索、设备工作清单、设备完成检查步骤等服务中,明确要求提供病人姓名模糊语义匹配方法。对于病人姓名模糊语义匹配,很多影像服务器系统是通过数据库结构化查询语言SQL的like模糊查询语句实现,即是在一个字符型字段列中检索所包含的对应关键字。但是,Like语句查询效率低,基本无法优化性能,而且查询结果匹配性也不好。
发明内容
本发明解决的问题是提供一种病人姓名模糊语义查询的方法,不仅查询速度快、匹配性强,而且能有效地屏蔽了发音不准、口音、位置和大小写等因素。
为了解决上述问题,本发明提供了一种病人姓名模糊语义查询的方法,包括:
(1)为拼音字母设置对应的整型常量权值;
(2)根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值和;
(3)将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引;
(4)将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若匹配,则查询结束;若不匹配,则根据所述步骤(2)和步骤(3)建立所述待匹配病人的姓索引和名索引,查询结束。
上述所述的病人姓名模糊语义查询方法,其中,所述拼音字母为声母、单韵母和复韵母。
上述所述的病人姓名模糊语义查询方法,其中,将所述拼音字母中易出错的拼音字母设置为相同的或差额小的整形常量权值。
上述所述的病人姓名模糊语义查询方法,其中,所述声母的整型常量权值大于所述复韵母的整型常量权值,所述复韵母的整型常量权值大于所述单韵母的整型常量权值。
上述所述的病人姓名模糊语义查询方法,其中,所述单韵母在常用汉字中出现的次数和所述单韵母的整型权值成反比。
上述所述的病人姓名模糊语义查询方法,其中,所述拼音字母的整型权值以质数序列按位分布。
上述所述的病人姓名模糊语义查询方法,其中,若所述病人姓名的字符集是中文,则将所述病人的姓名转换为标准拼音形式。
上述所述的病人姓名模糊语义查询方法,其中,上述所述的病人姓名模糊语义查询方法,其中,所述向右移位操作可配置。
与现有技术相比,本发明以病人中文姓名对应的拼音字母集合为输入值,建立索引模型,该索引模型不仅算法简洁、可实现性强、运算量小,还能有效地屏蔽发音不准、口音、位置和大小写等因素。而且查询速度快、匹配性强、用户体验好,可以适应不同的方言环境和操作场景。
附图说明
图1所示为本发明实施例病人姓名模糊语义查询方法的流程示意图;
图2所示为本发明实施例拼音字母的整型常量权值表。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。
其次,本发明利用示意图进行详细描述,在详述本发明实施例时,为便 于说明,所述示意图只是实例,其在此不应限制本发明保护的范围。
下面结合附图和实施例对本发明进行详细地说明。本发明病人姓名模糊语义查询方法如图1所示,首先,执行步骤S1,为拼音字母设置对应的整型常量权值。具体地,在本实施例中,如图2所示,所述拼音字母为声母、单韵母和复韵母。对于拼音字母中易出错的拼音字母设置为相同的或差额小的整型常量权值。比如对于声母L和N,ZH和Z,CH和C,SH和H以及H和F,由于方言等因素容易出错,则将它们的整型常量权值设置为相同。需要说明的是,也可以将它们设置为差额小的整型常量权值。比如,L和N的整型常量权值的差额的绝对值小于e,e为正整数(如e=1)。对于单韵母和复韵母也和声母一样,对于易出错的,设置相同的或差额小的整型常量权值。
此外,对于除了易出错拼音字母的拼音字母,由于声母出错几率应小于复韵母,复韵母出错几率应小于单韵母,因此,所述声母的整型常量权值大于复韵母的整型常量权值,所述复韵母的整型常量权值大于单韵母的整型常量权值。而且,单韵母出现几率越高,出错几率越高,因此,单韵母在常用汉字中出现的次数和其整型常量权值成反比,即出现次数越高的单韵母,其整形常量权值越小。为了减少权值相加后重合的几率,拼音字母的整型常量权值以质数序列按位分布。在本实施例中,所述质数序列为(3,5,7,B...),如图2所示,对于声母,出现几率较高的声母,其整型常量权值越小,如声母N、G、F和B,N出现的几率比较高,其整型常量权值在这四个声母中最小,而且,声母N、G、F和B按照质数序列分布。需要说明的是,对于长度为N的整型常量权值,只要其中一位按照质数序列分布即可。对于单韵母和复韵母,也和声母一样,按照质数序列进行分布。需要说明的是,整型常量权值表可以根据实际的情况进行配置。
接着,执行步骤S2,根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值和。其中,如果所述病人姓名的字符集是中文,则 将所述病人的姓名转换为标准拼音形式。其中,所述病人为数据库中记录的病人。具体地,根据步骤S1中各个拼音字母对应的整型常量权值,分别确定病人姓名的姓和名的拼音形式所对应的整型常量权值,并分别计算病人的姓和名的权值和。在本实施例中,所计算的是十六进制权值和。需要说明的是,根据实际的需要,也可以是二进制、八进制、十进制等。
接着,执行步骤S3,将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引。其中,向右位移操作是可配置的,若需要精确匹配,则向右位移的位数就比较少;若需要模糊匹配,则向右位移的位数就比较多。具体地,在本实施例中,将步骤S2得到的病人姓和名的权值和向右移位4位后,转换为字符串形式存储,即建立了所述病人相对应的姓索引和名索引。在本实施例中,字符串按照B树的形式存储。需要说明的是,也可以按照其他优化的形式存储。
接着,执行步骤S4,将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若匹配,则执行步骤S5,查询结束;若不匹配,则执行步骤S6,根据上述步骤S2和S3,为所述待匹配病人建立相对应的姓索引和名索引,建立索引后则执行步骤S5,查询结束。具体地,根据待匹配病人的姓、名和姓名三种方式分别姓索引或名索引匹配查询,若索引相同,则是类似病人,查询结束;若索引不相同,则为待匹配病人建立姓索引和名索引,从而存储在数据库中。
本发明虽然已以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以利用上述揭示的方法和技术内容对本发明技术方案做出可能的变动和修改,因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化及修饰,均属于本发明技术方案的保护范围。

一种病人姓名模糊语义查询的方法.pdf_第1页
第1页 / 共8页
一种病人姓名模糊语义查询的方法.pdf_第2页
第2页 / 共8页
一种病人姓名模糊语义查询的方法.pdf_第3页
第3页 / 共8页
点击查看更多>>
资源描述

《一种病人姓名模糊语义查询的方法.pdf》由会员分享,可在线阅读,更多相关《一种病人姓名模糊语义查询的方法.pdf(8页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104123295A43申请公布日20141029CN104123295A21申请号201310148778222申请日20130425G06F17/3020060171申请人上海联影医疗科技有限公司地址201815上海市嘉定区嘉定工业区兴贤路1180号8幢72发明人张绪广陈文娟54发明名称一种病人姓名模糊语义查询的方法57摘要本发明提供一种病人姓名模糊语义查询的方法,包括1为拼音字母设置对应的整型常量权值;2根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值和;3将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引;4将待匹配病人的姓名和所述病人。

2、的姓索引和名索引进行匹配查询,若匹配,则查询结束;若不匹配,则根据所述步骤2和步骤3建立所述待匹配病人的姓索引和名索引,查询结束。本发明通过建立权值表和索引模型,不仅查询速度快、匹配性强,而且能有效地屏蔽了发音不准、口音、位置和大小写等因素。51INTCL权利要求书1页说明书3页附图3页19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书3页附图3页10申请公布号CN104123295ACN104123295A1/1页21一种病人姓名模糊语义查询的方法,其特征在于,包括如下步骤1为拼音字母设置对应的整型常量权值;2根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权。

3、值和;3将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引;4将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若匹配,则查询结束;若不匹配,则根据所述步骤2和步骤3建立所述待匹配病人的姓索引和名索引,查询结束。2如权利要求1所述的病人姓名模糊语义查询的方法,其特征在于,所述拼音字母为声母、单韵母和复韵母。3如权利要求2所述的病人姓名模糊语义查询的方法,其特征在于,将所述拼音字母中易出错的拼音字母设置为相同的或差额小的整形常量权值。4如权利要求2所述的病人姓名模糊语义查询的方法,其特征在于,所述声母的整型常量权值大于所述复韵母的整型常量权值,所述复韵母的整型常量权值大于所。

4、述单韵母的整型常量权值。5如权利要求2所述的病人姓名模糊语义查询的方法,其特征在于,所述单韵母在常用汉字中出现的次数和所述单韵母的整型常量权值成反比。6如权利要求2所述的病人姓名模糊语义查询的方法,其特征在于,所述拼音字母的整型权值以质数序列按位分布。7如权利要求1所述的病人姓名模糊语义查询的方法,其特征在于,若所述病人姓名的字符集是中文,则将所述病人的姓名转换为标准拼音形式。8如权利要求1所述的病人姓名模糊语义查询的方法,其特征在于,所述向右移位操作可配置。权利要求书CN104123295A1/3页3一种病人姓名模糊语义查询的方法技术领域0001本发明涉及一种病人姓名查询的方法,尤其涉及一种。

5、对DICOM影像服务器中病人姓名模糊语义查询的方法。背景技术0002对于DICOM影像生成前的病人姓名登录,常见的场景有1病人在纸上写上或者说出自己中文姓名;2医院预约登记人员录入原始姓名的中文汉字或者拼音;3医院预约登记人员根据录入系统反馈结果,或者自行判断增加内容,比如BB表示婴儿。以上场景都存在一定的问题,场景1由于病人口音,录入人员理解偏差,可能录入错误;场景2由于影像设备的中文汉字支持功能弱,必须用拼音做病人姓名,中文汉字到拼音的转换过程可能会出现差错;场景3增加的内容会有差异。而在实际医用环境中,病人很多,要求DICOM影像服务器操作人员在较短时间内,一次查询找到相近的目标病人记录。

6、供选择确认。0003DICOM30规范要求的常用查询检索匹配有单值匹配、唯一标识符列表匹配、通用匹配、通配符匹配、范围匹配和序列匹配。当病人、检查、序列和图像等信息确定时,查询操作是非常容易的,而且数据库也能够用通用语句轻易实现。但是当上述信息部确定时,通常的匹配方法有两种,一种方法是通用匹配、通配符匹配和范围匹配组合查询,这种方式的缺点是计算运算量大,用户往往需要多次反复,才能得到需要的记录,用户体验差;二是单值匹配下的病人姓名模糊语义,这种方式的实现需要屏蔽大小写、位置、口音和字符编码,甚至语音。比如,DICOM30规范提供的例子就是查询“SWAIN”需要返回“SWAYNE”,查询“SMI。

7、THMARY”需要返回“MARYSMITH”或“MARYSMITH”或“SMITH,MARY”。0004在查询、检索、设备工作清单、设备完成检查步骤等服务中,明确要求提供病人姓名模糊语义匹配方法。对于病人姓名模糊语义匹配,很多影像服务器系统是通过数据库结构化查询语言SQL的LIKE模糊查询语句实现,即是在一个字符型字段列中检索所包含的对应关键字。但是,LIKE语句查询效率低,基本无法优化性能,而且查询结果匹配性也不好。发明内容0005本发明解决的问题是提供一种病人姓名模糊语义查询的方法,不仅查询速度快、匹配性强,而且能有效地屏蔽了发音不准、口音、位置和大小写等因素。0006为了解决上述问题,本。

8、发明提供了一种病人姓名模糊语义查询的方法,包括00071为拼音字母设置对应的整型常量权值;00082根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值和;00093将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引;00104将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若匹配,则查询结束;若不匹配,则根据所述步骤2和步骤3建立所述待匹配病人的姓索引和名索引,查询结束。说明书CN104123295A2/3页40011上述所述的病人姓名模糊语义查询方法,其中,所述拼音字母为声母、单韵母和复韵母。0012上述所述的病人姓名模糊语义查询方法,其中,将所述拼音。

9、字母中易出错的拼音字母设置为相同的或差额小的整形常量权值。0013上述所述的病人姓名模糊语义查询方法,其中,所述声母的整型常量权值大于所述复韵母的整型常量权值,所述复韵母的整型常量权值大于所述单韵母的整型常量权值。0014上述所述的病人姓名模糊语义查询方法,其中,所述单韵母在常用汉字中出现的次数和所述单韵母的整型权值成反比。0015上述所述的病人姓名模糊语义查询方法,其中,所述拼音字母的整型权值以质数序列按位分布。0016上述所述的病人姓名模糊语义查询方法,其中,若所述病人姓名的字符集是中文,则将所述病人的姓名转换为标准拼音形式。0017上述所述的病人姓名模糊语义查询方法,其中,上述所述的病人。

10、姓名模糊语义查询方法,其中,所述向右移位操作可配置。0018与现有技术相比,本发明以病人中文姓名对应的拼音字母集合为输入值,建立索引模型,该索引模型不仅算法简洁、可实现性强、运算量小,还能有效地屏蔽发音不准、口音、位置和大小写等因素。而且查询速度快、匹配性强、用户体验好,可以适应不同的方言环境和操作场景。附图说明0019图1所示为本发明实施例病人姓名模糊语义查询方法的流程示意图;0020图2所示为本发明实施例拼音字母的整型常量权值表。具体实施方式0021在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵。

11、的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。0022其次,本发明利用示意图进行详细描述,在详述本发明实施例时,为便于说明,所述示意图只是实例,其在此不应限制本发明保护的范围。0023下面结合附图和实施例对本发明进行详细地说明。本发明病人姓名模糊语义查询方法如图1所示,首先,执行步骤S1,为拼音字母设置对应的整型常量权值。具体地,在本实施例中,如图2所示,所述拼音字母为声母、单韵母和复韵母。对于拼音字母中易出错的拼音字母设置为相同的或差额小的整型常量权值。比如对于声母L和N,ZH和Z,CH和C,SH和H以及H和F,由于方言等因素容易出错,则将它们的整型常量权值设置为相同。需要说明。

12、的是,也可以将它们设置为差额小的整型常量权值。比如,L和N的整型常量权值的差额的绝对值小于E,E为正整数如E1。对于单韵母和复韵母也和声母一样,对于易出错的,设置相同的或差额小的整型常量权值。0024此外,对于除了易出错拼音字母的拼音字母,由于声母出错几率应小于复韵母,复韵母出错几率应小于单韵母,因此,所述声母的整型常量权值大于复韵母的整型常量权值,说明书CN104123295A3/3页5所述复韵母的整型常量权值大于单韵母的整型常量权值。而且,单韵母出现几率越高,出错几率越高,因此,单韵母在常用汉字中出现的次数和其整型常量权值成反比,即出现次数越高的单韵母,其整形常量权值越小。为了减少权值相加。

13、后重合的几率,拼音字母的整型常量权值以质数序列按位分布。在本实施例中,所述质数序列为3,5,7,B,如图2所示,对于声母,出现几率较高的声母,其整型常量权值越小,如声母N、G、F和B,N出现的几率比较高,其整型常量权值在这四个声母中最小,而且,声母N、G、F和B按照质数序列分布。需要说明的是,对于长度为N的整型常量权值,只要其中一位按照质数序列分布即可。对于单韵母和复韵母,也和声母一样,按照质数序列进行分布。需要说明的是,整型常量权值表可以根据实际的情况进行配置。0025接着,执行步骤S2,根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值和。其中,如果所述病人姓名的字符集是中。

14、文,则将所述病人的姓名转换为标准拼音形式。其中,所述病人为数据库中记录的病人。具体地,根据步骤S1中各个拼音字母对应的整型常量权值,分别确定病人姓名的姓和名的拼音形式所对应的整型常量权值,并分别计算病人的姓和名的权值和。在本实施例中,所计算的是十六进制权值和。需要说明的是,根据实际的需要,也可以是二进制、八进制、十进制等。0026接着,执行步骤S3,将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引。其中,向右位移操作是可配置的,若需要精确匹配,则向右位移的位数就比较少;若需要模糊匹配,则向右位移的位数就比较多。具体地,在本实施例中,将步骤S2得到的病人姓和名的权值和向右移位4位。

15、后,转换为字符串形式存储,即建立了所述病人相对应的姓索引和名索引。在本实施例中,字符串按照B树的形式存储。需要说明的是,也可以按照其他优化的形式存储。0027接着,执行步骤S4,将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若匹配,则执行步骤S5,查询结束;若不匹配,则执行步骤S6,根据上述步骤S2和S3,为所述待匹配病人建立相对应的姓索引和名索引,建立索引后则执行步骤S5,查询结束。具体地,根据待匹配病人的姓、名和姓名三种方式分别姓索引或名索引匹配查询,若索引相同,则是类似病人,查询结束;若索引不相同,则为待匹配病人建立姓索引和名索引,从而存储在数据库中。0028本发明虽然已以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以利用上述揭示的方法和技术内容对本发明技术方案做出可能的变动和修改,因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化及修饰,均属于本发明技术方案的保护范围。说明书CN104123295A1/3页6图1说明书附图CN104123295A2/3页7说明书附图CN104123295A3/3页8图2说明书附图CN104123295A。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1