定值项匹配方法及匹配系统技术领域
本发明涉及电力技术领域,尤其涉及一种定值项匹配方法及匹配系统。
背景技术
由于缺少相关行业规范,目前电力行业中的保信系统与生产管理信息系统、定值
整定等系统中对同一二次设备的名称、定值项描述并不一致,而定值自动核对等功能要求
系统间的定值项信息必须可以交换。因此,如何自动完成定值项的匹配是实施应用功能的
关键,也是一个难点。
目前,解决上述问题的主要采用技术手段有:关键字匹配、编辑距离、手工关联等
方法。
然而,由于相同的关键字可以在不能匹配的定值项目中出现,采用关键字匹配会
使本来不匹配的定值项目匹配成功;而编辑距离是统计从一个字符串转换到另一个字符串
所需要的编辑步骤,根据编辑步骤的多少来描述两个字符串的相似程度,由于存在不同字
符串编辑距离相同、数字中文同义但编辑距离不同等问题,导致存在大量错配情况;另外,
完全手工关联则带来了巨大的工作量,完成手工关联需要耗费大量的人力和时间。
发明内容
本发明为解决上述技术问题提供一种定值项匹配方法及匹配系统,能够提高定值
项匹配的正确率,避免大量人工操作进而提高工作效率。
为解决上述技术问题,本发明提供一种定值项匹配方法,包括如下步骤:生成待匹
配定值项各自对应的特征向量;采用余弦定理计算所述特征向量之间的夹角余弦值;判断
所述夹角余弦值是否在预设限值范围内,如果在预设限值范围内,则判断为匹配成功。
进一步地,在所述生成待匹配定值项各自对应的特征向量的步骤之中,包括:将待
匹配的所述定值项按照预定模式进行分析进而生成相对应的所述特征向量。
进一步地,在所述将待匹配的所述定值项按照预定模式进行分析进而生成相对应
的所述特征向量的步骤之中,包括如下子步骤:按照术语表扫描所述定值项的名称,匹配包
含的术语并转换为第一预定义值;将所述术语从所述名称中删除,按照删除位置将所述名
称分为多个第一分段,在各个所述第一分段中提取包含序数的序数短语并转换为第二预定
义值;将所述序数短语从包含序数的所述第一分段中删除,按照删除位置再次分为多个第
二分段,在各个所述第二分段中提取数字值以作为限定词;根据所述第一预定义值、所述第
二预定义值以及所述限定词构造所述特征向量。
进一步地,在所述生成待匹配定值项各自对应的特征向量的步骤之前,还包括:收
集定值项的项目名称,据此构建所述术语表。
进一步地,在所述构建所述术语表的步骤之中,包括:给每个所述术语表的表项编
号,并赋予权重值。
为解决上述技术问题,本发明还提供一种定值项匹配系统,包括:
进一步地,生成单元,用于生成待匹配定值项各自对应的特征向量;计算单元,所述计
算单元与所述生长单元连接,用于采用余弦定理计算所述特征向量之间的夹角余弦值;以
及判断单元,所述判断单元与所述计算单元连接,用于判断所述夹角余弦值是否在预设限
值范围内,如果在预设限值范围内,则判断为匹配成功。
进一步地,所述生成单元用于将待匹配的所述定值项按照预定模式进行分析进而
生成相对应的所述特征向量。
进一步地,所述生成单元具体用于按照术语表扫描所述定值项的名称,匹配包含
的术语并转换为第一预定义值;将所述术语从所述名称中删除,按照删除位置将所述名称
分为多个第一分段,在各个所述第一分段中提取包含序数的序数短语并转换为第二预定义
值;将所述序数短语从包含序数的所述第一分段中删除,按照删除位置再次分为多个第二
分段,在各个所述第二分段中提取数字值以作为限定词;根据所述第一预定义值、所述第二
预定义值以及所述限定词构造所述特征向量。
进一步地,所述定值项匹配系统还包括与所述生成单元连接的构造单元,所述构
造单元用于收集定值项的项目名称,据此构建所述术语表。
进一步地,所述构造单元还用于给每个所述术语表的表项编号,并赋予权重值。
本发明的定值项匹配方法及匹配系统,具有如下有益效果:采用特征向量方式,包
含了专业术语、序数及数字等特征信息,避免了单纯判断关键字导致的使本来不匹配的定
值项目匹配成功的问题;特征向量中对序数及数字特征的处理方式,使程序功能保持稳定,
避免了采用程序处理同意而不同表达的字符串时,必须修改程序才能满足各种要求的问
题;匹配过程自动完成,节省了时间、人力,提高了工作效率。
附图说明
图1是本发明定值项匹配方法实施例的流程图。
图2是图1所示定值项匹配方法中特征向量生成方法的流程图。
图3本发明定值项匹配系统实施例的功能结构图。
具体实施方式
下面结合附图和实施方式对本发明进行详细说明。
如图1所示,本发明实施方式的定值项匹配方法,其包括如下步骤:
步骤S11,生成待匹配定值项各自对应的特征向量。即每个定值项对应会生成一个特征
向量,定值项匹配一般而言指两个定值项之间的匹配。
步骤S12,采用余弦定理计算特征向量之间的夹角余弦值。即利用余弦定理计算两
个定值项各自对应的特征向量之间的夹角余弦值。
步骤S13,判断夹角余弦值是否在预设限值范围内。该预设限值即规定了误差允许
范围,只有在该夹角余弦值在严格限定的误差范围内时,才会判断为匹配成功。
具体的,在步骤S13中,如果待匹配的两个定值项所对应的特征向量之间的夹角余
弦值在预设限值范围内,则判断为匹配成功;否者,则判断为匹配失败。
举例而言,其具体匹配过程大致可以为如下方式:
将设备一(如保信系统与生产管理信息系统)中术语表所包含的定值项1、定值项2…定
值项n依次以遍历的方式分别与设备二(如定值整定等系统)中术语表所包含的定值项1’、
定值项2’…定值项n’进行匹配。具体而言,将由定值项1生成的特征向量1依次与由定值项
1’生成的特征向量1’进行匹配,如果匹配不成功,在与由定值项2’生成的特征向量2’进行
匹配…直至匹配成功或者全部匹配完成;然后对定值项2重复进行上述步骤。当然,设备一
中需要匹配的定值项可以事先按需要进行设定,不一定需要全部匹配。
在生成待匹配定值项各自对应的特征向量的步骤之中,即在步骤S11中,包括:将
待匹配的定值项按照预定模式进行分析进而生成相对应的特征向量。具体的,该步骤S11包
括如下子步骤:
步骤S111,术语提取。
具体的,按照术语表扫描定值项的名称,匹配包含的术语并转换为第一预定义值。
步骤S112,序数提取。
具体的,将术语从名称中删除,按照删除位置将名称分为多个第一分段,在各个第
一分段中提取包含序数的序数短语并转换为第二预定义值。
步骤S113,数字提取。
具体的,将序数短语从包含序数的第一分段中删除,按照删除位置再次分为多个
第二分段,在各个第二分段中提取数字值以作为限定词。
以及步骤S114,根据提取特征值构建特征向量。
具体的,根据第一预定义值、第二预定义值以及限定词构造特征向量。
在一实施方式中,具体在生成待匹配定值项各自对应的特征向量的步骤之前,即
在步骤S11之前,还包括步骤S10:收集定值项的项目名称,据此构建术语表。
其中,在构建术语表的步骤S10之中,包括:给每个术语表的表项编号,并赋予权重
值。通过编号和赋予权重值的方式可以优化特征向量的参数,提高定值项匹配成功的准确
性。
另外,本发明还提供一种定值项匹配系统,包括:生成单元11、计算单元12以及判
断单元13。具体而言:
生成单元11,用于生成待匹配定值项各自对应的特征向量。
计算单元12,计算单元12与生长单元连接,用于采用余弦定理计算特征向量之间
的夹角余弦值。
以及判断单元13,判断单元13与计算单元12连接,用于判断夹角余弦值是否在预
设限值范围内,如果在预设限值范围内,则判断为匹配成功。
该生成单元11用于将待匹配的定值项按照预定模式进行分析进而生成相对应的
特征向量。
进一步地,生成单元11具体用于按照术语表扫描定值项的名称,匹配包含的术语
并转换为第一预定义值;将术语从名称中删除,按照删除位置将名称分为多个第一分段;在
各个第一分段中提取包含序数的序数短语并转换为第二预定义值;将序数短语从包含序数
的第一分段中删除,按照删除位置再次分为多个第二分段;在各个第二分段中提取数字值
以作为限定词;根据第一预定义值、第二预定义值以及限定词构造特征向量。
定值项匹配系统还包括与生成单元11连接的构造单元10,构造单元10用于收集定
值项的项目名称,据此构建术语表。其中,该构造单元10还用于给每个术语表的表项编号,
并赋予权重值。
本发明的定值项匹配方法及匹配系统,具有如下有益效果:
1.采用特征向量方式,包含了专业术语、序数及数字等特征信息,避免了单纯判断关键
字导致的使本来不匹配的定值项目匹配成功的问题。
2.特征向量中对序数及数字特征的处理方式,使程序功能保持稳定,避免了采用
程序处理同意而不同表达的字符串时,必须修改程序才能满足各种要求的问题。
3.匹配过程自动完成,节省了时间、人力,提高了工作效率。
以上仅为本发明的实施方式,并非因此限值本发明的专利范围,凡是利用本发明
说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术
领域,均同理包括在本发明的专利保护范围内。