《一种语义网中基于本体的信息可信任度评估方法.pdf》由会员分享,可在线阅读,更多相关《一种语义网中基于本体的信息可信任度评估方法.pdf(14页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102929931 A (43)申请公布日 2013.02.13 CN 102929931 A *CN102929931A* (21)申请号 201210359575.3 (22)申请日 2012.09.24 G06F 17/30(2006.01) (71)申请人 上海师范大学 地址 200234 上海市徐汇区桂林路 100 号 (72)发明人 张波 李鲁群 李美子 (74)专利代理机构 上海伯瑞杰知识产权代理有 限公司 31227 代理人 吴泽群 (54) 发明名称 一种语义网中基于本体的信息可信任度评估 方法 (57) 摘要 本发明公开了一种语义网中基于本体的信息。
2、 可信任度评估方法, 首先信任本体接收语义网中 的信息后进行对比匹配, 获得基于本体的信息内 容信任度 ; 然后计算信任本体与相邻结点之间的 结点信任度 ; 最后依据语义网中信息传递路径采 用加权平均法获得信任本体的信息综合信任度。 本发明将语义网中信息的信任度计算分为 : 传播 信息的信息内容信任度计算和传播结点的结点信 任度计算两个方面, 进一步在这两种信任度计算 基础上, 综合评估并最终得到信息语义的综合信 任度。 (51)Int.Cl. 权利要求书 3 页 说明书 8 页 附图 2 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 3 页 说明书 8 页 附图。
3、 2 页 1/3 页 2 1. 一种语义网中基于本体的信息可信任度评估方法, 其特征在于 : 该信息可信任度评估方法的具体步骤为 : A. 语义网中的结点接收信息后, 依据结点本身拥有的信任本体进行对比匹配, 获得基 于本体的信息内容信任度 ; 其中, 语义网中的信息由信息实例表示 ; B. 计算步骤中的结点与信息来源的相邻结点之间的结点信任度 ; C. 依据语义网中信息传递路径、 步骤 A 中的信息内容信任度以及步骤 B 中的结点信任 度, 采用加权平均法获得步骤中信任本体的信息综合信任度。 2. 根据权利要求 1 所述的信息可信任度评估方法, 其特征在于 : 所述步骤中语义网中的信任本体呈。
4、树状结构。 3. 根据权利要求 2 所述的信息可信任度评估方法, 其特征在于 : 所述信息实例vi所对应的概念为信任本体的叶子节点时, 该信息实例vi的内容信任度 VBi的计算方法如下 : 语义网中的信息通过向量的方式来表示, 其方法如下 : 信息内容通过若干个实例向量 来进行表示, 信息内容的实例向量表示为 (v1, v2, .), 其中每一个实例表示为 vi (cj,(a1,a2,.)(下标 i 1,2,3, ., 表明信息内容实例向量中第 i 个实例) , cj(下标 j 1,2,3,., 表明对应信任本体中的第 j 个概念) 表示该实例所属的概念, (a1, a2, .) 为 该实例拥。
5、有的属性序列 ; TO.cr是信任本体 TO 中的叶子结点, 计算其 TO.cr本身和其直接父 概念情况, 设TO.cr在本体树结构中拥有直接父概念parent(TO.cr)k(这里用以指明TO.cr 的第 k 个直接父概念, 取值为正整数) , 则将信息实例 vi的属性序列 (a1,a2, .) 分别与 TO.cr和 parent(TO.cr)k的属性序列进行匹配 ; 将信息实例 vi的属性序列 (a1, a2, .) 与 结点信任本体的概念 TO.cr和 parent(TO.cr)k的属性所有进行匹配, 并提取出所有能够匹 配成功的属性, 记为同时获取其在信任本体中对应权值所有无法获取对应。
6、属性描述 的 vi的属性, 则属性描述的知识在结点不存在, 其对应的值均为 0 ; 此时信息实例 vi的内容 信任度计算为 : 其中 : |parent(TO.cr)| 表示 TO.cr的直接父概念的个数 ; 和 为预先设定的权重 参数且满足下列条件 : + 1,0 1,0 1 ; 信息内容的实例向量 的信息内容信任度为 : 对实例向量 (v1, v2, .), 假设有 p 个实例 vi在信任本体中可获得对应的概念, q 个实例在信任本体中无法获得对应概念描述 (0 p,0 q) ; 利用噪音系数 ( 0, 1) 表示无法在信任本体中获得对应概念的实例的内容信任度。 4. 根据权利要求 2 所。
7、述的信息可信任度评估方法, 其特征在于 : 所述信息实例vi所对应的概念为信任本体的非叶子节点时, 该信息实例vi的内容信任 权 利 要 求 书 CN 102929931 A 2 2/3 页 3 度 VBi的计算方法如下 : 语义网中的信息通过向量的方式来表示, 其方法如下 : 信息内容通过若干个实例向量 来进行表示, 信息内容的实例向量表示为 (v1,v2, .), 其中每一个实例表示为 vi (cj,(a1,a2,.)(下标 i 1,2,3,., 表明信息内容实例向量中第 i 个实例) , cj(下标 j 1,2,3,., 表明对应信任本体中的第 j 个概念) 表示该实例所属的概念, (a。
8、1, a2,.) 为该实例拥有的属性序列 ; TO.cr是信任本体中的非叶子结点, 计算其本身、 直接父概念和 直接子概念 ; 设 TO.cr在信任本体的树形结构中拥有直接父概念 parent(TO.cr)k(这里用 以指明 TO.cr的第 k 个直接父概念, 取值为正整数) 、 直接子概念 child(TO.cr)l(这里 l 用以指明 TO.cr的第 l 个直接子概念, l 取值为正整数) , 将信息实例 vi中的属性序列 (a1, a2, .) 分别与 TO.cr、 parent(TO.cr)k和 child(TO.cr)l的属性序列进行匹配, 并提取所匹 配到的属性和对应的属性权值 ;。
9、 此时信息实例 vi的内容信任度计算为 : 其 中 : |parent(TO.cr)| 和 |child(TO.cr)| 分 别 表 示 TO.cr的 直 接 父 概 念 和 直 接子概念的个数 ; 、 和 为预先设定的权重参数且满足下列条件 : + 1,0 1,0 1,0 1 ; 信息内容的实例向量 的信息内容信任度为 : 对实例向量 (v1,v2, .), 假设有 p 个实例 vi在信任本体中可获得对应的概念, q 个实例在信任本体中无法获得对应概念描述 (0 p,0 q) ; 利用噪音系数 ( 0, 1) 表示无法在信任本体中获得对应概念的实例的内容信任度。 5. 根据权利要求 1 所述。
10、的信息可信任度评估方法, 其特征在于 : 所述步骤 B 中的结点信任度 TY,X为 : 假设由结点 X 曾经向相邻结点 Y 曾经进行过 m 次信息传递, 即结点 X 向结点 Y 的单向 传递, 且传递中不存在中间结点, 每次结点 Y 所获得来自结点 X 的信息的综合信任度为 STi (下标 i 1,2,3, ., 表明第 i 次来自结点 X 的信息的综合信任度) , 则结点 Y 对结点 X 的 结点信任度记为 TY, X。 6. 根据权利要求 1 所述的信息可信任度评估方法, 其特征在于 : 所述步骤 C 中的信息传递路径为直接传递时, 步骤中语义网中结点所收到的信息的 权 利 要 求 书 C。
11、N 102929931 A 3 3/3 页 4 综合信任度 ST 计算方法如下 : 假设结点 S 到邻接结点 D 为直接传递, 结点 S 到邻接结点 D 之间不存在中间结点, 为 信息内容信任度, TD, S为结点 S 对结点 D 的结点信任度 : ST B+(1-)TD, S, 其中, 为调节参数, 取值为 0 到 1 之间的实数。 7. 根据权利要求 1 所述的信息可信任度评估方法, 其特征在于 : 所述步骤 C 中的信息传递路径为单一路径串行传递时, 步骤中语义网中结点所收到 的信息的综合信任度 ST 计算方法如下 : 假设结点 S 到结点 D 之间经过中间结点 X1,X2, ., Xn。
12、的单一路径串行传递, 这种情 况下, 就是指信息从结点 S 出发, 经过中间结点 X1,X2, ., Xn, 最后到结点 D 的单一路径 传递, 传递路径不存在分叉 ; 此时, 假设结点 D 计算得到所传递信息的内容信任度为 B, 同 时结点 D 对中间结点 Xn的结点信任度为中间结点之间的结点信任分别为 中间结点 X1对初始结点 S 的结点信任度为则综合信任 度 ST : 为调节参数, 取值为 0 到 1 之间的实数。 8. 根据权利要求 1 所述的信息可信任度评估方法, 其特征在于 : 所述步骤 C 中的信息传递路径为多条路径并行传递时, 步骤中语义网中结点所收到 的信息的综合信任度 ST。
13、 计算方法如下 : 假设结点 S 到结点 D 之间经过中间结点的多条路径并行传递, 假设此时有 m 条路径, 每条路径记为 Routei(下标 i 1,2,.m,) ; 路径 Routei的中间结点记为且每 条路径中拥有的中间结点数量记为 |Routei| ; 我们将任意一条则从结点 S 到结点 D 的路径 Routei所拥有的结点信任度记为 Routei.T ; B 为结点 D 计算得到所传递信息的内容信任度 ; 则综合信任度 ST : 其中 : 为调节参数, 取值为 0 到 1 之间的实数。 权 利 要 求 书 CN 102929931 A 4 1/8 页 5 一种语义网中基于本体的信息可。
14、信任度评估方法 技术领域 0001 本发明涉及计算机网络领域, 更具体地说, 是涉及一种语义网中基于本体的信息 可信任度评估方法。 背景技术 0002 语义网是一种能理解人类语言的智能网络, 它不但能够理解人类的语言, 而且 还可以使人与电脑之间的交流变得像人与人之间交流一样轻松。语义网的创始者 Tim Berners-Leer 认为, 语义网为计算机提供了自动理解和处理信息的能力。在语义网的典 型架构中, 每个计算机终端都可被视为一个结点, 利用结点各自拥有的本体, 对知识进行明 确、 规范化、 形式化描述, 实现信息语义被本体理解, 从而使计算机能够理解这些信息并自 动对之进行相应的处理操。
15、作, 可以预期, 在语义网中, 计算机将智能化地进行信息理解和传 递, 并利用网络中信息的语义为人类提供所需服务。语义网中的每一个计算机结点能否正 确处理这些信息, 其中一个重要的方面就是取决于网络中所传播信息可信程度的判定。因 此,“如何在语义网中有效地进行信息可信任计算” 就成为迫切需要解决的问题。 0003 目前主要的语义网可信任评估技术主要从对信息的主观认知和客观内容理解等 方面展开。但这些技术大都在一定程度上存在无法针对信息本身的语义进行评估, 无法综 合评价信息内容可信任以及来源可信任等问题。 这些问题导致信息的信任度计算无法充分 发挥语义网中机器能够自动理解知识的特点。 发明内容。
16、 0004 针对现有技术中存在的缺陷, 本发明的目的是提供一种语义网中基于本体的信息 可信任度评估方法, 能够在语义网环境中通过计算机自动进行信息语义的可信任评估, 将 语义网中任一信息所能获得的综合信任度分为两个组成方面 : 第一是信息所包含内容语义 的信任度 ; 第二是信息传播的个体结点之间的主观信任度, 在此基础上, 将上述两方面信任 度综合计算形成语义网中信息的综合信任度 0005 为达到上述目的, 本发明采用如下的技术方案 : 0006 一种语义网中基于本体的信息可信任度评估方法, 其特征在于 : 0007 该信息可信任度评估方法的具体步骤为 : 0008 A. 语义网中的结点接收信。
17、息后, 依据结点本身拥有的信任本体进行对比匹配, 获 得基于本体的信息内容信任度 ; 其中, 语义网中的信息由信息实例表示 ; 0009 B. 计算步骤中的接收信息的结点与信息来源相邻结点之间的结点信任度 ; 0010 C. 依据语义网中信息传递路径、 步骤 A 中的信息内容信任度以及步骤 B 中的结点 信任度, 采用加权平均法获得步骤中信任本体的信息综合信任度。 0011 所述步骤中语义网中的信任本体呈树状结构。 0012 所述信息实例vi所对应的概念为信任本体的叶子节点时, 该信息实例vi的内容信 任度 VBi的计算方法如下 : 说 明 书 CN 102929931 A 5 2/8 页 6。
18、 0013 语义网中的信息通过向量的方式来表示, 其方法如下 : 信息内容通过若干个实例 向量来进行表示, 信息内容的实例向量表示为 (v1, v2, .), 其中每一个实例表示为 vi (cj,(a1,a2,.) (下标 i 1,2,3, ., 表明信息内容实例向量中第 i 个实例) , cj(下标 j 1,2,3,., 表明对应信任本体中的第 j 个概念) 表示该实例所属的概念, (a1, a2, .) 为该实例拥有的属性序列 ; TO.cr是信任本体 TO 中的叶子结点, 计算其 TO.cr本身和其直接 父概念情况, 设 TO.cr在本体树结构中拥有直接父概念 parent(TO.cr)。
19、k(这里用以指明 TO.cr的第 k 个直接父概念, 取值为正整数) , 则将信息实例 vi的属性序列 (a1,a2, .) 分 别与TO.cr和parent(TO.cr)k的属性序列进行匹配。 将信息实例vi的属性序列(a1, a2, .) 与结点信任本体的概念 TO.cr和 parent(TO.cr)k的属性所有进行匹配, 并提取出所有能够 匹配成功的属性, 记为同时获取其在信任本体中对应权值所有无法获取对应属性描 述的 vi的属性, 则属性描述的知识在结点不存在, 其对应的值均为 0 ; 此时信息实例 vi的内 容信任度计算为 : 0014 0015 其中 : |parent(TO.cr。
20、)| 表示 TO.cr的直接父概念的个数 ; 和 为预先设定的 权重参数且满足下列条件 : + 1,0 1,0 1。 0016 信息内容的实例向量 的信息内容信任度为 : 0017 0018 对实例向量 (v1, v2, .), 假设有 p 个实例 vi在信任本体中可获得对应 的概念, q 个实例在信任本体中无法获得对应概念描述 (0 p,0 q) 。利用噪音系数 ( 0, 1) 表示无法在信任本体中获得对应概念的实例的内容信任度。 0019 所述信息实例vi所对应的概念为信任本体的非叶子节点时, 该信息实例vi的内容 信任度 VBi的计算方法如下 : 0020 语义网中的信息通过向量的方式来。
21、表示, 其方法如下 : 信息内容通过若干个实例 向量来进行表示, 信息内容的实例向量表示为 (v1, v2, .), 其中每一个实例表示为 vi (cj,(a1,a2,.) (下标 i 1,2,3, ., 表明信息内容实例向量中第 i 个实例) , cj(下标 j 1,2,3,., 表明对应信任本体中的第 j 个概念) 表示该实例所属的概念, (a1, a2,.) 为该实例拥有的属性序列 ; TO.cr是信任本体中的非叶子结点, 计算其本身、 直接父概念和 直接子概念。设 TO.cr在信任本体的树形结构中拥有直接父概念 parent(TO.cr)k(这里 用以指明 TO.cr的第 k 个直接父。
22、概念, 取值为正整数) 、 直接子概念 child(TO.cr)l(这里 l 用以指明 TO.cr的第 l 个直接子概念, l 取值为正整数) , 将信息实例 vi中的属性序列 (a1, a2, )分别与TO.cr、 parent(TO.cr)k和child(TO.cr)l的属性序列进行匹配, 并提取所匹配到 的属性和对应的属性权值。此时信息实例 vi的内容信任度计算为 : 说 明 书 CN 102929931 A 6 3/8 页 7 0021 0022 0023 其 中 : |parent(TO.cr)| 和 |child(TO.cr)| 分 别 表 示 TO.cr的 直 接 父 概 念 和。
23、 直接子概念的个数 ; 、 和 为预先设定的权重参数且满足下列条件 : + 1,0 1,0 1,0 1 ; 0024 信息内容的实例向量 的信息内容信任度为 : 0025 0026 对实例向量 (v1, v2, .), 假设有 p 个实例 vi在信任本体中可获得对应 的概念, q 个实例在信任本体中无法获得对应概念描述 (0 p,0 q) 。利用噪音系数 ( 0, 1) 表示无法在信任本体中获得对应概念的实例的内容信任度。 0027 所述步骤 B 中的结点信任度 TY,X为 : 0028 0029 假设由结点 X 曾经向相邻结点 Y 曾经进行过 m 次信息传递, 即结点 X 向结点 Y 的 单。
24、向传递, 且传递中不存在中间结点, 每次结点Y所获得来自结点X的信息的综合信任度为 STi(下标 i 1,2,3, .)( 下标 i 1,2,3,., 表明第 i 次来自结点 X 的信息的综合信 任度) , 则结点 Y 对结点 X 的结点信任度记为 TY,X。 0030 所述步骤 C 中的信息传递路径为直接传递时, 步骤中语义网中结点所收到的信 息的综合信任度 ST 计算方法如下 : 0031 假设结点 S 到邻接结点 D 为直接传递, 结点 S 到邻接结点 D 之间不存在中间结点, 为信息内容信任度, TD, S为结点 S 对结点 D 的结点信任度 : 0032 ST B+(1-)TD,S 。
25、0033 其中, 为调节参数, 取值为 0 到 1 之间的实数。 0034 所述步骤 C 中的信息传递路径为单一路径串行传递时, 步骤中语义网中结点所 收到的信息的综合信任度 ST 计算方法如下 : 0035 假设结点 S 到结点 D 之间经过中间结点 X1,X2, ., Xn的单一路径串行传递, 这种情况下, 就是指信息从结点 S 出发, 经过 X1, X2, ., Xn, 最后到结点 D 的单一路径 传递, 传递路径不存在分叉 ; 此时, 假设结点 D 计算得到所传递信息的内容信任度为 B, 同时结点 D 对中间结点 Xn的结点信任度为中间结点之间的结点信任分别为 中间结点 X1对初始结点。
26、 S 的结点信任度为则 说 明 书 CN 102929931 A 7 4/8 页 8 综合信任度 ST : 0036 0037 为调节参数, 取值为 0 到 1 之间的实数。 0038 所述步骤 C 中的信息传递路径为多条路径并行传递时, 步骤中语义网中结点所 收到的信息的综合信任度 ST 计算方法如下 : 0039 假设结点 S 到结点 D 之间经过中间结点的多条路径并行传递, 假设此时有 m 条路 径, 每条路径记为 Routei(下标 i 1,2,.m,) ; 路径 Routei的中间结点记为且 每条路径中拥有的中间结点数量记为 |Routei|。我们将任意一条则从结点 S 到结点 D 。
27、的路 径 Routei所拥有的结点信任度记为 Routei.T ; B 为结点 D 计算得到所传递信息的内容信任 度 ; 则综合信任度 ST : 0040 0041 其中 : 0042 0043 为调节参数, 取值为 0 到 1 之间的实数。 0044 本发明提出了一种语义网中基于本体的信息可信任度评估方法, 该方法将语义网 中信息的信任度计算分为 : 传播信息的信息内容信任度计算和传播结点的结点信任度计算 两个方面, 进一步在这两种信任度计算基础上, 综合评估并最终得到信息语义的综合信任 度。 附图说明 0045 图 1 为语义网中可信任计算与人类信任评估的相似性示意图 ; 0046 图 2。
28、 为本发明的信息可信任度评估方法的原理示意图 ; 0047 图 3 为本发明的信息传递路径为直接传递时的原理示意图 ; 0048 图 4 为本发明的信息传递路径为单一路径串行传递时的原理示意图 ; 0049 图 5 为本发明的信息传递路径为多条路径并行传递时的原理示意图 ; 0050 在图 3- 图 5 中, 1 代表结点, 2 代表中间结点, 3 代表结点 S。 具体实施方式 0051 下面结合附图以及实施例进一步说明本发明的技术方案。 0052 本发明的原理如下 : 现实生活中, 人们对于信息的可信任程度判定一般从两个方 面进行 : 一是对于信息内容的信任程度判定 ; 二是对于信息提供者本。
29、身的信任程度判定。 对于前者, 人们利用自己所拥有的知识, 对于所获得信息的内容进行分析, 以确定信息内容 说 明 书 CN 102929931 A 8 5/8 页 9 的信任程度 ; 对于后者, 人们利用长期日常沟通交流经验, 从而获得对于信息提供者的信任 度。 最终, 人们可对两方面所获得的信任判定结果进行综合考虑, 从而获得对于所获得信息 的一个综合性信任度。在语义网的信息可信度判定过程中, 本发明借助上述人类真实社会 判定信息可信度的方法来实现。 本发明首先将语义网中每个可以进行信息发送和接收的计 算机终端记为结点。与人类社会相似, 语义网中信息的传递通过网络中的结点向相邻的结 点进行。
30、一步一步地传递。对于结点接收的信息, 可以进行两个方面信任度考虑 : 第一, 通过 结点所拥有的知识的载体, 即本体, 获得该节点知识的 “概念模型的明确的规范说明” , 从而 通过本体与信息语义之间的匹配比对, 使计算机理解所得到信息包含的语义, 进而对其获 得的信息可信度进行有效评估 ; 第二, 语义网中的结点之间对每次信息交互的效果进行记 录, 并通过结点交互记录计算得到结点之间的信任关系。 最终, 每个结点均可以通过上述两 个方面的计算, 进一步综合判定, 得到所获得信息的信任度。 0053 本发明将语义网中任一信息所能获得的综合信任度分为两个组成方面 : 第一是信 息所包含内容语义的。
31、信任度 ; 第二是信息传播的个体结点之间的主观信任度。 在此基础上, 本发明将上述两方面信任度综合计算形成语义网中信息的综合信任度。 0054 基于上述出发点, 本发明的一种语义网中基于本体的信息可信任度评估方法定义 了三个信任度定义 : 0055 定义 1 内容信任度 (记为 B) 是指语义网中信息内容所拥有的信任度。内容信任度 取值为 0 到 1 之间的实数, 值越大, 则表明该信息越可信任。 0056 定义 2 结点信任度是指语义网中任意两个结点之间在过往交互关系经验基础上 形成的信任度。结点信任度取值为 0 到 1 之间的实数, 值越大, 则表明该信息越可信任。 0057 定义 3 综。
32、合信任度是指语义网中任一结点在收到其他结点传递来的信息后, 利用 该信息的内容信任度和与传递该信息的结点之间的结点信任度进行综合计算后, 获得的综 合信任度。综合信任度取值为 0 到 1 之间的实数, 值越大, 则表明该信息越可信任。 0058 本发明中进行语义网信息综合信任度评估的基本原理是 : 当任何一个结点收到一 条来自其它结点的信息后, 将首先依据两个方面展开评估 : 第一, 收到信息的结点对信息内 容语义的信任程度如何进行评估。 该评价将是基于结点所拥有本体中与信息相关的知识展 开。 如果信息中所包含的内容语义存在于用户所掌握的本体知识中, 那么该内容是可信的, 如果内容语义是结点没。
33、有掌握的知识, 那么该内容是不可信的 ; 其次, 结点将依据信息的来 源判断该信息的可信任程度。 如果信息来自一个结点所信任的来源, 那么信息可信度较高, 如果信息来自不可信来源, 那么信息可信度较低。如附图 1 中, 体现了人类社会信任评估方 法与语义网环境中的相似处。 0059 本发明可以通过以下技术步骤方案来实现, 如附图 2 所示 : 0060 1) 利用本体理论, 对知识进行形式化、 规范化表示, 实现基于本体的信息内容可信 任度计算 ; 0061 2) 实现语义网中任意两个结点之间的主观信任度计算 ; 0062 3) 依据上述两个信任度值, 依据不同的信息传递情况, 综合计算出语义。
34、网中所传 递信息的综合信任度。 0063 1. 信息的内容信任度计算 0064 为了针对信息内容进行计算, 本发明首先给出了语义网中信息的表示方式。在本 说 明 书 CN 102929931 A 9 6/8 页 10 发明中, 语义网中的信息通过向量的方式来表示, 其方法如下 : 信息内容通过若干个实例向 量来进行表示, 信息内容的实例向量表示为(v1,v2, .), 其中每一个实例表示为vi (cj,(a1,a2,.)(下标 i 1,2,3,.), cj(下标 j 1,2,3,.) 表示该实例所属的概 念, (a1, a2, .) 为该实例拥有的属性序列。 0065 在每个语义网的结点中, 。
35、均拥有各自进行形式化、 规范化知识表达的本体, 从而使 结点具备自动理解和分析信息的能力。因此, 本发明为每个语义网结点定义一个用来理解 信息并计算信息可信度的本体, 称为信任本体, 其定义如下 : 0066 定义 4 信任本体被定义为如下表达式 : TO (C,R,A,O, WA)。其中, C 为概念集合 ; R 表示概念之间的层次关系, 即概念的父子关系。子概念是对父概念所描述知识的继承, 同时进一步进行细化的描述 ; A 为概念所拥有的属性集合 ; O 为实例集合, 实例集合是一个 不断完善的动态集合, 信息中的每一个信息内容都作为概念 C 在本体中的实例出现 ; WA 为 权重标量, 。
36、用于定义每一个属性 A 的权重, 对于一个概念的属性序列, 其属性权重的和为 1。 0067 本发明给出的信任本体的概念呈树状结构, 每个概念均为树的中的一个节点, 同 时每个概念节点均具有属性描述并且属性均有对应的值。在该树状本体中, 节点之间的关 系为父子关系。拥有子概念 (子节点) 的概念称为非叶子概念 (或非叶子节点) ; 没有子概念 的概念成为叶子概念 (或叶子节点) 。 0068 语义网中信息内容信任度计算的基本思想是 : 将信息实例向量中的每一个vi与该 结点所拥有的信任本体 TO 进行对比匹配, 如果 vi中所有元素均可在 TO 中找到对应的值, 那么意味着这些元素在该结点中拥。
37、有相对应的知识, 那么该vi就是可靠的 ; 否则的话, 则这 些元素不能得到该结点本体知识的理解, 是不可知的, 即不被信任。 0069 本发明中, 语义网结点计算收到的信息的内容信任度方法如下 : 0070 Step1 : 结点获得一个信息后, 首先获得信息的实例向量 (v1,v2, ., vn), 并 从中提取每一个实例 vi (cj,(a1,a2,.)(下标 i,j 1,2,3,.), 从而信息的具体内 容语义 ; 0071 Step2 : 信息实例向量中的每一个实例vi, 其对应的内容可信任度记为VBi。 假设实 例 vi所属概念为 cj对应该结点的信任本体 TO 的中概念 TO.cr。
38、(下标 r 1,2,3,.), 则该 结点就用 TO.cr来对实例 vi进行计算。计算分为两种情况 : 0072 1) TO.cr是信任本体 TO 中的叶子概念, 即 TO.cr没有子概念。本发明计算其 TO.cr 本身和其直接父概念情况。设 TO.cr在本体树结构中拥有有直接父概念 parent(TO.cr)k(下 标 k 1,2,3,.), 则将信息实例 vi的属性序列 (a1, a2, .) 分别与 TO.cr和 parent(TO. cr)k的属性序列进行匹配。我们将信息实例 vi的属性序列 (a1, a2, .) 与结点信任本体的 概念 TO.cr和 parent(TO.cr)k的属。
39、性所有进行匹配, 并提取出所有能够匹配成功的属性, 记 为同时获取其在信任本体中对应权值所有无法获取对应属性描述的vi的属性, 则属 性描述的知识在结点不存在, 其对应的值均为 0。此时, 信息实例 vi的内容信任度计算为 : 0073 0074 其 中 : parent(TO.cr)k表 示 TO.cr的 直 接 父 概 念 的 个 数 ; + 1,0 1,0 1。 说 明 书 CN 102929931 A 10 7/8 页 11 0075 2) TO.cr是信任本体中的非叶子结点。本发明计算它本身、 直接父概念和直接子 概念。设 TO.cr在信任本体的树形结构中拥有直接父概念 parent。
40、(TO.cr) 和直接子概念 child(TO.cr), 与前面类似, 将信息实例vi中的属性序列(a1, a2, )分别与TO.cr、 parent(TO. cr) 和 child(TO.cr) 的属性序列进行匹配, 并提取所匹配到的属性和对应的属性权值。此 时信息实例 vi的内容信任度计算为 : 0076 0077 0078 其中 : |parent(TO.cr)|和|child(TO.cr)|分别表示TO.cr的直接父概念和直接子 概念的个数 ; + 1,0 1,0 1,0 1。 0079 对实例向量 (v1, v2, .), 本发明假设有 p 个实例 vi在信任本体中可获得对 应的概念。
41、, q 个实例在信任本体中无法获得对应概念描述 (0 p,0 q) 。利用噪音系数 ( 0, 1) 表示无法在信任本体中获得对应概念的实例的内容信任度。则 所表示 的信息内容信任度为 : 0080 0081 2. 语义网中结点之间的结点信任度计算 0082 为了计算结点之间的信任度, 本发明在语义网中用信任度的算术平均值来定义两 个结点之间的结点信任度。计算方法如下 : 0083 假设由结点 X 曾经向相邻结点 Y 曾经进行过 m 次信息传递 (即 X 向 Y 的单向传递, 且传递中不存在中间结点) , 每次结点 Y 所获得来自结点 X 的信息的综合信任度为 STi(下 标 i 1,2,3, 。
42、.), 则结点 Y 对结点 X 的结点信任度 (记为 TY, X) 为 : 0084 0085 3. 语义网中信息综合信任度计算方法 0086 在语义网中, 信息传递具有很多中情况, 因此本发明依据信息传递的路径不同给 出不同的信息的综合信任度 (记为 ST) 计算方法。此处, 我们将信息传递的起点记为结点 S, 将最终收到信息的结点记为结点 D。 0087 情况 1 : 如图 3 所示, 结点 S 到邻接结点 D 的直接传递。在此情况下, 结点 S 到邻 接结点 D 之间不存在中间结点。此时, 假设结点 D 通过上述计算方法, 得到信息的内容信任 度为 B (该值可以通过上述内容信任度计算方。
43、法获得, 下同) , 且结点 D 对结点 S 的结点信任 度为 TD, S(该值可通过上述结点信任度计算方法获得, 下同) , 则结点 D 所收到的信息的综合 信任度 ST 可计算为 : 0088 ST B+(1-)TD,S (5) 说 明 书 CN 102929931 A 11 8/8 页 12 0089 上述式中, 为调节参数, 取值为 0 到 1 之间的实数。 0090 情况 2 : 如图 4 所示, 结点 S 到结点 D 之间经过中间结点 X1,X2,.,Xn的单一路径 串行传递。这种情况下, 就是指信息从 S 出发, 经过 X1,X2, ., Xn, 最后到结点 D 的单一路 径传递。
44、, 传递路径不存在分叉。 此时, 假设结点D计算得到所传递信息的内容信任度为B, 同 时结点 D 对中间结点 Xn的结点信任度为中间结点之间的结点信任分别为 中间结点 X1对初始结点 S 的结点信任度为则结点 D 所 收到的信息的综合信任度 ST 可计算为 : 0091 0092 上述式中, 为调节参数, 取值为 0 到 1 之间的实数。 0093 情况 3 : 如图 5 所示, 结点 S 到结点 D 之间经过中间结点的多条路径并行传递。在 语义网中, 除了串行单一路径传递外, 还有多源并行路径进行信息传递的方式。 在这种情况 下, 本发明信息的综合信任度可以综合考虑多条并行路径方法来实现。本。
45、发明的计算方法 如下 : 假设此时有 m 条路径, 每条路径记为 Routei(下标 i 1,2,.m,) ; 路径 Routei的中间 结点记为且每条路径中拥有的中间结点数量记为 |Routei|。我们将任意一条则 从结点 S 到结点 D 的路径 Routei所拥有的结点信任度记为 Routei.T, 它可计算为 : 0094 0095 在上述计算的基础上, 我们假设结点 D 计算得到所传递信息的内容信任度为 B, 从 则从结点 S 到结点 D 通过多条并行路径传递的信息所具有的综合信任度可计算为 : 0096 0097 上述式中, 为调节参数, 取值为 0 到 1 之间的实数。 0098 本技术领域中的普通技术人员应当认识到, 以上的实施例仅是用来说明本发明的 目的, 而并非用作对本发明的限定, 只要在本发明的实质范围内, 对以上所述实施例的变 化、 变型都将落在本发明的权利要求的范围内。 说 明 书 CN 102929931 A 12 1/2 页 13 图 1 图 2 说 明 书 附 图 CN 102929931 A 13 2/2 页 14 图 3 图 4 图 5 说 明 书 附 图 CN 102929931 A 14 。