《企业关联图谱的构建方法、装置、设备及计算机可读介质.pdf》由会员分享,可在线阅读,更多相关《企业关联图谱的构建方法、装置、设备及计算机可读介质.pdf(17页珍藏版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010556321.5 (22)申请日 2020.06.17 (71)申请人 国家计算机网络与信息安全管理中 心 地址 100029 北京市朝阳区裕民路甲3号 申请人 中国科学院计算技术研究所 (72)发明人 贺敏杜慧董琳郭富民 杨菁林徐小磊 (74)专利代理机构 北京华夏泰和知识产权代理 有限公司 11662 代理人 曾军李雪 (51)Int.Cl. G06Q 10/06(2012.01) G06F 16/28(2019.01) (54)发明名称 企业关联图谱的构建方法、。
2、 装置、 设备及计 算机可读介质 (57)摘要 本申请涉及一种企业关联图谱的构建方法、 装置、 设备及计算机可读介质。 该方法包括: 获取 目标数据集, 目标数据集包括多个目标企业的数 据, 每条数据包括一个目标企业的关联特征; 将 多个目标企业中具有相同的关联特征的企业划 分到同一个企业组中; 为多个目标企业建立图谱 节点, 并按照关联类型为企业组中的图谱节点构 建节点与节点之间的关联边; 利用关联系数和关 联权重确定关联边的关联强度。 本申请实现了企 业关联图谱的构建, 利用企业关联图谱表示了企 业之间存在的各种关联关系及企业之间的关联 强度, 为企业间风险传播的评估提供了基础。 权利要求。
3、书2页 说明书12页 附图2页 CN 111861120 A 2020.10.30 CN 111861120 A 1.一种企业关联图谱的构建方法, 其特征在于, 包括: 获取目标数据集, 其中, 所述目标数据集包括多个目标企业的数据, 所述目标数据集中 的每条数据包括一个目标企业的关联特征; 将所述多个目标企业中具有相同的所述关联特征的企业划分到同一个企业组中, 其 中, 一个企业组中的目标企业至少具有一条相同的所述关联特征; 为所述多个目标企业建立图谱节点, 并按照关联类型为所述企业组中的所述图谱节点 构建节点与节点之间的关联边, 其中, 所述关联类型表示所述多个目标企业之间因具有相 同的所。
4、述关联特征而存在的关联关系; 利用关联系数和关联权重确定所述关联边的关联强度, 其中, 所述关联系数用于表示 与所述关联系数匹配的所述关联类型对风险传导的贡献度, 所述关联权重用于表示具有所 述关联类型的企业之间关联关系的紧密度。 2.根据权利要求1所述的方法, 其特征在于, 获取目标数据集之前, 还包括按照如下方 式确定所述关联类型、 所述关联系数及所述关联权重: 将具有所述关联特征的所述目标企业之间的关联关系的类型确定为所述关联类型; 按照设定参数确定每种所述关联类型对应的所述关联系数和所述关联权重。 3.根据权利要求2所述的方法, 其特征在于, 按照关联类型为所述企业组中的所述图谱 节点。
5、构建节点与节点之间的关联边包括: 从多个企业组中选择出目标企业组, 其中, 所述目标企业组中的所述目标企业之间关 联关系的类型为目标关联类型; 为所述图谱节点中在所述目标企业组中的节点两两之间建立所述目标关联类型的关 联边, 其中, 所述关联边包括互为反向关系的两条反向关联边。 4.根据权利要求3所述的方法, 其特征在于, 为所述图谱节点中在所述目标企业组中的 节点两两之间建立所述目标关联类型的关联边之后, 还包括按照如下方式对除所述目标企 业组以外的其他企业组中的节点构建节点与节点之间的所述关联边: 在所述其他企业组中的任意两个所述图谱节点之间不存在所述关联边的情况下, 为两 个所述图谱节点。
6、构建所述关联边。 5.根据权利要求4所述的方法, 其特征在于, 在所述其他企业组中的任意两个所述图谱 节点之间不存在所述关联边的情况下, 为两个所述图谱节点构建关联边之后, 还包括按照 如下方式同时对所述多个企业组中的所述图谱节点构建节点与节点之间的所述关联边: 在不同关联特征指代的关联对象为同一个关联对象的情况下, 确定所述不同关联特征 所属的各个企业组; 在所述不同关联特征所属的所述各个企业组中的任意两个所述图谱节点之间不存在 所述关联边的情况下, 为两个所述图谱节点构建所述关联边。 6.根据权利要求1至5任一所述的方法, 其特征在于, 利用关联系数和关联权重确定所 述关联边的关联强度包括。
7、: 将与所述关联边的所述关联类型匹配的所述关联系数与所述关联权重的乘积确定为 所述关联边的所述关联强度。 7.根据权利要求6所述的方法, 其特征在于, 利用关联系数和关联权重确定所述关联边 的关联强度还包括: 权利要求书 1/2 页 2 CN 111861120 A 2 在一个所述关联边存在多个关联类型的情况下, 将多个关联强度中的最大值确定为所 述关联边的所述关联强度。 8.一种企业关联图谱的构建装置, 其特征在于, 包括: 数据获取模块, 用于获取目标数据集, 其中, 所述目标数据集包括多个目标企业的数 据, 所述目标数据集中的每条数据包括一个目标企业的关联特征; 分组模块, 用于将所述多。
8、个目标企业中具有相同的所述关联特征的企业划分到同一个 企业组中, 其中, 一个企业组中的目标企业至少具有一条相同的所述关联特征; 构建模块, 用于为所述多个目标企业建立图谱节点, 并按照关联类型为所述企业组中 的所述图谱节点构建节点与节点之间的关联边, 其中, 所述关联类型表示所述多个目标企 业之间因具有相同的所述关联特征而存在的关联关系; 关联强度确定模块, 用于利用关联系数和关联权重确定所述关联边的关联强度, 其中, 所述关联系数用于表示与所述关联系数匹配的所述关联类型对风险传导的贡献度, 所述关 联权重用于表示具有所述关联类型的企业之间关联关系的紧密度。 9.一种计算机设备, 包括存储器。
9、、 处理器, 所述存储器中存储有可在所述处理器上运行 的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现上述权利要求1至7任 一项所述的方法的步骤。 10.一种具有处理器可执行的非易失的程序代码的计算机可读介质, 其特征在于, 所述 程序代码使所述处理器执行所述权利要求1至7任一所述方法。 权利要求书 2/2 页 3 CN 111861120 A 3 企业关联图谱的构建方法、 装置、 设备及计算机可读介质 技术领域 0001 本申请涉及企业风险评估的技术领域, 尤其涉及一种企业关联图谱的构建方法、 装置、 设备及计算机可读介质。 背景技术 0002 随着现代社会的高速发展, 注册。
10、、 投资企业的门槛已经大大降低, 大量的企业拔地 而起, 其中就有不少企业存在诸多连带责任关系, 因为企业不是独立的个体, 与人员、 其他 企业都会有一定的关联。 企业与企业之间存在多种关联, 而工商关联是易于获取且质量较 高的一类关联数据, 企业之间通过投资控股、 人员任职等工商关联关系关联, 这种关联可能 是直接的关联, 也可能是通过其它企业或者人员的间接关联, 多个企业通过这些显性或者 隐性的关联交织在一起, 这种复杂交织的关联也带来了风险在企业之间的传播扩散。 例如 个别企业因为从事某些非法活动被公安机关、 工商行政部门立案侦查, 有些企业出现了资 金断裂、 债券违约等高危情形, 与这。
11、些企业具有关联的其他企业可能参与了相关经营活动, 或者存在利益的传送, 这就导致可能会受到风险企业资金断裂带来的资金损失、 人员涉嫌 犯罪等风险。 0003 目前, 相关技术中, 有根据互联网文本进行情感倾向性分析, 从而评估一个企业存 在的风险, 但是目前缺乏企业之间关联关系的表示方案, 故而不能从企业之间关联关系的 角度更为准确的评价企业受到风险传播的影响。 0004 针对上述的问题, 目前尚未提出有效的解决方案。 发明内容 0005 本申请提供了一种企业关联图谱的构建方法、 装置、 设备及计算机可读介质, 以解 决上述 “缺乏企业之间关联关系的表示” 的技术问题。 0006 第一方面, 。
12、本申请提供了一种企业关联图谱的构建方法, 包括: 获取目标数据集, 目标数据集包括多个目标企业的数据, 目标数据集中的每条数据包括一个目标企业的关联 特征; 将多个目标企业中具有相同的关联特征的企业划分到同一个企业组中, 一个企业组 中的目标企业至少具有一条相同的关联特征; 为多个目标企业建立图谱节点, 并按照关联 类型为企业组中的图谱节点构建节点与节点之间的关联边, 关联类型表示多个目标企业之 间因具有相同的关联特征而存在的关联关系; 利用关联系数和关联权重确定关联边的关联 强度, 关联系数用于表示与关联系数匹配的关联类型对风险传导的贡献度, 关联权重用于 表示具有关联类型的企业之间关联关系。
13、的紧密度。 0007 可选地, 获取目标数据集之前, 还包括按照如下方式确定关联类型、 关联系数及关 联权重: 将具有关联特征的目标企业之间的关联关系的类型确定为关联类型; 按照设定参 数确定每种关联类型对应的关联系数和关联权重。 0008 可选地, 按照关联类型为企业组中的图谱节点构建节点与节点之间的关联边包 括: 从多个企业组中选择出目标企业组, 其中, 目标企业组中的目标企业之间关联关系的类 说明书 1/12 页 4 CN 111861120 A 4 型为目标关联类型; 为图谱节点中在目标企业组中的节点两两之间建立目标关联类型的关 联边, 其中, 关联边包括互为反向关系的两条反向关联边。。
14、 0009 可选地, 为图谱节点中在目标企业组中的节点两两之间建立目标关联类型的关联 边之后, 还包括按照如下方式对除目标企业组以外的其他企业组中的节点构建节点与节点 之间的关联边: 在其他企业组中的任意两个图谱节点之间不存在关联边的情况下, 为两个 图谱节点构建关联边。 0010 可选地, 在其他企业组中的任意两个图谱节点之间不存在关联边的情况下, 为两 个图谱节点构建关联边之后, 还包括按照如下方式同时对多个企业组中的图谱节点构建节 点与节点之间的关联边: 在不同关联特征指代的关联对象为同一个关联对象的情况下, 确 定不同关联特征所属的各个企业组; 在不同关联特征所属的各个企业组中的任意两。
15、个图谱 节点之间不存在关联边的情况下, 为两个图谱节点构建关联边。 0011 可选地, 利用关联系数和关联权重确定关联边的关联强度包括: 将与关联边的关 联类型匹配的关联系数与关联权重的乘积确定为关联边的关联强度。 0012 可选地, 利用关联系数和关联权重确定关联边的关联强度还包括: 在一个关联边 存在多个关联类型的情况下, 将多个关联强度中的最大值确定为关联边的关联强度。 0013 第二方面, 本申请提供了一种企业关联图谱的构建装置, 包括: 数据获取模块, 用 于获取目标数据集, 目标数据集包括多个目标企业的数据, 目标数据集中的每条数据一个 目标企业的关联特征; 分组模块, 用于将多个。
16、目标企业中具有相同的关联特征的企业划分 到同一个企业组中, 一个企业组中的目标企业至少具有一条相同的关联特征; 构建模块, 用 于为多个目标企业建立图谱节点, 并按照关联类型为企业组中的图谱节点构建节点与节点 之间的关联边, 关联类型表示多个目标企业之间因具有相同的关联特征而存在的关联关 系; 关联强度确定模块, 用于利用关联系数和关联权重确定关联边的关联强度, 关联系数用 于表示与关联系数匹配的关联类型对风险传导的贡献度, 关联权重用于表示具有关联类型 的企业之间关联关系的紧密度。 0014 第三方面, 本申请提供了一种计算机设备, 包括存储器、 处理器, 存储器中存储有 可在处理器上运行的。
17、计算机程序, 处理器执行计算机程序时实现上述第一方面任一项方法 的步骤。 0015 第四方面, 本申请还提供了一种具有处理器可执行的非易失的程序代码的计算机 可读介质, 程序代码使处理器执行上述第一方面任一方法。 0016 本申请实施例提供的上述技术方案与相关技术相比具有如下优点: 0017 本申请通过获取目标数据集, 目标数据集包括多个目标企业的数据, 每条数据包 括一个目标企业的关联特征; 将多个目标企业中具有相同的关联特征的企业划分到同一个 企业组中; 为多个目标企业建立图谱节点, 并按照关联类型为企业组中的图谱节点构建节 点与节点之间的关联边; 利用关联系数和关联权重确定关联边的关联强。
18、度。 实现了企业关 联图谱的构建, 利用企业关联图谱表示了企业之间存在的各种关联关系及企业之间的关联 强度, 为企业间风险传播的评估提供了基础。 附图说明 0018 此处的附图被并入说明书中并构成本说明书的一部分, 示出了符合本申请的实施 说明书 2/12 页 5 CN 111861120 A 5 例, 并与说明书一起用于解释本申请的原理。 0019 为了更清楚地说明本申请实施例或相关技术中的技术方案, 下面将对实施例或相 关技术描述中所需要使用的附图作简单地介绍, 显而易见地, 对于本领域普通技术人员而 言, 在不付出创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。 0020 图1。
19、为根据本申请实施例提供的一种可选的企业关联图谱的构建方法硬件环境示 意图; 0021 图2为根据本申请实施例提供的一种可选的企业关联图谱的构建方法流程图; 0022 图3为根据本申请实施例提供的一种可选的企业关联图谱的构建装置框图。 具体实施方式 0023 为使本申请实施例的目的、 技术方案和优点更加清楚, 下面将结合本申请实施例 中的附图, 对本申请实施例中的技术方案进行清楚、 完整地描述, 显然, 所描述的实施例是 本申请的一部分实施例, 而不是全部的实施例。 基于本申请中的实施例, 本领域普通技术人 员在没有做出创造性劳动的前提下所获得的所有其他实施例, 都属于本申请保护的范围。 002。
20、4 在后续的描述中, 使用用于表示元件的诸如 “模块” 、“部件” 或 “单元” 的后缀仅为 了有利于本申请的说明, 其本身并没有特定的意义。 因此,“模块” 与 “部件” 可以混合地使 用。 0025 相关技术中, 有根据互联网文本进行情感倾向性分析, 从而评估一个企业存在的 风险, 但是企业不是完全独立的个体, 与人员、 其他企业都会有一定的关联。 企业与企业之 间存在多种关联, 如投资关系、 共同法人关系等, 可能是直接的关联, 也可能是通过其它企 业或者人员的间接关联, 多个企业通过这些显性或者隐性的关联交织在一起, 也正是这种 复杂交织的关联带来了风险在企业之间的传播扩散。 在个别企。
21、业因为从事某些非法活动被 公安机关、 工商行政部门立案侦查, 又或是出现了资金断裂、 债券违约等高危情形的情况 下, 将这类企业称为风险企业。 与这些风险企业具有关联的企业可能参与了风险企业的经 营活动、 与风险企业有利益的传送等, 也可能会受到风险企业资金断裂带来的资金损失、 人 员涉嫌犯罪等风险, 因此与风险企业有关联的企业也有一定的风险。 从风险传播的角度进 行考虑, 与风险企业的关联越紧密, 企业的风险就会越高。 在此认识下, 本申请技术方案基 于工商关联关系构建企业关联图谱, 提供了一种描述企业之间通过各种关联关系直接连接 以及间接连接的知识图谱, 从风险传播的角度, 对企业之间的多。
22、种关联关系进行区分并综 合考量, 最终确定关联强度, 从而为企业风险传播的评估提供知识基础。 0026 根据本申请实施例的一方面, 提供了一种企业关联图谱的构建方法的实施例。 0027 可选地, 在本申请实施例中, 上述方法可以应用于如图1所示的由终端101和服务 器103所构成的硬件环境中。 如图1所示, 服务器103通过网络与终端101进行连接, 可用于为 终端或终端上安装的客户端提供服务, 可在服务器上或独立于服务器设置数据库105, 用于 为服务器103提供数据存储服务, 上述网络包括但不限于: 广域网、 城域网或局域网, 终端 101包括但不限于PC、 手机、 平板电脑等。 0028。
23、 本申请实施例中的一种企业关联图谱的构建方法可以由服务器103来执行, 还可 以是由服务器103和终端101共同执行, 如图2所示, 该方法可以包括以下步骤: 0029 步骤S202, 获取目标数据集, 目标数据集包括多个目标企业的数据, 目标数据集中 说明书 3/12 页 6 CN 111861120 A 6 的每条数据包括一个目标企业的关联特征。 0030 本申请实施例中, 目标数据集可以是包括大量企业信息的数据集, 作为优选, 本申 请实施例以工商数据集进行说明, 用D表示。 工商数据集D中的每条数据d可以包括企业名 称、 法人、 自然人股东、 高管、 联系电话、 联系邮箱以及该企业投资。
24、的企业与投资比例、 控股 该企业的企业与控股比例等数据。 其中, 法人、 自然人股东、 高管、 联系电话及联系邮箱等都 可以作为关联特征, 在拥有相同关联特征的情况下, 表示具有该相同关联特征的企业之间 存在关联关系, 如A企业与B企业拥有共同的自然人股东, 则A企业与B企业之间存在关联关 系, 关联特征是共同自然人股东。 又如, 某人既是A企业的法人, 又是B企业的高管, 则A企业 与B企业之间存在关联关系, 关联特征是法人、 高管。 0031 步骤S204, 将多个目标企业中具有相同的关联特征的企业划分到同一个企业组 中, 一个企业组中的目标企业至少具有一条相同的关联特征。 0032 本申。
25、请实施例中, 可以按照每种关联特征进行分组, 一个关联特征作为一个企业 组, 即将具有同一个关联特征的企业合并到同一个企业组中, 因为一个企业具有法人、 高 管、 自然人股东、 联系电话及联系邮箱等关联特征, 所以一个企业可以同时划分到多个企业 组中, 同一个企业组中的所有企业至少具有一个相同的关联特征。 0033 可选地, 记企业为N, 法人为p, 高管为sp, 自然人股东为vp, 联系电话为h, 联系邮箱 为m进行说明, 例如: 0034 按照法人对企业进行划分, 首先在数据集D中对法人进行统计, 得到(p1、 p2pn), 再 将 相同 法 人 的 企 业 分 为 一 组 , 则 法 人。
26、 pi任 职 法 人 代 表 的 企 业 可 以 记 录 为 该企业组中的所有企业都具有相同的法人pi; 0035 按照高管对企业进行划分, 在数据集D中对高管进行统计, 得到(sp1、 sp2spn), 将 相同高管的企业分为一组, 则高管spi任职高管的企业可以记录为 该企业组中的所有企业都具有相同的高管spi; 0036 按照自然人股东对企业进行划分, 在数据集D中对自然人股东进行统计, 得到 (vp1、 vp2vpn), 将相同自然人股东的企业分为一组, 则自然人股东vpi任职自然人股东代 表的企业可以记录为该企业组中的所有企业都具有相同的自然 人股东vpi; 0037 按照联系电话对。
27、企业进行划分, 在数据集D中对联系电话进行统计, 得到(h1、 h2 hn) , 将 相同 联 系电 话 的 企 业 分 为 一 组 , 则 联 系电 话 为 hi的 企 业 可以 记 录 为 该企业组中的所有企业都具有相同的联系电话hi; 0038 按照联系邮箱对企业进行划分, 在数据集D中对联系邮箱进行统计, 得到(m1、 m2 mn) , 将 相同 联 系邮 箱的 企 业 分 为 一 组 , 则 联 系邮 箱 为 mi的 企 业 可以 记 录 为 该企业组中的所有企业都具有相同的联系邮箱mi。 0039 上述分组的方法针对企业之间间接关联的情况, 如企业之间通过人员、 电话、 邮箱 等作。
28、为建立关联关系的基础, 存在间接关联关系的企业至少被分到一个企业组中。 0040 可选地, 本申请实施例中, 对于企业之间直接关联的则可以不进行分组, 即对于目 说明书 4/12 页 7 CN 111861120 A 7 标企业与风险企业或者多个目标企业之间的关联关系为投资、 控股一类的直接关联关系, 可以不针对直接关联关系的这种关联特征进行分组, 或者单独将直接关联的两个企业作为 一个组, 表示这两个企业之间存在直接关联关系。 例如, A企业对B企业控股, 则A企业投资了 B企业, 两者直接关联, 建立关联关系的基础不依赖于人员、 电话、 邮箱等, 也不存在其他企 业同时拥有A企业和B企业之。
29、间的直接关联关系, 从而不需要分组。 0041 步骤S206, 为多个目标企业建立图谱节点, 并按照关联类型为企业组中的图谱节 点构建节点与节点之间的关联边, 关联类型表示多个目标企业之间因具有相同的关联特征 而存在的关联关系。 0042 本申请实施例中, 将各个企业抽象化为节点, 可以将同一个企业组中的节点构建 节点与节点之间的有向边, 即关联边, 表示具有相同关联特征的企业之间存在关联关系, 关 联关系的类型即关联类型, 也就是关联特征的类型, 关联边可以用E来表示, 关联类型可以 用Tk来表示。 例如: 0043 按照法人对企业进行分组, 则相同法人的一个企业组内, 建立企业Ni与Nj之。
30、间的关 联边Ei, j和Ej, i, 其关联类型T(Ei, j)和T(Ej, i)都为 “共同法人” 。 0044 按照高管对企业进行分组, 则相同高管的一个企业组内, 建立企业Ni与Nj之间的关 联边Ei, j和Ej, i, 其关联类型T(Ei, j)和T(Ej, i)都为 “共同高管” 。 0045 按照自然人股东对企业进行分组, 则相同自然人股东的一个企业组内, 建立企业 Ni与Nj之间的关联边Ei, j和Ej, i, 其关联类型T(Ei, j)和T(Ej, i)都为 “共同自然人股东” 。 0046 按照联系电话对企业进行分组, 则相同联系电话的一个企业组内, 建立企业Ni与Nj 之间。
31、的关联边Ei, j和Ej, i, 其关联类型T(Ei, j)和T(Ej, i)都为 “共同电话” 。 0047 按照联系邮箱对企业进行分组, 则相同联系邮箱的一个企业组内, 建立企业Ni与Nj 之间的关联边Ei, j和Ej, i, 其关联类型T(Ei, j)和T(Ej, i)都为 “共同邮箱” 。 0048 本申请实施例中, 还可以对不同企业组中的节点构建节点与节点之间的关联边, 例如, 存在部分企业的法人与其他企业的高管是同一个人的情况, 则可以将法人、 高管为同 一个人的企业进行关联, 即将分属法人和高管分组中法人和高管是同一个对象的节点两两 之间构建双向关联边。 0049 本申请实施例中。
32、, 除了对上述间接关联的企业(即企业组中的企业, 因存在通过人 员、 电话、 邮箱等建立关联的间接关联关系)两两之间构建关联边外, 对于投资控股一类的 直接关联关系的两个企业可以直接构建该两个企业之间的关联边。 例如, 企业Ni投资了企 业Nj, 则可以建立企业Ni与Nj之间的关联边Ei, j和Ej, i, Ei, j表示Ni对Nj控股, 关联边的方向由 Ni指向Nj, 其关联类型T(Ei, j)为 “控股” , Ej, i表示Nj属于Ni的子公司, 关联边的方向由Nj指向 Ni, 其关联类型T(Ej, i)为 “子公司” 。 0050 本申请实施例中, 节点与节点之间的关联边可以是双向关联边。
33、, 即可以由Ni指向 Nj, 表示为Ei, j, 还可以由Nj指向Ni, 表示为Ej, i。 Ni指向Nj时, 表示Nj在关联类型T(Ei, j)下受Ni 的影响, 反之, Nj指向Ni时, 表示Ni在关联类型T(Ej, i)下受Nj的影响。 需要说明的时, 本申请 实施例中不区分图谱节点和企业, 即上述节点之间的关联关系、 节点与节点之间的影响实 际上可以理解为企业之间的关联关系和企业与企业之间的影响。 0051 步骤S208, 利用关联系数和关联权重确定关联边的关联强度, 关联系数用于表示 与关联系数匹配的关联类型对风险传导的贡献度, 关联权重用于表示具有关联类型的企业 说明书 5/12 。
34、页 8 CN 111861120 A 8 之间关联关系的紧密度。 0052 本申请实施例中, 关联系数可以用于表示两个节点之间具有的关联边的关联类型 对风险传导的贡献度, 用Cor(Tk)表示, Cor(Tk)(0, 1。 例如, Ni企业对Nj企业控股, 由Ni指 向Nj的关联边为Ei, j, Ni与Nj所具有的关联类型T(Ei, j)为 “控股” , 则关联系数Cor(T(Ei, j)可 以是1, 相应的, 因为Ni企业对Nj企业控股, 则Nj企业属于Ni企业的子公司, 由Nj指向Ni的关联 边为Ej, i, Nj与Ni所具有的关联类型T(Ej, i)为 “子公司” , 则关联系数Cor(。
35、T(Ej, i)可以是0.9。 关联权重用于表示具有关联类型的企业之间关联关系的紧密度, 可以用来表示。 例如, Ni企业对Nj企业控股, 则关联权重可以是Ni对Nj的控股比例, 反之, Nj企业属于Ni 企业的子公司, 关联权重可以是1。 关联强度可以用于表示当前企业受风险传递 的企业影响(传递风险)的概率, 可以用S表示, 由Ni向Nj传递风险即关联边由Ni指向Nj时, 关 联强度可以表示为表示关联类型为Tk的关联边Ei, j所具有的关联强度。 0053本申请实施例中, 记Ni与Nj之间关联关系类型Tk的关联强度为则关联 强度可以由关联系数和关联强度的乘积确定, 即: 0054 本申请实施。
36、例中, 通过获取目标数据集, 目标数据集包括多个目标企业的数据, 每 条数据包括一个目标企业的关联特征; 将多个目标企业中具有相同的关联特征的企业划分 到同一个企业组中; 为多个目标企业建立图谱节点, 并按照关联类型为企业组中的图谱节 点构建节点与节点之间的关联边; 利用关联系数和关联权重确定关联边的关联强度的方 法, 实现了由节点、 节点与节点之间的关联边以及关联边的关联权重构建企业关联图谱, 从 而利用知识图谱表示企业之间显性或隐性的关联关系, 并且能够详细表示出企业之间关联 关系的紧密程度, 即关联强度, 从而为企业风险传播的评估构建了基础。 0055 可选地, 获取目标数据集之前, 本。
37、申请实施例还包括按照如下方式确定关联类型、 关联系数及关联权重: 将具有关联特征的目标企业之间的关联关系的类型确定为关联类 型; 按照设定参数确定每种关联类型对应的关联系数和关联权重。 0056 本申请实施例中, 可以根据两个企业之间的关联特征确定两个企业之间关联关系 的类型, 并将其作为关联类型Tk, 由关联类型, 可以按照设定参数确认与关联类型相对应的 关联系数Cor(Tk)和关联权重 0057 本申请实施例中, 设定参数可以是人为定义, 由服务器或终端设备获取的, 优选 的, 获取的设定参数可以如表1所示。 0058 表1 说明书 6/12 页 9 CN 111861120 A 9 00。
38、59 0060 由表1可知, 企业之间关联关系的关联类型可以包括三大类共13种, 例如: 0061 直接关联的关联类型有控股、 子公司两种, T(Ei, j)为 “控股” 表示企业Ni投资了企 业Nj。“控股” 与 “子公司” 互为反向关系对, T(Ei, j)为 “控股” , 那么T(Ej, i)为 “子公司” 关系。 0062 基于人员的关联类型有法人、 自然人股东、 高管和三类人员组成的关系对: (法人、 高管)、 (高管、 法人)、 (法人、 自然人股东)、 (自然人股东、 法人)、 (自然人股东、 高管)、 (高 管、 自然人股东), T(Ei, j)为 “共同法人” , 则表示企业。
39、Ni与企业Nj有共同的法人。 T(Ei, j)为 “(法人、 高管)” , 则表示企业Ni的法人同时是企业Nj高管。 由法人、 自然人股东、 高管组成的 关系对互为反向关系, 如T(Ei, j)为 “(法人、 高管)” , 那么T(Ej, i)为 “(高管、 法人)” 关系。 本申 请实施例中基于人员的关联类型属于间接关联类型。 0063 其他间接关联的关联类型还有联系电话和联系邮箱, T(Ei, j)为 “共同电话” 表示企 业Ni与企业Nj有共同的联系电话。 0064 可选地, 按照关联类型为企业组中的图谱节点构建节点与节点之间的关联边包 括: 从多个企业组中选择出目标企业组, 其中, 目。
40、标企业组中的目标企业之间关联关系的类 型为目标关联类型; 为图谱节点中在目标企业组中的节点两两之间建立目标关联类型的关 联边, 关联边包括互为反向关系的两条反向关联边。 0065 本申请实施例中, 构建节点与节点之间的关联边可以先挑选出一个企业组, 对该 企业组中的所有节点两两之间构建关联边。 挑选出来的企业组即为目标企业组, 该组内企 业之间所具有的关联关系的类型即为目标关联类型。 0066 本申请实施例中, 作为优选的方式, 可以选择共同法人、 共同电话及共同邮箱之一 的关联类型作为目标关联类型, 其对应的企业组作为目标企业组来进行。 0067 可选地, 为图谱节点中在目标企业组中的节点两。
41、两之间建立目标关联类型的关联 边之后, 还包括按照如下方式对除目标企业组以外的其他企业组中的节点构建节点与节点 说明书 7/12 页 10 CN 111861120 A 10 之间的关联边: 在其他企业组中的任意两个图谱节点之间不存在关联边的情况下, 为两个 图谱节点构建关联边。 0068 本申请实施例中, 在构建完成目标企业组中的所有节点两两之间的关联边之后, 可以对其他企业组中的节点两两之间构建关联边。 因为一个企业可以被划分到多个企业组 中, 因此存在该目标企业组之外其他企业组中包含有多个目标企业组中的节点, 此时为其 他企业组中两两节点之间不存在关联边的任意两个节点构建关联边。 例如,。
42、 N1、 N2、 N3属于同 一个企业组, 该企业组的关联类型Tk为 “共同法人” , N1、 N2、 N3两两之间建有关联边, 另有一 个企业组, 包含N2、 N3、 N4, 该企业组的关联类型Tk为 “共同高管” , 构建关联边是判断N2、 N3之 间已存在关联边, 便不再重复构建, N2、 N4和N3、 N4之间不存在关联边, 则为N2、 N4和N3、 N4之间 构建关联边。 0069 可选地, 在企业组中的任意两个图谱节点之间不存在关联边的情况下, 为两个图 谱节点构建关联边之后, 还包括按照如下方式同时对多个企业组中的图谱节点构建节点与 节点之间的关联边: 在不同关联特征指代的关联对。
43、象为同一个关联对象的情况下, 确定不 同关联特征所属的各个企业组; 在不同关联特征所属的各个企业组中的任意两个图谱节点 之间不存在关联边的情况下, 为两个图谱节点构建关联边。 0070 本申请实施例中, 法人、 高管和自然人股东表示的都是现实中的自然人, 则存在A 企业的法人同时担任B企业的高管的情况, 诸如此类, 还存在法人、 自然人股东以及高管、 自 然人股东重合的情况, 此时可以为不同关联特征指代的关联对象为同一个关联对象的两个 企业组中的所有节点构建关联边, 可以是在两个企业组中两两节点之间不存在关联边的情 况下构建该两节点之间的关联边。 例如, 一个企业组的关联类型Tk为 “共同法人。
44、” , 该法人为 p1, 另有一个企业组, 其关联类型Tk为 “共同高管” , 该高管为sp1, 若p1和sp1都是一个人即都 是同一个对象, 则为该两个企业组中的节点相互之间两两构建关联边。 可以按照上述方法, 若两两之间不存在关联边, 再构建关联边。 0071 可选地, 本申请实施例中, 对于直接关联的两个企业, 如存在控股、 被控股关系的 两个企业可以直接构建关联边。 0072 可选地, 利用关联系数和关联权重确定关联边的关联强度包括: 将与关联边的关 联类型匹配的关联系数与关联权重的乘积确定为关联边的关联强度。 0073 本申请实施例中, 为目标企业组中的所有节点构建关联边之后, 按照。
45、两两节点之 间的关联类型确定对应的关联系数和关联权重, 具体参见上述表1, 将关联系数和关联权重 的乘积作为该关联边的关联强度。 0074 按照同样的方式确定其他关联边的关联强度, 即按照两两节点之间的关联类型, 确定对应的关联系数和关联权重, 将关联系数和关联权重的乘积作为该关联边的关联强 度。 0075 可选地, 利用关联系数和关联权重确定关联边的关联强度还包括: 在一个关联边 存在多个关联类型的情况下, 将多个关联强度中的最大值确定为关联边的关联强度。 0076 本申请实施例中, 由于不同关联类型对应的关联系数和关联权重各不相同, 若两 个节点之间存在多种关联类型, 则分别获取到各个关联。
46、类型对应的关联强度, 选取数值最 大的一个作为该两个节点之间关联边的最终的关联强度, 例如, 在确定存在共同高管的两 个节点之间关联边的关联强度时, 若该两点还存在如共同法人等的关联关系, 则根据 “共同 说明书 8/12 页 11 CN 111861120 A 11 法人” 的关联类型得到对应的关联系数为1, 关联权重为1, 得到 “共同法人” 对应的关联强度 为关联系数和关联权重的乘积即1, 同时根据 “共同高管” 的关联类型得到对应的关联系数 为0.4, 关联权重为1, 得到 “共同高管” 对应的关联强度为关联系数和关联权重的乘积即 0.4, 对比两者大小, 最终确定该两点间关联边的关联。
47、强度为1。 0077 本申请通过获取目标数据集, 目标数据集包括多个目标企业的数据, 每条数据包 括一个目标企业的关联特征; 将多个目标企业中具有相同的关联特征的企业划分到同一个 企业组中; 为多个目标企业建立图谱节点, 并按照关联类型为企业组中的图谱节点构建节 点与节点之间的关联边; 利用关联系数和关联权重确定关联边的关联强度。 实现了企业关 联图谱的构建, 利用企业关联图谱表示了企业之间存在的各种关联关系及企业之间的关联 强度, 为企业间风险传播的评估提供了基础。 0078 根据本申请实施例的又一方面, 如图3所示, 提供了一种企业关联图谱的构建装 置, 包括: 数据获取模块301, 用于。
48、获取目标数据集, 目标数据集包括多个目标企业的数据, 目标数据集中的每条数据一个目标企业的关联特征; 分组模块303, 用于将多个目标企业中 具有相同的关联特征的企业划分到同一个企业组中, 一个企业组中的目标企业至少具有一 条相同的关联特征; 构建模块305, 用于为多个目标企业建立图谱节点, 并按照关联类型为 企业组中的图谱节点构建节点与节点之间的关联边, 关联类型表示多个目标企业之间因具 有相同的关联特征而存在的关联关系; 关联强度确定模块307, 用于利用关联系数和关联权 重确定关联边的关联强度, 关联系数用于表示与关联系数匹配的关联类型对风险传导的贡 献度, 关联权重用于表示具有关联类。
49、型的企业之间关联关系的紧密度。 0079 需要说明的是, 该实施例中的数据获取模块301可以用于执行本申请实施例中的 步骤S202, 该实施例中的分组模块303可以用于执行本申请实施例中的步骤S204, 该实施例 中的构建模块305可以用于执行本申请实施例中的步骤S206, 该实施例中的关联强度确定 模块307可以用于执行本申请实施例中的步骤S208。 0080 此处需要说明的是, 上述模块与对应的步骤所实现的示例和应用场景相同, 但不 限于上述实施例所公开的内容。 需要说明的是, 上述模块作为装置的一部分可以运行在如 图1所示的硬件环境中, 可以通过软件实现, 也可以通过硬件实现。 0081。
50、 可选地, 该企业关联图谱的构建装置, 还包括: 关联类型确定模块, 用于将具有关 联特征的目标企业之间的关联关系的类型确定为关联类型; 参数确定模块, 用于按照设定 参数确定每种关联类型对应的关联系数和关联权重。 0082 可选地, 该企业关联图谱的构建装置, 还包括: 选择模块, 用于从多个企业组中选 择出目标企业组, 目标企业组中的目标企业之间关联关系的类型为目标关联类型; 第一构 建模块, 用于为图谱节点中在目标企业组中的节点两两之间建立目标关联类型的关联边, 关联边包括互为反向关系的两条反向关联边。 0083 可选地, 该企业关联图谱的构建装置, 还包括: 第二构建模块, 用于在企业。