《基于知识图谱和用户行为的工业领域智能问答方法及系统.pdf》由会员分享,可在线阅读,更多相关《基于知识图谱和用户行为的工业领域智能问答方法及系统.pdf(16页珍藏版)》请在专利查询网上搜索。
1、(19)国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202410037259.7(22)申请日 2024.01.10(71)申请人 安徽省优质采科技发展有限责任公司地址 230092 安徽省合肥市包河区徽州大道4872号金融港中心A11幢办201室(72)发明人 封军卢晓凯吴增峰王凯禹(74)专利代理机构 合肥维可专利代理事务所(普通合伙)34135专利代理师 吴明华(51)Int.Cl.G06F 16/332(2019.01)G06F 16/35(2019.01)G06F 16/36(2019.01)G06F 40/30(2020.01)G06F。
2、 40/295(2020.01)G06F 40/253(2020.01)G06N 5/022(2023.01)(54)发明名称基于知识图谱和用户行为的工业领域智能问答方法及系统(57)摘要本发明公开了一种基于知识图谱和用户行为的工业领域智能问答方法及系统,该方法包括:接收用户输入的问题;基于用户问题和用户在平台上的历史操作行为,对用户问题进行决策性分类,获取用户问题所属问题类别;基于用户问题在数据库中搜索相似问答数据,基于相似问答数据、用户问题、用户问题所属问题类别输入分流模型匹配一个用于处理用户问题的专家模型,基于用户输入的问题调用预先构建的知识图谱增强用户问题的语义;基于语义增强后的用户问。
3、题输入匹配的专家模型,获取用户问题的回答数据。本发明有效提高了工业品领域应答系统的答复准确性和高效性。权利要求书3页 说明书8页 附图4页CN 117540004 A2024.02.09CN 117540004 A1.一种基于知识图谱和用户行为的工业领域智能问答方法,其特征在于,包括如下步骤:步骤1,接收用户输入的问题;步骤2,基于用户问题和用户在平台上的历史操作行为,对用户问题进行决策性分类,获取用户问题所属问题类别;步骤3,基于用户问题在数据库中搜索相似问答数据,基于相似问答数据、用户问题、用户问题所属问题类别输入分流模型,所述分流模型用于基于输入数据通过分析在多个已有的专家模型中匹配一个。
4、用于处理用户问题的专家模型,每个所述专家模型用于处理一类问题类型的用户问题;步骤4,基于用户输入的问题调用预先构建的知识图谱增强用户问题的语义;步骤5,基于语义增强后的用户问题输入步骤3匹配的专家模型,获取用户问题的回答数据;所述分流模型的数据处理包括如下步骤:将用户问题、相似问答数据、用户问题所属问题类别记为第一文本数据;获取多个专家模型的属性功能描述文本,记为第二文本数据;基于第一文本数据和第二文本数据进行适配性分析,确定与第一文本数据匹配的第二文本数据对应的专家模型。2.根据权利要求1所述的基于知识图谱和用户行为的工业领域智能问答方法,其特征在于,所述用户在平台上的历史操作行为,包括但不。
5、限于用户在平台上的点击、浏览、项目参与行为;所述问题类别包括但不限于:询问招投标法律、生成招投标文件、检测招投标文件、购买工业品、询问供应商。3.根据权利要求1所述的基于知识图谱和用户行为的工业领域智能问答方法,其特征在于,所述对用户问题进行决策性分类,采用训练完成的用户问题分类模型实现,所述用户问题分类模型基于用户问题和用户在平台上的历史操作行为作为数据源、经过训练随机森林模型得到。4.根据权利要求1所述的基于知识图谱和用户行为的工业领域智能问答方法,其特征在于,所述数据库中包括工业品相关知识数据和平台累积的客服对话数据;所述工业品相关知识数据包括:平台积累的工业知识、技术文件、研究报告和与。
6、工业相关的标书、合同模板、技术规范和商业条款;所述预先构建的知识图谱,包括:基于工业品相关知识数据作为数据源,经过数据预处理和结构化处理后,基于实体识别、关系提取技术构建知识图谱。5.根据权利要求4所述的基于知识图谱和用户行为的工业领域智能问答方法,其特征在于,包括:对所述客服对话数据进行预处理和结构化处理,该处理步骤包括:基于语音转文字算法,获取客服对话对应的对话文本;基于大语言模型将语音转文字算法得到的对话文本进行优化、并转换为统一的问答格式结构化数据。6.根据权利要求5所述的基于知识图谱和用户行为的工业领域智能问答方法,其特征在于,所述基于大语言模型将语音转文字算法得到的对话文本进行优化。
7、、并转换为统一的问答格式结构化数据,包括:权利要求书1/3 页2CN 117540004 A2根据对话文本进行预处理,包括分词、去除停用词;根据对话文本中的文字内容,生成候选问题;基于候选问题和对话文本中的句子进行关联性匹配,获取确定问题;基于确定问题在对话文本中的文字内容中搜索关联的候选的答案内容,基于候选的答案内容生成多个第一候选答案;基于确定问题和对话文本中的文字内容联合输入模型中,获取第二候选答案;基于第一候选答案和第二候选答案结合确定目标答案。7.根据权利要求1所述的基于知识图谱和用户行为的工业领域智能问答方法,其特征在于,所述基于第一文本数据和第二文本数据进行适配性分析,包括如下步。
8、骤:将第一文本数据的用户问题所属问题类别和第二文本数据进行语义分析,并识别获取用户问题所属问题类别与所述第二文本数据的所属关系,记用户问题所属问题类别属于第二文本数据表征范围为第一情况,记用户问题所属问题类别包含第二文本数据表征范围为第二情况,记用户问题所属问题类别与第二文本数据表征范围无所属关系为第三情况;在多个专家模型的对应的多个第二文本数据中存在第一情况时,优先在满足第一情况的第二文本数据对应的专家模型中进行所述适配性分析确定匹配的专家模型;针对第一情况的第二文本数据及对应的专家模型,基于第一文本数据的用户问题、相似问答数据的关键词、用户问题所属问题类别的文本语义与第二文本数据进行语义关。
9、联性分析,选择与第一文本数据的文本语义关联性最大的第二文本数据对应的专家模型确定为匹配结果;在不存在第一情况时,针对第二情况的第二文本数据及对应的专家模型,基于第一文本数据的用户问题、相似问答数据的关键词表征范围与第二文本数据表征范围分析所属关系,在第一文本数据的用户问题、相似问答数据的关键词表征范围属于第二文本数据表征范围时,选择与用户问题、相似问答数据的文本语义关联性最大的第二文本数据对应的专家模型确定为匹配结果,在第一文本数据的用户问题、相似问答数据的关键词表征范围大于第二文本数据表征范围时,基于第二文本数据对应的专家模型作为候选专家模型;针对第三情况,根据用户问题、相似问答数据与第二文。
10、本数据的文本语义关联性择优选择候选专家模型;在不确定唯一匹配的专家模型时,基于所有候选专家模型作为分流模型的结果并经过人工确认唯一匹配的专家模型。8.基于知识图谱和用户行为的工业领域智能问答系统,其特征在于,包括:用户问题接收单元,用于接收用户输入的问题;用户意图识别单元,用于基于用户问题和用户在平台上的历史操作行为,对用户问题进行决策性分类,获取用户问题所属问题类别;分流单元,用于基于用户问题在数据库中搜索相似问答数据,基于相似问答数据、用户问题、用户问题所属问题类别输入分流模型,所述分流模型用于基于输入数据通过分析在多个已有的专家模型中匹配一个用于处理用户问题的专家模型,每个所述专家模型用。
11、于处理一类问题类型的用户问题;问题语义增强单元,用于基于用户输入的问题调用预先构建的知识图谱增强用户问题的语义;权利要求书2/3 页3CN 117540004 A3答案获取单元,用于基于语义增强后的用户问题输入步骤3匹配的专家模型,获取用户问题的回答数据;所述分流模型的数据处理包括如下步骤:将用户问题、相似问答数据、用户问题所属问题类别记为第一文本数据;获取多个专家模型的属性功能描述文本,记为第二文本数据;基于第一文本数据和第二文本数据进行适配性分析,确定与第一文本数据匹配的第二文本数据对应的专家模型。9.一种电子设备,其特征在于,所述电子设备包括:处理器;用于存储处理器可执行指令的存储器;其。
12、中,所述处理器通过运行所述可执行指令以实现如权利要求17中任一项所述的方法。10.一种计算机可读存储介质,其上存储有计算机指令,所述指令被处理器执行时实现实现如权利要求17中任一项所述的基于知识图谱和用户行为的工业领域智能问答方法的步骤。权利要求书3/3 页4CN 117540004 A4基于知识图谱和用户行为的工业领域智能问答方法及系统技术领域0001本发明涉及人工智能的智能问答技术领域,具体涉及一种基于知识图谱和用户行为的工业领域智能问答方法及系统。背景技术0002随着数字化工业的持续推进,工业品数据在各类工业应用和项目中扮演着日益重要的角色。此类数据涵盖了广泛且复杂的领域,包括产品说明、。
13、技术规范以及供应链信息等,其中充满了技术术语、操作流程以及商业信息。因此,对于工业领域的从业人员来说,如何高效地获取、理解和利用这些数据无疑是一项重大挑战。0003此外,当面对工业设备、生产线或系统出现的问题时,往往需要分析并查询大量的工业文档以寻找合适的解决方案。虽然在此过程中,专家的知识和经验具有极高的价值,但依赖这些传统方法的成本高昂,且效率并不理想。0004为了应对上述挑战,市场上已经出现了一些基于计算机技术的辅助工具和系统。然而,这些现有的解决方案大多数还无法有效地处理数量庞大、种类繁多且持续变化的工业数据。因此,市场上对于能够有效处理工业数据的辅助工具和系统的需求仍然迫切。发明内容。
14、0005针对上述现有技术存在的问题,本发明提供了一种基于知识图谱和用户行为的工业领域智能问答方法及系统,利用知识图谱、随机森林、向量检索、分流模型、专家模型技术,构建了专门为工业品领域设计的语言模型,有效提高工业品领域问题解决的效率。该技术方案如下:第一方面,提供了一种基于知识图谱和用户行为的工业领域智能问答方法,包括如下步骤:步骤1,接收用户输入的问题;步骤2,基于用户问题和用户在平台上的历史操作行为,对用户问题进行决策性分类,获取用户问题所属问题类别;步骤3,基于用户问题在数据库中搜索相似问答数据,基于相似问答数据、用户问题、用户问题所属问题类别输入分流模型,所述分流模型用于基于输入数据通。
15、过分析在多个已有的专家模型中匹配一个用于处理用户问题的专家模型,每个所述专家模型用于处理一类问题类型的用户问题;步骤4,基于用户输入的问题调用预先构建的知识图谱增强用户问题的语义;步骤5,基于语义增强后的用户问题输入步骤3匹配的专家模型,获取用户问题的回答数据。0006在一些实施方式中,所述用户在平台上的历史操作行为,包括但不限于用户在平台上的点击、浏览、项目参与行为;所述问题类别包括但不限于:询问招投标法律、生成招投标文件、检测招投标文说明书1/8 页5CN 117540004 A5件、购买工业品、询问供应商。0007在一些实施方式中,所述对用户问题进行决策性分类,采用训练完成的用户问题分类。
16、模型实现,所述用户问题分类模型基于用户问题和用户在平台上的历史操作行为作为数据源、经过训练随机森林模型得到。0008在一些实施方式中,所述数据库中包括工业品相关知识数据和平台累积的客服对话数据;所述工业品相关知识数据包括:平台积累的工业知识、技术文件、研究报告和与工业相关的标书、合同模板、技术规范和商业条款;所述预先构建的知识图谱,包括:基于工业品相关知识数据作为数据源,经过数据预处理和结构化处理后,基于实体识别、关系提取技术构建知识图谱。0009在一些实施方式中,上述基于知识图谱和用户行为的工业领域智能问答方法,包括:对所述客服对话数据进行预处理和结构化处理,该处理步骤包括:基于语音转文字算。
17、法,获取客服对话对应的对话文本;基于大语言模型将语音转文字算法得到的对话文本进行优化、并转换为统一的问答格式结构化数据。0010在一些实施方式中,所述基于大语言模型将语音转文字算法得到的对话文本进行优化、并转换为统一的问答格式结构化数据,包括:根据对话文本进行预处理,包括分词、去除停用词;根据对话文本中的文字内容,生成候选问题;基于候选问题和对话文本中的句子进行关联性匹配,获取确定问题;基于确定问题在对话文本中的文字内容中搜索关联的候选的答案内容,基于候选的答案内容生成多个第一候选答案;基于确定问题和对话文本中的文字内容联合输入模型中,获取第二候选答案;基于第一候选答案和第二候选答案结合确定目。
18、标答案。0011在一些实施方式中,所述分流模型的数据处理包括如下步骤:将用户问题、相似问答数据、用户问题所属问题类别记为第一文本数据;获取多个专家模型的属性功能描述文本,记为第二文本数据;基于第一文本数据和第二文本数据进行适配性分析,确定与第一文本数据匹配的第二文本数据对应的专家模型。0012在一些实施方式中,所述基于第一文本数据和第二文本数据进行适配性分析,包括如下步骤:将第一文本数据的用户问题所属问题类别和第二文本数据进行语义分析,并识别获取用户问题所属问题类别与所述第二文本数据的所属关系,记用户问题所属问题类别属于第二文本数据表征范围为第一情况,记用户问题所属问题类别包含第二文本数据表征。
19、范围为第二情况,记用户问题所属问题类别与第二文本数据表征范围无所属关系为第三情况;在多个专家模型的对应的多个第二文本数据中存在第一情况时,优先在满足第一情况的第二文本数据对应的专家模型中进行所述适配性分析确定匹配的专家模型;针对第一情况的第二文本数据及对应的专家模型,基于第一文本数据的用户问说明书2/8 页6CN 117540004 A6题、相似问答数据的关键词、用户问题所属问题类别的文本语义与第二文本数据进行语义关联性分析,选择与第一文本数据的文本语义关联性最大的第二文本数据对应的专家模型确定为匹配结果;在不存在第一情况时,针对第二情况的第二文本数据及对应的专家模型,基于第一文本数据的用户问。
20、题、相似问答数据的关键词表征范围与第二文本数据表征范围分析所属关系,在第一文本数据的用户问题、相似问答数据的关键词表征范围属于第二文本数据表征范围时,选择与用户问题、相似问答数据的文本语义关联性最大的第二文本数据对应的专家模型确定为匹配结果,在第一文本数据的用户问题、相似问答数据的关键词表征范围大于第二文本数据表征范围时,基于第二文本数据对应的专家模型作为候选专家模型;针对第三情况,根据用户问题、相似问答数据与第二文本数据的文本语义关联性择优选择候选专家模型;在不确定唯一匹配的专家模型时,基于所有候选专家模型作为分流模型的结果并经过人工确认唯一匹配的专家模型。0013第二方面,提供了一种基于知。
21、识图谱和用户行为的工业领域智能问答系统,该系统包括:用户问题接收单元,用于接收用户输入的问题;用户意图识别单元,用于基于用户问题和用户在平台上的历史操作行为,对用户问题进行决策性分类,获取用户问题所属问题类别;分流单元,用于基于用户问题在数据库中搜索相似问答数据,基于相似问答数据、用户问题、用户问题所属问题类别输入分流模型,所述分流模型用于基于输入数据通过分析在多个已有的专家模型中匹配一个用于处理用户问题的专家模型,每个所述专家模型用于处理一类问题类型的用户问题;问题语义增强单元,用于基于用户输入的问题调用预先构建的知识图谱增强用户问题的语义;答案获取单元,用于基于语义增强后的用户问题输入步骤。
22、3匹配的专家模型,获取用户问题的回答数据。0014第三方面,提供了一种电子设备,所述电子设备包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器通过运行所述可执行指令以实现上述第一方面所述的方法。0015本发明的一种基于知识图谱和用户行为的工业领域智能问答方法及系统,具备如下有益效果:本发明利用知识图谱、用户问题分类模型、向量检索、分流模型、专家模型技术,构建了专门为工业品领域设计的语言模型,通过用户问题分类模型识别用户意图,通过分流模型多个专家模型之间有效分配问题,而且单一专家模型处理同一类问题能够确保模型能够更精准地理解并回应用户需求,从而提高的应答系统的效率和答案准确性。通过。
23、知识图谱对用户输入的问题进行语义增强,基于语义增强的用户问题形成查询语句在专家模型中确定答案,进一步提高了答案的准确性。本发明有效提高了工业品领域知识应答的效率和精准性,并且提高了工业品领域工作人员的工作效率。说明书3/8 页7CN 117540004 A7附图说明0016图1是本申请实施例中基于知识图谱和用户行为的工业领域智能问答方法的技术路线示意图;图2是本申请实施例中基于知识图谱和用户行为的工业领域智能问答方法的流程示意图;图3是平台累计客服对话数据的处理流程示意图;图4是本申请实施例中基于知识图谱和用户行为的工业领域智能问答系统的结构示意图。具体实施方式0017应当理解,此处所描述的具。
24、体实施例仅仅用以解释本发明,并不用于限定本发明。0018参见图1和图2,本申请实施例提供了一种基于知识图谱和用户行为的工业领域智能问答方法,包括如下步骤:步骤1,接收用户输入的问题;步骤2,基于用户问题和用户在平台上的历史操作行为,对用户问题进行决策性分类,获取用户问题所属问题类别;步骤3,基于用户问题在数据库中搜索相似问答数据,基于相似问答数据、用户问题、用户问题所属问题类别输入分流模型,所述分流模型用于基于输入数据通过分析在多个已有的专家模型中匹配一个用于处理用户问题的专家模型,每个所述专家模型用于处理一类问题类型的用户问题;步骤4,基于用户输入的问题调用预先构建的知识图谱增强用户问题的语。
25、义;步骤5,基于语义增强后的用户问题输入步骤3匹配的专家模型,获取用户问题的回答数据。0019客户问题可能复杂多变,本申请实施例中根据用户历史行为,预测用户可能的需求或查询意图,对用户问题进行分类,基于用户问题所属问题类别输入分流模型,确定用于处理用户问题的一个专家模型,分流模型可以帮助在多个专家模型之间有效分配问题,而且单一专家模型处理同一类问题能够确保模型能够更精准地理解并回应用户需求,从而提高的应答系统的效率和答案准确性。0020另外,本申请实施例中,为了提高答案的准确性,还对用户输入的问题通过知识图谱增强问题语义,基于语义增强的用户问题形成查询语句在专家模型中确定答案,进一步提高了答案。
26、的准确性。0021需要说明的是,本申请实施例中的专家模型,包括多种功能类型的不同专家模型,例如,“工业品专家模型”,该模型的描述文本为“工业品专家模型使用大量工业品知识进行训练,包含工业品知识图谱,可以对工业品相关的知识进行解答”,再例如,“法律专家模型”,该模型的描述文本为“法律专家模型是一个使用大量法律信息训练的模型,可以对基本的法律信息进行回答”,本申请实施例中的专家模型是基于大数据训练的智能应答解析模型,可以根据输入的用户问题,通过用户问题解析,智能生成匹配的应答数据,相比于模式匹配、规则匹配等获取答案的方式,本申请实施例的专家模型能够更好地对用户问题作出智能应答。说明书4/8 页8C。
27、N 117540004 A80022进一步的,上述步骤2中所述用户在平台上的历史操作行为,包括但不限于用户在平台上的点击、浏览、项目参与行为;所述问题类别包括但不限于:询问招投标法律、生成招投标文件、检测招投标文件、购买工业品、询问供应商。0023在一种实施方式中,上述步骤2中对用户问题进行决策性分类,采用训练完成的用户问题分类模型实现,所述用户问题分类模型基于用户问题和用户在平台上的历史操作行为作为数据源、经过训练随机森林模型得到。0024训练随机森林模型时,可以采用平台积累的客服对话数据和用户在平台上的历史操作行为作为数据源,对客服对话数据进行处理,得到问答形式的结构化数据,基于用户问题和。
28、用户在平台上的历史操作行为训练随机森林模型。0025在一种实施方式中,所述数据库中包括工业品相关知识数据和平台累积的客服对话数据;所述工业品相关知识数据包括:平台积累的工业知识、技术文件、研究报告和与工业相关的标书、合同模板、技术规范和商业条款;所述预先构建的知识图谱,包括:基于工业品相关知识数据作为数据源,经过数据预处理和结构化处理后,基于实体识别、关系提取技术构建知识图谱。0026知识图谱的构建过程中,本申请实施例中,先对于工业品数据通过NLP方法解析产品描述、商品详情名、商品型号、设备参数、供应商名称等关键参数和信息,然后根据产品规格、行业标准和供应商管理规定进行工业品信息规范化结构化处。
29、理,确保非结构化文本得到有效结构化,然后基于结构化的工业品数据构建知识图谱,包括抽取工业品数据中的实体和关系,对产品描述、行业标准和供应商等信息采用模式匹配、依存语法分析等算法进行语义分析和关联关系分析。0027需要说明的是,本申请实施例中构建的知识图谱是动态变化的,一旦监测到新增数据,基于新增加的工业品数据,对关联数据进行更新,实现工业品知识图谱的实时更新(该更新涉及局部的知识图谱内容修改),当监测到新增数据的量大于预设阈值时,会启动知识图谱的完整构建过程,实现工业品知识图谱的实时更新(该更新涉及知识图谱整体的重新构建)。0028参见图3,在一种实施方式中,对所述客服对话数据进行预处理和结构。
30、化处理,该处理步骤包括:步骤A1,基于语音转文字算法,获取客服对话对应的对话文本;步骤A2,基于大语言模型将语音转文字算法得到的对话文本进行优化、并转换为统一的问答格式结构化数据。0029由于语音转文字技术在处理方言时存在一定的局限性,导致转换后的文字可能会出现表达不流畅、语义不通顺等问题,传统上这类问题只能通过人工干预进行处理。为了提高处理效率并降低人工干预成本,本申请创新性地采用了基于大语言模型的文字优化技术,通过思维链的方式对客服问答进行优化。具体来说,该技术可以识别并修正文字内容中的模糊、不准确或错误部分,确保输出的文字更加清晰、准确且易于理解。此外,该技术还可以对文字进行适当的转化,。
31、使其更符合标准普通话的表述方式,从而提升客服问答的可读性和易理解性。由于该模型经过超大规模语料库的训练,可以模拟出各种人类语言模式,从而更好地理解和处理低质量的文字。本申请中利用大语言模型识别并自动修正文本中的语说明书5/8 页9CN 117540004 A9法错误、拼写错误、标点符号错误等,从而输出更加准确的文本。0030原始的客服问答:哎喂你好喂你好哎你好哎你好我知道你们这个优采优质你遇到什么问题嗯其实就是我这个下载这个控件嘛不是要电子签章吗嗯我这个电脑是苹果电脑这个没有现在这个没没有没有我们暂时这边没有苹果系统的不支持是吧那对对不要这个可以签章吗呃您这边的话如果暂时先用不了的话呢您可以先。
32、去报名报名的时候它有个弹窗选项呃让您这边的话呢去去去去继续报名要上传报价单的时候您选择上传报价单图片好吧嗯上传报价单图片对对对嗯我这个电话那样的话那这个没有办法因为我们现在这个暂时没有那个苹果系统的嗯行行嗯嗯嗯好好嗯嗯嗯好好处理后的格式化回答:QA:question:我想下载控件用于电子签章,但是我的电脑是苹果电脑,不支持该控件,该怎么办?,answer:目前我们暂时没有苹果系统的控件,不支持苹果电脑。您可以选择其他支持的设备进行签章。,question:我想上传报价单,但是不知道如何操作,该怎么办?,answer:您可以先进行报名,上传报价单的时候选择上传报价单图片即可。在一种实施方式中,上。
33、述步骤A2中,基于大语言模型将语音转文字算法得到的对话文本进行优化、并转换为统一的问答格式结构化数据,包括:步骤A21,根据对话文本进行预处理,包括分词、去除停用词;步骤A22,根据对话文本中的文字内容,生成候选问题;步骤A23,基于候选问题和对话文本中的句子进行关联性匹配,获取确定问题;步骤A24,基于确定问题在对话文本中的文字内容中搜索关联的候选的答案内容,基于候选的答案内容生成多个第一候选答案;步骤A25,基于确定问题和对话文本中的文字内容联合输入模型中,获取第二候选答案;步骤A26,基于第一候选答案和第二候选答案结合确定目标答案。0031其中,生成候选问题,可以是基于训练完成的文本生成。
34、网络实现,也可以基于对话文本中的文字内容基于命名实体识别、关系抽取等提取关键词并形成问题。获取候选答案,可以是基于文本生成网络实现,也可以基于文字内容和语义关联匹配确定。在一种实施方式中,本申请实施例中在生成候选问题和获取第二候选答案时,基于训练完成的文本生成网络实现。本申请实施例中一方面通过文本的文字内容搜索答案内容,另一方面通过模型说明书6/8 页10CN 117540004 A10对确定问题和对话文本中的文字内容进行联合分析生成答案,两者结合使得生成的答案更加全面,进一步可以基于第一候选答案和第二候选答案进行比较,择优确定目标答案。0032在一种实施方式中,上述步骤3中,分流模型的数据处。
35、理包括如下步骤:步骤31,将用户问题、相似问答数据、用户问题所属问题类别记为第一文本数据;步骤32,获取多个专家模型的属性功能描述文本,记为第二文本数据;步骤33,基于第一文本数据和第二文本数据进行适配性分析,确定与第一文本数据匹配的第二文本数据对应的专家模型。0033本申请实施例中,对于上述步骤32,基于第一文本数据和第二文本数据进行适配性分析,包括如下步骤:步骤321,将第一文本数据的用户问题所属问题类别和第二文本数据进行语义分析,并识别获取用户问题所属问题类别与所述第二文本数据的所属关系,记用户问题所属问题类别属于第二文本数据表征范围为第一情况,记用户问题所属问题类别包含第二文本数据表征。
36、范围为第二情况,记用户问题所属问题类别与第二文本数据表征范围无所属关系为第三情况;例如第二文本数据表征范围为“法律”,如果用户问题所属问题类别属于“招投标法律”,则属于第一情况;步骤322,在多个专家模型的对应的多个第二文本数据中存在第一情况时,优先在满足第一情况的第二文本数据对应的专家模型中进行所述适配性分析确定匹配的专家模型;步骤323,针对第一情况的第二文本数据及对应的专家模型,基于第一文本数据的用户问题、相似问答数据的关键词、用户问题所属问题类别的文本语义与第二文本数据进行语义关联性分析,选择与第一文本数据的文本语义关联性最大的第二文本数据对应的专家模型确定为匹配结果;步骤324,在不。
37、存在第一情况时,针对第二情况的第二文本数据及对应的专家模型,基于第一文本数据的用户问题、相似问答数据的关键词表征范围与第二文本数据表征范围分析所属关系,在第一文本数据的用户问题、相似问答数据的关键词表征范围属于第二文本数据表征范围时,选择与用户问题、相似问答数据的文本语义关联性最大的第二文本数据对应的专家模型确定为匹配结果,在第一文本数据的用户问题、相似问答数据的关键词表征范围大于第二文本数据表征范围时,基于第二文本数据对应的专家模型作为候选专家模型;步骤325,针对第三情况,根据用户问题、相似问答数据与第二文本数据的文本语义关联性择优选择候选专家模型;步骤326,在不确定唯一匹配的专家模型时。
38、,基于所有候选专家模型作为分流模型的结果并经过人工确认唯一匹配的专家模型。0034参见图4,本申请实施例提供了一种基于知识图谱和用户行为的工业领域智能问答系统,该系统包括:用户问题接收单元,用于接收用户输入的问题;用户意图识别单元,用于基于用户问题和用户在平台上的历史操作行为,对用户问题进行决策性分类,获取用户问题所属问题类别;分流单元,用于基于用户问题在数据库中搜索相似问答数据,基于相似问答数据、说明书7/8 页11CN 117540004 A11用户问题、用户问题所属问题类别输入分流模型,所述分流模型用于基于输入数据通过分析在多个已有的专家模型中匹配一个用于处理用户问题的专家模型,每个所述。
39、专家模型用于处理一类问题类型的用户问题;问题语义增强单元,用于基于用户输入的问题调用预先构建的知识图谱增强用户问题的语义;答案获取单元,用于基于语义增强后的用户问题输入步骤3匹配的专家模型,获取用户问题的回答数据。0035需要说明的是:本实施例提供的基于知识图谱和用户行为的工业领域智能问答系统在处理工业品领域问题时,仅以上述各功能单元的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成,即将装置的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。另外,本实施例提供的基于知识图谱和用户行为的工业领域智能问答系统与上述实施例提供的基于知识图谱和用户行为的工。
40、业领域智能问答方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。0036本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。0037本申请实施例提供了一种电子设备,该电子设备包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器通过运行所述可执行指令以实现上述基于知识图谱和用户行为的工业领域智能问答方法的步骤。其中,电子设备的处理器用于提供计算和控制能力,电子设备的存储器包括非易失性存储介质、内存储器,该存储器和。
41、处理器通过系统总线相连;所述可执行指令被所述处理器执行时实现上述基于知识图谱和用户行为的工业领域智能问答方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。0038本申请实施例提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被处理器执行时实现基于知识图谱和用户行为的工业领域智能问答方法的步骤。该计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体,是可以保留和存储供指令执行设备所使用指令的有形设备,例如静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)等。0039本发明不局限于上述具体的实施方式,本领域的普通技术人员从上述构思出发,不经过创造性的劳动,所做出的种种变换,均落在本发明的保护范围之内。说明书8/8 页12CN 117540004 A12图 1说明书附图1/4 页13CN 117540004 A13图 2说明书附图2/4 页14CN 117540004 A14图 3说明书附图3/4 页15CN 117540004 A15图 4说明书附图4/4 页16CN 117540004 A16。