交互数据的生成方法、装置、电子设备及存储介质.pdf

上传人:g**** 文档编号:14328731 上传时间:2024-01-22 格式:PDF 页数:22 大小:2.91MB
返回 下载 相关 举报
交互数据的生成方法、装置、电子设备及存储介质.pdf_第1页
第1页 / 共22页
交互数据的生成方法、装置、电子设备及存储介质.pdf_第2页
第2页 / 共22页
交互数据的生成方法、装置、电子设备及存储介质.pdf_第3页
第3页 / 共22页
点击查看更多>>
资源描述

《交互数据的生成方法、装置、电子设备及存储介质.pdf》由会员分享,可在线阅读,更多相关《交互数据的生成方法、装置、电子设备及存储介质.pdf(22页珍藏版)》请在专利查询网上搜索。

1、(19)国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202310449896.0(22)申请日 2023.04.23(71)申请人 讯飞医疗科技股份有限公司地址 230031 安徽省合肥市高新区望江西路666号A5楼23-24层(72)发明人 贺志阳王黎成胡加学赵景鹤鹿晓亮王士进魏思刘聪胡国平(74)专利代理机构 北京布瑞知识产权代理有限公司 11505专利代理师 尚文文(51)Int.Cl.G06F 18/214(2023.01)G06F 18/15(2023.01)G06N 20/00(2019.01)G16H 80/00(2018.01)G1。

2、6H 50/70(2018.01)G06F 16/332(2019.01)(54)发明名称一种交互数据的生成方法、装置、电子设备及存储介质(57)摘要本申请实施例提供一种交互数据的生成方法、装置、电子设备及存储介质,其中,所述交互数据的生成方法,包括:获取样本交互数据,所述样本交互数据,包括样本问诊问题,或者包括所述样本问诊问题和所述样本问诊问题对应的回答结果;对所述样本交互数据进行扩展处理,和/或进行改写处理,获得符合医患对话逻辑的第一交互数据;其中,所述改写处理,包括改写语句的表达方式;所述第一交互数据,包括至少一轮问答对话数据。该方法通过对样本交互数据进行改写和/或扩展处理,能够获得包含。

3、问诊问题和回答结果、且符合医患对话逻辑的第一交互数据,有利于就医咨询场景下的机器学习模型的训练。权利要求书2页 说明书15页 附图4页CN 116610947 A2023.08.18CN 116610947 A1.一种交互数据的生成方法,其特征在于,包括:获取样本交互数据,所述样本交互数据,包括样本问诊问题,或者包括所述样本问诊问题和所述样本问诊问题对应的回答结果;对所述样本交互数据进行扩展处理,和/或进行改写处理,获得符合医患对话逻辑的第一交互数据;其中,所述改写处理,包括改写语句的表达方式;所述第一交互数据,包括至少一轮问答对话数据。2.根据权利要求1所述的方法,其特征在于,还包括:获取数。

4、据生成指令,所述数据生成指令,用于指示生成的交互数据的内容要求;所述对所述样本交互数据进行扩展处理,和/或进行改写处理,获得符合医患对话逻辑的第一交互数据,包括:基于所述数据生成指令,对所述样本交互数据进行扩展处理,和/或进行改写处理,获得符合医患对话逻辑的第一交互数据。3.根据权利要求2所述的方法,其特征在于,所述基于所述数据生成指令,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据,包括:基于所述数据生成指令中的第一指令信息,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据;其中,所述第一指令信息,用于表示扩展生成的交互数据的数据内容要求。4.根据权利要。

5、求3所述的方法,其特征在于,所述基于所述数据生成指令中的第一指令信息,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据,包括:将所述样本交互数据和所述第一指令信息,输入预先训练的第一语言模型,以使所述第一语言模型按照所述第一指令信息,对所述样本交互数据进行扩展处理,获得所述第一交互数据。5.根据权利要求2所述的方法,其特征在于,所述基于所述数据生成指令,对所述样本交互数据进行改写处理,获得符合医患对话逻辑的第一交互数据,包括:基于所述数据生成指令中的第二指令信息,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据;其中,所述第二指令信息,用于表示改写生成的交互。

6、数据的数据内容要求。6.根据权利要求5所述的方法,其特征在于,所述基于所述数据生成指令中的第二指令信息,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据,包括:将所述样本交互数据和所述第二指令信息,输入预先训练的第二语言模型,以使所述第二语言模型按照所述第二指令信息,对所述样本交互数据进行改写处理,获得所述第二交互数据。7.根据权利要求1所述的方法,其特征在于,还包括:将所述第一交互数据作为训练样本,对预先构建的第三语言模型进行问答对话训练;其中,所述第三语言模型,用于根据问诊问题,生成用于回答所述问诊问题的回答结果;基于所述问诊问题和所述第三语言模型,生成符合医患对话逻辑的。

7、第二交互数据。8.根据权利要求7所述的方法,其特征在于,所述基于所述问诊问题和所述第三语言模型,生成符合医患对话逻辑的第二交互数据,包括:向所述第三语言模型输入问诊问题,以使所述第三语言模型输出与输入问诊问题相对权利要求书1/2 页2CN 116610947 A2应的回答结果;其中,向所述第三语言模型输入的问诊问题,包括:与所述第三模型输出的回答结果对应的问题;根据输入所述第三语言模型的问诊问题,以及所述第三语言模型输出的与输入问诊问题相对应的回答结果,生成所述第二交互数据。9.根据权利要求7所述的方法,其特征在于,还包括:利用预先训练的患者对话模型和预先训练的医生对话模型,模拟医患对话交互过。

8、程,获得所述患者对话模型和所述医生对话模型输出的交互数据对;其中,所述交互数据对,包括:所述患者对话模型生成的问诊问题,以及所述医生对话模型基于所述问诊问题生成的回答结果;将所述患者对话模型和所述医生对话模型输出的交互数据对,作为符合医患对话逻辑的第三交互数据。10.根据权利要求9所述的方法,其特征在于,所述利用预先训练的患者对话模型和预先训练的医生对话模型,模拟医患对话交互过程,获得所述患者对话模型和所述医生对话模型输出的交互数据对,包括:将预设的场景标签输入所述患者对话模型,以使所述患者对话模型生成符合所述场景标签的问诊问题;所述场景标签用于表示生成的交互数据的数据内容要求;将所述问诊问题。

9、输入所述医生对话模型,以使所述医生对话模型基于所述问诊问题进行问题回答,生成与所述问诊问题对应的回答结果。11.根据权利要求9所述的方法,其特征在于,所述患者对话模型和所述医生对话模型,基于所述第一交互数据,和/或所述第二交互数据进行医患对话交互训练得到。12.一种交互数据的生成装置,其特征在于,包括:第一单元,用于获取样本交互数据,所述样本交互数据,包括样本问诊问题,或者包括所述样本问诊问题和所述样本问诊问题对应的回答结果;第二单元,用于对所述样本交互数据进行扩展处理,和/或进行改写处理,获得符合医患对话逻辑的第一交互数据;其中,所述改写处理,包括改写语句的表达方式;所述第一交互数据,包括至。

10、少一轮问答对话数据。13.一种电子设备,其特征在于,包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于通过运行所述存储器中的指令,执行权利要求110任意一项所述的交互数据的生成方法。14.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器运行时,执行权利要求110中任意一项所述的交互数据的生成方法。权利要求书2/2 页3CN 116610947 A3一种交互数据的生成方法、装置、电子设备及存储介质技术领域0001本申请涉及数据处理领域,具体涉及一种交互数据的生成方法、装置、电子设备及存储介质。背景技术0002随着计算机技术和通信技术的迅猛。

11、发展,基于人工智能实现的就医咨询逐渐走入人们的生活。0003现有技术中,为了实现基于人工智能的就医咨询,需要基于机器学习模型,针对用户提出的问题给出合理的回答,但目前,对于此种类型的机器学习模型的训练数据,大多基于互联网的在线医患对话平台收集,或者基于规则的人机对话系统收集,但此种收集数据的方式涵盖的场景范围较窄,且收集数据的方式较为单一,无法满足就医咨询场景下的机器模型的训练。发明内容0004为了收集用于就医咨询场景下的机器模型的训练样本,本申请实施例提供一种交互数据的生成方法、装置、电子设备及存储介质。0005根据本申请实施例的第一方面,提供了一种交互数据的生成方法,包括:0006获取样本。

12、交互数据,所述样本交互数据,包括样本问诊问题,或者包括所述样本问诊问题和所述样本问诊问题对应的回答结果;0007对所述样本交互数据进行扩展处理,和/或进行改写处理,获得符合医患对话逻辑的第一交互数据;其中,所述改写处理,包括改写语句的表达方式;所述第一交互数据,包括至少一轮问答对话数据。0008在本申请的一种可选实施方式中,还包括:获取数据生成指令,所述数据生成指令,用于指示生成的交互数据的内容要求;0009所述对所述样本交互数据进行扩展处理,和/或进行改写处理,获得符合医患对话逻辑的第一交互数据,包括:0010基于所述数据生成指令,对所述样本交互数据进行扩展处理,和/或进行改写处理,获得符合。

13、医患对话逻辑的第一交互数据。0011在本申请的一种可选实施方式中,所述基于所述数据生成指令,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据,包括:0012基于所述数据生成指令中的第一指令信息,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据;0013其中,所述第一指令信息,用于表示扩展生成的交互数据的数据内容要求。0014在本申请的一种可选实施方式中,所述基于所述数据生成指令中的第一指令信息,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据,包括:0015将所述样本交互数据和所述第一指令信息,输入预先训练的第一语言模型,以使说明书1/15。

14、 页4CN 116610947 A4所述第一语言模型按照所述第一指令信息,对所述样本交互数据进行扩展处理,获得所述第一交互数据。0016在本申请的一种可选实施方式中,所述基于所述数据生成指令,对所述样本交互数据进行改写处理,获得符合医患对话逻辑的第一交互数据,包括:0017基于所述数据生成指令中的第二指令信息,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据;0018其中,所述第二指令信息,用于表示改写生成的交互数据的数据内容要求。0019在本申请的一种可选实施方式中,所述基于所述数据生成指令中的第二指令信息,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据。

15、,包括:0020将所述样本交互数据和所述第二指令信息,输入预先训练的第二语言模型,以使所述第二语言模型按照所述第二指令信息,对所述样本交互数据进行改写处理,获得所述第二交互数据。0021在本申请的一种可选实施方式中,还包括:0022将所述第一交互数据作为训练样本,对预先构建的第三语言模型进行问答对话训练;其中,所述第三语言模型,用于根据问诊问题,生成用于回答所述问诊问题的回答结果;0023基于所述问诊问题和所述第三语言模型,生成符合医患对话逻辑的第二交互数据。0024在本申请的一种可选实施方式中,所述基于所述问诊问题和所述第三语言模型,生成符合医患对话逻辑的第二交互数据,包括:0025向所述第。

16、三语言模型输入问诊问题,以使所述第三语言模型输出与输入问诊问题相对应的回答结果;其中,向所述第三语言模型输入的问诊问题,包括:与所述第三模型输出的回答结果对应的问题;0026根据输入所述第三语言模型的问诊问题,以及所述第三语言模型输出的与输入问诊问题相对应的回答结果,生成所述第二交互数据。0027在本申请的一种可选实施方式中,还包括:0028利用预先训练的患者对话模型和预先训练的医生对话模型,模拟医患对话交互过程,获得所述患者对话模型和所述医生对话模型输出的交互数据对;其中,所述交互数据对,包括:所述患者对话模型生成的问诊问题,以及所述医生对话模型基于所述问诊问题生成的回答结果;0029将所述。

17、患者对话模型和所述医生对话模型输出的交互数据对,作为符合医患对话逻辑的第三交互数据。0030在本申请的一种可选实施方式中,所述利用预先训练的患者对话模型和预先训练的医生对话模型,模拟医患对话交互过程,获得所述患者对话模型和所述医生对话模型输出的交互数据对,包括:0031将预设的场景标签输入所述患者对话模型,以使所述患者对话模型生成符合所述场景标签的问诊问题;所述场景标签用于表示生成的交互数据的数据内容要求;0032将所述问诊问题输入所述医生对话模型,以使所述医生对话模型基于所述问诊问题进行问题回答,生成与所述问诊问题对应的回答结果。0033在本申请的一种可选实施方式中,所述患者对话模型和所述医。

18、生对话模型,基于说明书2/15 页5CN 116610947 A5所述第一交互数据,和/或所述第二交互数据进行医患对话交互训练得到。0034根据本申请实施例的第二方面,提供了一种交互数据的生成装置,包括:0035第一单元,用于获取样本交互数据,所述样本交互数据,包括样本问诊问题,或者包括所述样本问诊问题和所述样本问诊问题对应的回答结果;0036第二单元,用于对所述样本交互数据进行扩展处理,和/或进行改写处理,获得符合医患对话逻辑的第一交互数据;其中,所述改写处理,包括改写语句的表达方式;所述第一交互数据,包括至少一轮问答对话数据。0037根据本申请实施例的第三方面,提供了一种电子设备,包括:0。

19、038处理器;0039用于存储所述处理器可执行指令的存储器;0040所述处理器,用于通过运行所述存储器中的指令,执行上述交互数据的生成方法。0041根据本申请实施例的第四方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器运行时,执行上述交互数据的生成方法。0042与现有技术相比,本申请具有以下优点:0043本申请实施例提供一种交互数据的生成方法、装置、电子设备及存储介质,其中,所述交互数据的生成方法,包括:获取样本交互数据,所述样本交互数据,包括样本问诊问题,或者包括所述样本问诊问题和所述样本问诊问题对应的回答结果;对所述样本交互数据进行扩展处理,和/或进。

20、行改写处理,获得符合医患对话逻辑的第一交互数据;其中,所述改写处理,包括改写语句的表达方式;所述第一交互数据,包括至少一轮问答对话数据。该方法通过对样本交互数据进行改写和/或扩展处理,能够获得包含问诊问题和回答结果、且符合医患对话逻辑的第一交互数据,有利于就医咨询场景下的机器学习模型的训练。附图说明0044为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。0045图1为本申请一实施例提供的交互。

21、数据的生成方法流程图;0046图2为本申请另一实施例提供的样本交互数据的扩展流程图;0047图3为本申请另一实施例提供的样本交互数据的改写流程图;0048图4为本申请另一实施例提供的第二交互数据的生成方法流程图;0049图5为本申请另一实施例提供的第三交互数据的生成方法流程图;0050图6为本申请另一实施例提供的交互数据的生成装置结构示意图;0051图7为本申请另一实施例提供的电子设备结构示意图。具体实施方式0052下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技。

22、术人员在没有做出创造性劳动前提下所获得的所有其他说明书3/15 页6CN 116610947 A6实施例,都属于本申请保护的范围。0053随着计算机技术和通信技术的迅猛发展,基于人工智能实现的就医咨询逐渐走入人们的生活。0054现有技术中,为了实现基于人工智能的就医咨询,需要基于机器学习模型针对用户提出的问题给出合理的回答,但目前,对于此种类型的机器学习模型的训练数据,大多基于互联网的在线医患对话平台收集,或者基于规则的人机对话系统收集,但此种收集数据的方式涵盖的场景范围较窄,且收集数据的方式较为单一,无法满足就医咨询场景下的机器模型的训练。0055有鉴于此,本申请实施例提供一种交互数据的生成。

23、方法、装置、电子设备及存储介质,收集就医咨询场景下的交互数据,以便于就医咨询场景下的机器学习模型的训练。0056示例性方法0057本申请实施例提供一种交互数据的生成方法,该方法可应用于具有人机交互功能的处理设备,例如:智能终端,包括但不限于智能手持终端、智能可穿戴设备,或者是智能移动载体、服务器等。0058请参考图1,图1为本申请一实施例提供的交互数据的生成方法流程图。0059如图1所示,所述交互数据的生成方法包括以下步骤S101至步骤S102:0060步骤S101,获取样本交互数据,所述样本交互数据,包括样本问诊问题,或者包括所述样本问诊问题和所述样本问诊问题对应的回答结果。0061所述样本。

24、交互数据,可以理解为一种医生和患者,或者患者与自动问诊系统之间的交互对话数据,所述样本交互数据可以采用医生与患者之间的通过记录,或者采用自动问诊系统中记录的患者与该系统之间的交互数据,也可以是一种开源的对话数据。对此,本申请不做限制。0062需要说明的是,在本申请实施例中,所述样本交互数据可以仅包括一个由患者提出的问诊问题,例如:医生您好,我头疼,这个要不要紧,是什么原因呢;也可以包括:患者与医生(或自动问诊系统)交互产生的至少一个问答对,例如:所述问答对中可以包括:患者提出的问题“医生您好,我头疼,这个要不要紧,是什么原因呢”,以及,医生(或自动问诊系统)就问题给出的回答“头疼多长时间啦”。。

25、0063步骤S102,对所述样本交互数据进行扩展处理,和/或进行改写处理,获得符合医患对话逻辑的第一交互数据;其中,所述改写处理,包括改写语句的表达方式;所述第一交互数据,包括至少一轮问答对话数据。0064所述对所述样本交互数据进行扩展处理,和/或进行改写处理,是指对所述样本交互数据进行对话的续写以及对话的改写。0065首先,对所述样本交互数据的扩展,在通过交互数据训练用于回答患者问诊问题,以及与患者进行对话交流的机器学习模型的过程中,通常需要一段完整的对话过程,以训练该机器学习模型的上下文理解、推理能力、该机器学习模型的对于一些代指的名词(例如:这个病、这些东西等内容)的理解能力,以及该机器。

26、学习模型对于一些意图模糊的对话的理解能力等等。0066因此,在样本交互数据包含的内容较少的情况下,需要对样本交互数据进行内容补充。说明书4/15 页7CN 116610947 A70067其次,在通过交互数据训练用于回答患者问诊问题,以及与患者进行对话交流的机器学习模型的过程中,需要尽可能的使机器学习模型能够了解到患者向模型中输入语句的含义,但一些自动问诊系统生成的交互数据中,存在大量的模板式的对话数据,以及一些生硬的回复话术(例如,一些点选式的自动问诊系统生成的交互数据),这些交互数据并不利于机器学习模型的训练。0068因此,在样本交互数据中的内容存在模板式对话,或一些生硬的回复话术的情况下。

27、,需要对样本交互数据进行内容改写。0069具体的,在对所述样本交互数据进行扩展处理,和/或进行改写处理之前,所述方法还包括:获取数据生成指令,所述生成指令,用于指示生成的交互数据的内容要求。0070所述数据生成指令,可以理解为一种用于描述生成的交互数据的内容的要求文本。0071例如,在本申请的一种可选实施方式中,所述数据生成指令可以是“请基于下面患者问题,模拟医患对话,生成多轮交互数据”;0072也可以是“请基于下面患者问题,模拟医患对话,生成具有推理或者上下文具有指代关系的多轮交互数据”;0073也可以是“下面是一段医患对话以及最终诊断结果,请对对话内容进行改写,同时让患者的回复更长一些,得。

28、到更合理的对话”;0074也可以是“下面是一段医患对话以及最终诊断结果,请对对话内容进行改写,同时让患者的回复更长一些,得到口语化强、具有上下文指代关系的对话”。0075需要说明的是,以上对所述数据生成指令的介绍只是为了便于理解所述数据生成指令的具体形式,并非用于对所述数据生成指令的内容进行限定。0076进一步的,在上述步骤S102中,所述对所述样本交互数据进行扩展处理,和/或进行改写处理,获得符合医患对话逻辑的第一交互数据,包括:0077基于所述数据生成指令,对所述样本交互数据进行扩展处理,和/或进行改写处理,获得符合医患对话逻辑的第一交互数据。0078在本申请的一种可选实施方式中,所述基于。

29、所述数据生成指令,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据,包括:0079基于所述数据生成指令中的第一指令信息,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据;0080其中,所述第一指令信息,用于表示扩展生成的交互数据的数据内容要求。0081具体的,所述基于所述数据生成指令中的第一指令信息,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据,是指将所述样本交互数据和所述第一指令信息,输入预先训练的第一语言模型,以使所述第一语言模型按照所述第一指令信息,对所述样本交互数据进行扩展处理,获得所述第一交互数据。0082其中,所述第一语言模。

30、型可以理解为一种用于预测自然语言文本序列的学习模型,具体用于根据已有的语言数据,通过统计分析和机器学习等方法,建立一个概率模型来预测一个字、词或句子的出现概率。具体来说,所述第一语言模型可以用于评估一个给定的句子或者文档的合理性、生成新的语言文本、进行自动翻译、语音识别等任务。在自然语言处理领域,语言模型是一个重要的基础模板,广泛应用于机器翻译、语音识别、文本生成、问说明书5/15 页8CN 116610947 A8答系统等多个领域。0083在本申请的一种可选实施方式中,所述第一语言模型可以一种LLM对话系统(Linguistic Logic Machine Conversation Syst。

31、em),例如:ChatGPT,也可以是一种利用对话样本训练的具有对话能力的机器学习模型,对此,本申请不做限制。0084进一步的,为了更好的理解上述对所述样本交互数据的扩展过程,以下结合图2对该过程进行详细介绍。0085请参考图2,图2为本申请另一实施例提供的样本交互数据的扩展流程图。0086如图2所示,图2中包括:第一指令信息201、问诊问题202、第一语言模型203,以及第一交互数据204。0087其中,第一指令信息201具体为:基于下面的问诊问题,请模拟医患对话,生成多轮交互过程,要求生成具有推理或者上下文指代的多轮对话。0088问诊问题202具体为:1月11日开始发烧,开始时多是下午发烧。

32、,不发烧时像正常人一样,发烧时多是高烧,38度以上,也无其他症状,胸片拍了没事,验尿也没事,就是血常规,白细胞12.8,稍高,已经持续打了10天消炎针了,期间有两天不发烧,现在还是发烧,吃药就退,退完还是发烧。0089将第一指令信息201和问诊问题202输入第一语言识别模型203后,第一语言识别模型203按照第一指令信息201对问诊问题202进行扩展,得到第一交互数据204。0090其中,第一交互数据204具体为以下一段交互数据:0091患者:1月11日开始发烧,开始时多是下午发烧,不发烧时像正常人一样,发烧时多是高烧,38度以上,也无其他症状,胸片拍了没事,验尿也没事,就是血常规,白细胞12。

33、.8,稍高,已经持续打了10天消炎针了,期间有两天不发烧,现在还是发烧,吃药就退,退完还是发烧。0092医生:您的症状表明您可能正在患上某种感染性疾病,但目前的检查结果并不明确,建议进一步进行全面的检查,以便确定病因并采取正确的治疗方案。此外,您可能需要更多的休息和保持充足的饮食和水分摄入。如果发烧和其他症状继续存在,请立即就医。0093患者:我已经持续打了10天消炎针了,为什么还是发烧?0094医生:消炎针可以帮助抑制感染,但并不能解决感染的根本原因。如果您的症状一直存在,可能需要更进一步的检查,以便更好的理解疾病的病因,建议您咨询专业医生,并告知他们您的症状和之前的治疗情况,以便他们能更好。

34、的指导您接下来的治疗方案。0095在本申请的另一种可选实施方式中,所述基于所述数据生成指令,对所述样本交互数据进行改写处理,获得符合医患对话逻辑的第一交互数据,包括:0096基于所述数据生成指令中的第二指令信息,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第一交互数据;0097其中,所述第二指令信息,用于表示改写生成的交互数据的数据内容要求。0098具体的,所述基于所述数据生成指令中得第二指令信息,对所述样本交互数据进行扩展处理,获得符合医患对话逻辑的第二交互数据,是指将所述样本交互数据和所述第二指令信息,输入预先训练的第二语言模型,以使所述第二语言模型按照所述第二指令信息,对所述样。

35、本交互数据进行改写处理,获得所述第二交互数据。0099与所述第一语言模型类似的,所述第二语言模型也是一种用于预设自然语言文本说明书6/15 页9CN 116610947 A9序列的学习模型,对于所述第二语言模型,可参考上文对所述第一语言模型的相关说明,此处不再赘述。0100进一步的,为了更好的理解上述对所述样本交互数据的改写过程,以下结合图3对该过程进行详细介绍。0101请参考图3,图3为本申请另一实施例提供的样本交互数据的改写流程图。0102如图3所示,图3中包括:第二指令信息301、样本交互数据302、第二语言模型303,以及第一交互数据304。0103其中,第二指令信息301具体为:下面。

36、是一段医患对话以及最终诊断结果,要求对对话内容进行改写,同时患者回复更长一些,得到更合理的对话,并按照医生的角色基于诊断结果给出一段较长的专业性总结,及治疗建议、处理措施。0104样本交互数据302具体为:0105患者:吃完晚饭后胃疼。医生:胃疼多长时间了?0106患者:1小时。医生:是在什么情况下开始胃痛的,比如:无明显诱因、受凉后、饮食不洁后、空腹时等。0107患者:进食后。医生:疼痛的特点是怎样的,比如:持续性、阵发性、一过性、转移性右下腹痛等。0108患者:一过性。医生:疼痛的感受是什么样的,比如:胀痛、绞痛、隐痛等。0109患者:隐痛、胀痛。医生:疼痛是否扩散到以下的部位,比如:无、。

37、右肩部、右上肢、腹股沟等。0110患者:无。医生:可以通过以下的方式缓解疼痛吗,比如:不能、改变体位后、休息后、服药后等。0111患者:改变体位后、休息后。医生:是否有以下症状,比如:恶心、呕吐、嗳气、发热等。0112患者:不清楚,嗳气。医生:诊断为胃食管反流。0113将第二指令信息301和样本交互数据302输入第二语言识别模型后,第二语言模型303按照第二指令信息301对样本交互问题进行扩展,得到第一交互数据304。0114其中,第一交互数据304具体为以下一段交互数据:0115医生:您好,请问您有什么不舒服?患者:吃完晚饭后感到胃疼。0116医生:疼痛已经持续多长时间了?患者:大约一个小时。

38、。0117医生:是在什么情况下开始感到胃疼的呢?比如说:受凉、饮食不洁、空腹等情况?患者:在进食后开始感到胃疼。0118医生:胃疼的特点是什么样的呢?比如说,胀痛、绞痛、隐痛等?患者:感觉是隐痛和胀痛。0119医生:疼痛是否扩散到了以下的部位呢?比如说,右肩部、右上肢、腹股沟等?患者:没有扩散到其他部位。0120医生:哪有什么方法可以缓解这种疼痛吗?比如说,改变体位后、休息后、服药后等?患者:改变体位和休息一下可以缓解疼痛。0121医生:好的,请问还有其他症状吗?比如说,恶心、呕吐、嗳气、发热等?患者:不太清楚,可能有嗳气。说明书7/15 页10CN 116610947 A100122医生:经。

39、过检查和询问,您被诊断为患有胃食管反流的症状。它是一种常见的胃肠道疾病,即可反复发作,也可长期反复。引起症状的原因是胃内容物回流,因此治疗的方向是控制胃酸分泌和减少食管和胃之间的流体反流,从而减轻症状。对于轻症患者,我们通常会建议您改变饮食习惯、避免过饱、低脂饮食、戒烟戒酒等,同时也可以服用一些胃肠道保护剂和抗酸药物。对于重症患者,可能需要进行内窥镜检查并选择合适的手术治疗,以达到环节疼痛和恢复肠胃功能的目的。0123可以理解的,以上在对所述样本交互数据进行扩展处理和改写处理,得到的第一交互数据,是以所述样本交互数据为基础,以所述数据生成指令为标准进行的。0124因此,为了使通过第一交互数据训。

40、练的机器学习模型能够根据患者问诊问题中包含的症状、指标数值的描述、药品、症状部位等信息的描述,不断推理出患者最可能具有的潜在病因,所述数据生成指令中可以包括:0125使得扩展或改写得到的第一交互数据具有上下文推理过程的数据生成指令。0126进一步的,为了使通过第一交互数据训练的机器学习模型能够理解患者输入的一些名词实体的代词,所述数据生成指令中可以包括:0127使得扩展或改写得到的第一交互数据具有基于上下文信息理解指代名词的数据生成指令。0128进一步的,考虑到患者与医生进行交互的过程中,可能会出现患者意图随时跳转,或者患者表达的内容前后矛盾的情况,为了使机器学习模型能够准确识别用户当前的意图。

41、与历史上下文之间的关系,并给出准确的回复,所述数据生成指令中可以包括:0129使得扩展或改写得到的第一交互数据中患者的交互数据前后矛盾、有意图跳转的情况的数据生成指令。0130进一步的,考虑到患者与医生进行交互的过程中,可能会出现无法明确患者意图的交互信息,此时,需要医生对患者的情况进行主动问询,进而明确患者意图,并给出主动回复。为了提高机器学习模型主动问询的能力,所述数据生成指令中还可以包括:0131使得扩展或改写得到的第一交互数据中出现无法明确患者意图的患者交互数据的数据生成指令。0132在基于所述样本交互数据进行扩展处理,和/或改写处理,得到符合医患对话的第一交互数据后,考虑到基于样本交。

42、互数据改写得到的内容覆盖的场景单一,仅能覆盖样本交互数据中的特定疾病和症状,以及一些常见的疾病或症状,无法涉及更多的场景。0133因此,在本申请的另一种可选实施方式中,所述方法还包括以下步骤S103和步骤S104:0134步骤S103,将所述第一交互数据作为训练样本,对预先构建的第三语言模型进行问答对话训练;其中,所述第三语言模型,用于根据问诊问题,生成用于回答所述问诊问题的回答结果。0135与前文提到的第一语言模型和第二语言模型类似的,所述第三语言模型类似,也是一种用于预测自然语言文本序列的学习模型,在本申请实施例中,所述第三语言模型用于模拟医生与患者对话,。0136具体的,所述预先构建的第。

43、三语言模型可以基于开源的交互数据和一些基于现有的医患对话整合得到的交互数据训练,是一种具有基础对话能力的语言模型,所述预先训说明书8/15 页11CN 116610947 A11练的第三语言模型可以是一种开源的LLM(Linguistic Logic Machine)模型。0137进一步的,在获得所述预先构建的第三语言模型后,可以基于所述第一交互数据对所述第三语言模型进行微调训练。0138步骤S104,基于所述问诊问题和所述第三语言模型,生成符合医患对话逻辑的第二交互数据。0139具体的,上述步骤S104,包括:0140向所述第三语言模型输入问诊问题,以使所述第三语言模型输出与输入问诊问题相对。

44、应的回答结果;其中,向所述第三语言模型输入的问诊问题,包括:与所述第三模型输出的回答结果对应的问题;0141根据输入所述第三语言模型的问诊问题,以及所述第三语言模型输出的与输入问诊问题相对应的回答结果,生成所述第二交互数据。0142即,在获得训练好的第三语言模型后,可以通过相关工作人员模拟患者的身份,并结合相应的场景、疾病,与所述第三语言模型进行对话,并结合所述交互要求信息(所述交互要求信息与所述交互指令信息类似,用于指示生成交互数据的内容要求,需要说明的是,此过程也可以通过类似上述步骤S101和步骤S102的方式进行,对此,本申请不做限制)对对话产生的交互数据进行修改,生成符合医患对话逻辑的。

45、第二交互数据,作为用于训练具有对话能力的机器学习模型的训练样本。0143在本申请的一种可选实施方式中,为了便于相关工作人员的工作体验,也可以在获得第三语言模型后,将所述第三语言模型整合至医患交流平台,以便于收集所述第二交互数据。0144进一步的,为了便于理解本申请提到的上述步骤S103和步骤S104提供的方法,以下结合图4对该过程进行详细介绍。0145请参考图4,图4为本申请另一实施例提供的第二交互数据的生成方法流程图。0146如图4所示,图4中包括第三语言模型401、第一交互数据402。0147其中,第一交互数据402主要用于对第三语言模型401进行微调训练,在获得训练好的第三语言模型后,相。

46、关工作人员模拟患者,向第三语言模型输入交互对话403,获得第三语言模型输出的交互对话404,进而得到第二交互数据405。0148在基于上述步骤S103和步骤S104所述的方法获得第二交互数据后,考虑到第二交互数据的获取需要相关工作人员与第三语言模型进行交互,需要一定的人力成本。0149因为,为了便于节约人力成本,在本申请的另一种可选实施方式中,所述方法还包括以下步骤S105至步骤S106:0150步骤S105,利用预先训练的患者对话模型和预先训练的医生对话模型,模拟医患对话交互过程,获得所述患者对话模型和所述医生对话模型输出的交互数据对;其中,所述交互数据对,包括:所述患者对话模型生成的问诊问。

47、题,以及所述医生对话模型基于所述问诊问题生成的回答结果。0151所述患者对话模型可以理解为一种从患者角度出发,模拟医患对话的学习模型;类似的,所述医生对话模型可以理解为一种从医生角度出发,模拟医患对话的学习模型。与所述第三语言模型类似的,所述患者对话模型和所述医生对话模型都可以基于开源的交互数据构建这些模型的基础对话能力,然后基于所述第一交互数据和/或所述第二交互数据说明书9/15 页12CN 116610947 A12做进一步训练。0152具体的,上述步骤S105,包括:将预设的场景标签输入所述患者对话模型,以使所述患者对话模型生成符合所述场景标签的问诊问题;所述场景标签用于表示生成的交互数。

48、据的数据内容要求;将所述问诊问题输入所述医生对话模型,以使所述医生对话模型基于所述问诊问题进行问题回答,生成与所述问诊问题对应的回答结果。0153在本申请实施例中,所述预设的场景标签,可以理解是类似前文提到的数据生成指令,以便于指示所述患者对话模型率先给出对应的问诊问题(例如:医生,晚饭后胃疼是什么原因?)。0154其次,将所述问诊问题输入所述医生对话模型,以使所述医生对话模型基于所述问诊问题进行问题回答,生成与所述问诊问题对应的回答结果;0155之后,再将所述回答结果输入所述患者对话模型,以使所述患者模型模型基于所述回答结果与所述医生对话模型进行对话交互,生成与所述回答结果对应的交互文本;0。

49、156如此反复,得到患者对话模型与医生对话模型之间的交互数据作为所述交互数据,即,执行以下步骤S106。0157步骤S106,将所述患者对话模型和所述医生对话模型输出的交互数据对,作为符合医患对话逻辑的第三交互数据。0158具体的,所述患者对话模型和所述医生对话模型,基于所述第一交互数据,和/或所述第二交互数据进行医患对话交互训练得到。0159其中,所述患者对话模型在训练过程中使用的损失函数可以通过以下公式(1)表示:01600161其中,L表示患者对话模型的损失函数的损失值,x表示第一交互数据和/或第二交互数据中患者的问诊问题,y表示第一交互数据和/或第二交互数据中医生针对问诊问题的回答结果。

50、,m表示所述第一交互数据和/或第二交互数据中的第m条数据,M表示所述第一交互数据和/或第二交互数据中的数据总数,T表示所述第一交互数据和/或第二交互数据中的问答对话的总轮数;t表示所述第一交互数据和/或第二交互数据中的第t轮问答对话。0162进一步的,所述医生对话模型在训练过程中使用的损失函数可以通过以下公式(2)表示:01630164其中,L表示医生对话模型的损失函数的损失值,x表示第一交互数据和/或第二交互数据中患者的问诊问题,y表示第一交互数据和/或第二交互数据中医生针对问诊问题的回答结果,m表示所述第一交互数据和/或第二交互数据中的第m条数据,M表示所述第一交互数据和/或第二交互数据中。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1