信息分类方法及装置.pdf

上传人:e1 文档编号:1307135 上传时间:2018-04-14 格式:PDF 页数:15 大小:997.58KB
返回 下载 相关 举报
摘要
申请专利号:

CN201611179993.9

申请日:

2016.12.19

公开号:

CN106649696A

公开日:

2017.05.10

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20161219|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

北京云知声信息技术有限公司

发明人:

崇伟峰

地址:

100191 北京市海淀区花园路2号牡丹科技楼5层A503

优先权:

专利代理机构:

北京尚伦律师事务所 11477

代理人:

张俊国

PDF下载: PDF下载
内容摘要

本发明是关于一种信息分类方法及装置,其中,方法包括:获取用户已输入的历史语音数据信息对应的文本数据信息的意图分类日志记录;从意图分类日志记录中获取多个相似的查询请求对应的文本数据信息;根据多个相似的查询请求对应的文本数据信息、预设的卷积神经网络模型和预设的转移概率矩阵,确定用户意图分类模型和目标转移概率矩阵;使用用户意图分类模型和目标转移概率矩阵确定接收到的当前语音数据信息对应的当前文本数据信息所属的目标意图类别;在目标意图类别对应的数据库中查找与当前语音数据信息对应的应答信息。通过该技术方案,不但可以为用户提供更准确的应答信息,还可以减少查找时间,提高查找效率,提升用户的使用体验。

权利要求书

1.一种语音交互中确定用户意图的方法,其特征在于,包括:
获取用户已输入的历史语音数据信息对应的文本数据信息的意图分类日志记录;
从所述意图分类日志记录的每个意图分类中获取多个相似的查询请求对应的文本数
据信息;
根据所述每个意图分类中多个相似的查询请求对应的文本数据信息、预设的卷积神经
网络模型和预设的转移概率矩阵,确定用户意图分类模型和目标转移概率矩阵;
使用所述用户意图分类模型和目标转移概率矩阵确定接收到的当前语音数据信息对
应的当前文本数据信息所属的目标意图类别;
在所述目标意图类别对应的数据库中查找与所述当前语音数据信息对应的应答信息。
2.根据权利要求1所述的方法,其特征在于,根据所述每个意图分类中多个相似的查询
请求对应的文本数据信息、预设的卷积神经网络模型和预设的转移概率矩阵,确定用户意
图分类模型和目标转移概率矩阵,包括:
将所述每个意图分类中多个相似的查询请求对应的文本数据信息作为意图分类训练
语料,利用预设的卷积神经网络模型进行训练,得到用户意图分类模型;
获取所述每个意图分类中多个相似的查询请求对应的文本数据信息中任意两个相似
的查询请求对应的文本数据信息之间的上下文关系;
利用所述相似的查询请求对应的文本数据信息之间的上下文关系和所述预设的转移
概率矩阵进行训练,得到所述目标转移概率矩阵。
3.根据权利要求1所述的方法,其特征在于,所述文本数据信息包括以下至少一项:文
本信息和拼音信息;
所述意图分类训练语料包括以下至少一种形式:
文本语料和拼音预料。
4.根据权利要求1所述的方法,其特征在于,所述使用所述用户意图分类模型和目标转
移概率矩阵确定接收到的当前语音数据信息对应的当前文本数据信息所属的目标意图类
别,包括:
将所述当前文本数据信息作为所述用户意图分类模型的输入,得到所述当前文本数据
信息对应的第一分类结果;
获取所述当前文本数据信息对应的上一句文本数据信息所属的意图类别;
根据所述上一句文本数据信息所属的意图类别和所述目标转移概率矩阵,确定所述当
前文本数据信息对应的第二分类结果;
根据所述第一分类结果和所述第二分类结果确定所述当前文本数据信息所属的目标
意图分类。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一分类结果和所述第二分
类结果确定所述当前文本数据信息所属的目标意图分类,包括:
根据所述第一分类结果和所述第二分类结果的乘积,确定所述当前文本数据信息所属
的目标意图分类。
6.一种信息分类装置,其特征在于,包括:
第一获取模块,用于获取用户已输入的历史语音数据信息对应的文本数据信息的意图
分类日志记录;
第二获取模块,用于从所述意图分类日志记录的每个意图分类中获取多个相似的查询
请求对应的文本数据信息;
第一确定模块,用于根据所述每个意图分类中多个相似的查询请求对应的文本数据信
息、预设的卷积神经网络模型和预设的转移概率矩阵,确定用户意图分类模型和目标转移
概率矩阵;
第二确定模块,用于使用所述用户意图分类模型和目标转移概率矩阵确定接收到的当
前语音数据信息对应的当前文本数据信息所属的目标意图类别;
查找模块,用于在所述目标意图类别对应的数据库中查找与所述当前语音数据信息对
应的应答信息。
7.根据权利要求6所述的装置,其特征在于,所述第一确定模块包括:
第一训练子模块,用于将所述每个意图分类中多个相似的查询请求对应的文本数据信
息作为意图分类训练语料,利用预设的卷积神经网络模型进行训练,得到用户意图分类模
型;
第一获取子模块,用于获取所述每个意图分类中多个相似的查询请求对应的文本数据
信息中任意两个相似的查询请求对应的文本数据信息之间的上下文关系;
第二训练子模块,用于利用所述相似的查询请求对应的文本数据信息之间的上下文关
系和所述预设的转移概率矩阵进行训练,得到所述目标转移概率矩阵。
8.根据权利要求6所述的装置,其特征在于,所述文本数据信息包括以下至少一项:文
本信息和拼音信息;
所述意图分类训练语料包括以下至少一种形式:
文本语料和拼音预料。
9.根据权利要求6所述的装置,其特征在于,所述第二确定模块包括:
处理子模块,用于将所述当前文本数据信息作为所述用户意图分类模型的输入,得到
所述当前文本数据信息对应的第一分类结果;
第二获取子模块,用于获取所述当前文本数据信息对应的上一句文本数据信息所属的
意图类别;
第一确定子模块,用于根据所述上一句文本数据信息所属的意图类别和所述目标转移
概率矩阵,确定所述当前文本数据信息对应的第二分类结果;
第二确定子模块,用于根据所述第一分类结果和所述第二分类结果确定所述当前文本
数据信息所属的目标意图分类。
10.根据权利要求9所述的装置,其特征在于,所述第二确定子模块用于:
根据所述第一分类结果和所述第二分类结果的乘积,确定所述当前文本数据信息所属
的目标意图分类。

说明书

信息分类方法及装置

技术领域

本发明涉及数据分类技术领域,尤其涉及一种信息分类方法及装置。

背景技术

相关技术中,当终端等设备接收到用户输入的语音查询请求时,会根据该查询请
求从预设数据库中查找与该请求对应的答案或者回复,但在整个预设数据库中进行查找,
不但不能保证查找到的答案或者回复的准确性,而且查找时间也相对较长。

发明内容

本发明实施例提供一种信息分类方法及装置,用以实现在保证查找的答案或者回
复的准确率的基础上,提高查找效率,从而提升用户的使用体验。

根据本发明实施例的第一方面,提供一种信息分类方法,包括:

获取用户输入的历史语音数据信息对应的文本数据信息的意图分类日志记录;

从所述意图分类日志记录的每个意图分类中获取多个相似的查询请求对应的文
本数据信息;

根据所述每个意图分类中多个相似的查询请求对应的文本数据信息、预设的卷积
神经网络模型和预设的转移概率矩阵,确定用户意图分类模型和目标转移概率矩阵;

使用所述用户意图分类模型和目标转移概率矩阵确定接收到的当前语音数据信
息对应的当前文本数据信息所属的目标意图类别;

在所述目标意图类别对应的数据库中查找与所述语音数据信息对应的应答信息。

在该实施例中,在对历史语音数据信息进行分类后,可以获取意图分类日志记录,
并从该记录中获取每个意图类别中多个相似的查询请求对应的文本数据信息,进而根据多
个相似的查询请求对应的文本数据信息和预设的卷积神经网络模型和预设的转移概率矩
阵,确定用户意图分类模型和目标转移概率矩阵,并使用所述用户意图分类模型和目标转
移概率矩阵确定接收到的当前语音数据信息对应的当前文本数据信息所属的目标意图类
别,在所述目标意图类别对应的数据库中查找与所述语音数据信息对应的应答信息。这样,
不但可以为用户提供更准确的应答信息,还可以减少查找时间,提高查找效率,提升用户的
使用体验。

其中,历史语音数据信息,可以采用历史用户意图分类模型和历史目标转移概率
矩阵进行分类,这样,在分类的过程中,不断根据历史分类记录完善用户意图分类模型和目
标转移概率矩阵,从而使得分类准确率不断提高。

在一个实施例中,根据所述多个相似的查询请求对应的文本数据信息、预设的卷
积神经网络模型和预设的转移概率矩阵,确定用户意图分类模型和目标转移概率矩阵,包
括:

将所述多个相似的查询请求对应的文本数据信息作为意图分类训练语料,利用预
设的卷积神经网络模型进行训练,得到用户意图分类模型;

获取所述多个相似的查询请求对应的文本数据信息中任意两个相似的查询请求
对应的文本数据信息之间的上下文关系;

利用所述相似的查询请求对应的文本数据信息之间的上下文关系和所述预设的
转移概率矩阵进行训练,得到所述目标转移概率矩阵。

在该实施例中,利用所述意图分类训练语料和所述预设的卷积神经网络模型进行
训练,得到所述用户意图分类模型,利用相似的查询请求对应的文本数据信息之间的上下
文关系和预设的转移概率矩阵进行训练,得到目标转移概率矩阵这样,根据用户意图分类
模型和目标转移概率矩阵进行意图分类,可以保证分类结果的准确性。

在一个实施例中,所述文本数据信息包括以下至少一项:文本信息和拼音信息;

所述意图分类训练语料包括以下至少一种形式:

文本语料和拼音预料。

在该实施例中,在进行卷积神经网络训练时,不但可以采用训练语料的文本形式
进行训练,还可以采用训练语料的拼音形式进行训练,这样,可以有效的过滤噪音,避免错
误累积。

在一个实施例中,所述使用所述用户意图分类模型和目标转移概率矩阵确定接收
到的当前语音数据信息对应的当前文本数据信息所属的目标意图类别,包括:

将所述当前文本数据信息作为所述用户意图分类模型的输入,得到所述当前文本
数据信息对应的第一分类结果;

获取所述当前文本数据信息对应的上一句文本数据信息所属的意图类别;

根据所述上一句文本数据信息所属的意图类别和所述目标转移概率矩阵,确定所
述当前文本数据信息对应的第二分类结果;

根据所述第一分类结果和所述第二分类结果确定所述当前文本数据信息所属的
目标意图分类。

在一个实施例中,所述根据所述第一分类结果和所述第二分类结果确定所述当前
文本数据信息所属的目标意图分类,包括:

根据所述第一分类结果和所述第二分类结果的乘积,确定所述当前文本数据信息
所属的目标意图分类。

在该实施例中,将当前文本数据信息作为用户意图分类模型的输入,得到文本数
据信息对应的第一分类结果,该第一分类结果表明当前文本数据信息属于各个意图分类的
概率,其是一个1*N维的特征向量,并根据上一句文本数据信息和目标转移概率矩阵计算出
当前文本数据信息属于每个意图类别的概率矩阵,该矩阵可以是N*N维的,进而根据两者的
乘积得到文本数据信息属于每个意图类别的总概率,进而将总概率值最高对应的意图类别
确定为目标意图类别。

根据本发明实施例的第二方面,提供一种信息分类装置,包括:

第一获取模块,用于获取用户输入的历史语音数据信息对应的文本数据信息的意
图分类日志记录;

第二获取模块,用于从所述意图分类日志记录中获取多个相似的查询请求对应的
文本数据信息;

第一确定模块,用于根据所述多个相似的查询请求对应的文本数据信息、预设的
卷积神经网络模型和预设的转移概率矩阵,确定用户意图分类模型和目标转移概率矩阵;

第二确定模块,用于使用所述用户意图分类模型和目标转移概率矩阵确定接收到
的当前语音数据信息对应的当前文本数据信息所属的目标意图类别;

查找模块,用于在所述目标意图类别对应的数据库中查找与所述语音数据信息对
应的应答信息。

在一个实施例中,所述第一确定模块包括:

第一训练子模块,用于将所述多个相似的查询请求对应的文本数据信息作为意图
分类训练语料,利用预设的卷积神经网络模型进行训练,得到用户意图分类模型;

第一获取子模块,用于获取所述多个相似的查询请求对应的文本数据信息中任意
两个相似的查询请求对应的文本数据信息之间的上下文关系;

第二训练子模块,用于利用所述相似的查询请求对应的文本数据信息之间的上下
文关系和所述预设的转移概率矩阵进行训练,得到所述目标转移概率矩阵。

在一个实施例中,所述意图分类训练语料包括以下至少一种形式:

文本语料和拼音预料。

在一个实施例中,所述第二确定模块包括:

处理子模块,用于将所述当前文本数据信息作为所述用户意图分类模型的输入,
得到所述当前文本数据信息对应的第一分类结果;

第二获取子模块,用于获取所述当前文本数据信息对应的上一句文本数据信息所
属的意图类别;

第一确定子模块,用于根据所述上一句文本数据信息所属的意图类别和所述目标
转移概率矩阵,确定所述当前文本数据信息对应的第二分类结果;

第二确定子模块,用于根据所述第一分类结果和所述第二分类结果确定所述当前
文本数据信息所属的目标意图分类。

在一个实施例中,所述第二确定子模块用于:

根据所述第一分类结果和所述第二分类结果的乘积,确定所述当前文本数据信息
所属的目标意图分类。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不
能限制本发明。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变
得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明
书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施
例,并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种信息分类方法的流程图。

图2是根据一示例性实施例示出的一种信息分类方法中步骤S103的流程图。

图3是根据一示例性实施例示出的一种信息分类方法中步骤S104的流程图。

图4是根据一示例性实施例示出的一种信息分类装置的框图。

图5是根据一示例性实施例示出的一种信息分类装置中第一确定模块的框图。

图6是根据一示例性实施例示出的一种信息分类装置中第二确定模块的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及
附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例
中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附
权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种信息分类方法的流程图。该信息分类方法
应用于终端设备中,该终端设备可以是移动电话,计算机,数字广播终端,消息收发设备,游
戏控制台,平板设备,医疗设备,健身设备,个人数字助理等任一具有语音识别功能的设备。
如图1所示,该方法包括步骤S101-S105:

在步骤S101中,获取用户已输入的历史语音数据信息对应的文本数据信息的意图
分类日志记录;

在步骤S102中,从意图分类日志记录中获取多个相似的查询请求对应的文本数据
信息;

在步骤S103中,根据每个意图分类中多个相似的查询请求对应的文本数据信息、
预设的卷积神经网络模型和预设的转移概率矩阵,确定用户意图分类模型和目标转移概率
矩阵;

其中,意图分类日志记录可以是之前对语音数据信息进行意图分类的历史记录。
而目标转移概率矩阵是根据语音数据信息的上文确定该语音数据信息属于某个意图类别
的概率。即目标转移概率矩阵不关心当前的语音数据信息属于哪个意图类别,只获取上一
个语音数据信息属于哪个意图类别。根据上一个语音数据信息的意图类别,预测当前的语
音数据信息属于各个意图类别的概率。

在步骤S104中,使用用户意图分类模型和目标转移概率矩阵确定接收到的当前语
音数据信息对应的当前文本数据信息所属的目标意图类别;

在步骤S105中,在目标意图类别对应的数据库中查找与当前语音数据信息对应的
应答信息。

在该实施例中,在对历史语音数据信息进行分类后,可以获取意图分类日志记录,
并从该记录中获取每个意图类别中多个相似的查询请求对应的文本数据信息,进而根据多
个相似的查询请求对应的文本数据信息和预设的卷积神经网络模型和预设的转移概率矩
阵,确定用户意图分类模型和目标转移概率矩阵,并使用用户意图分类模型和目标转移概
率矩阵确定接收到的当前语音数据信息对应的当前文本数据信息所属的目标意图类别,在
目标意图类别对应的数据库中查找与语音数据信息对应的应答信息。这样,不但可以为用
户提供更准确的应答信息,还可以减少查找时间,提高查找效率,提升用户的使用体验。

其中,历史语音数据信息,可以采用历史用户意图分类模型和历史目标转移概率
矩阵进行分类,这样,在分类的过程中,不断根据历史分类记录完善用户意图分类模型和目
标转移概率矩阵,从而使得分类准确率不断提高。

图2是根据一示例性实施例示出的一种信息分类方法中步骤S103的流程图。

如图2所示,在一个实施例中,上述步骤S103包括步骤S201-S203:

在步骤S201中,将每个意图分类中多个相似的查询请求对应的文本数据信息作为
意图分类训练语料,利用预设的卷积神经网络模型进行训练,得到用户意图分类模型;

意图可以分层级的,如歌曲的意图,下面分搜歌曲、搜歌手、播放等意图,因此,意
图分类训练语料是有层级的,训练出的用户意图分类模型也是有层级的。先训练出最下层
的分类,逐层向上抽取,得到上层分类。每层训练时输入的语料是相同的,但是训练的目标
是不同的,训练的参数和不变的参数是不同的。

在步骤S202中,获取每个意图分类中多个相似的查询请求对应的文本数据信息中
任意两个相似的查询请求对应的文本数据信息之间的上下文关系;

在步骤S203中,利用相似的查询请求对应的文本数据信息之间的上下文关系和预
设的转移概率矩阵进行训练,得到目标转移概率矩阵。

例如,日志中两个同意图的文本数据信息为query1与query3,两者之间的文本书
数据信息为query2,查看query1与query3之间的关系,可能query1与query3属于同一分类,
那么,根据query1,query2和query 3的分类对预设的转移概率矩阵进行训练得到目标转移
概率矩阵,这样,得到的目标概率矩阵可以根据上下文确定当前文本数据信息对应的目标
意图类别。

在该实施例中,利用意图分类训练语料和预设的卷积神经网络模型进行训练,得
到用户意图分类模型,利用相似的查询请求对应的文本数据信息之间的上下文关系和预设
的转移概率矩阵进行训练,得到目标转移概率矩阵这样,根据用户意图分类模型和目标转
移概率矩阵进行意图分类,可以保证分类结果的准确性。

在一个实施例中,所述文本数据信息包括以下至少一项:文本信息和拼音信息;

意图分类训练语料包括以下至少一种形式:

文本语料和拼音预料。

在该实施例中,在进行卷积神经网络训练时,不但可以采用训练语料的文本形式
进行训练,还可以采用训练语料的拼音形式进行训练,这样,可以有效的过滤噪音,避免错
误累积。

图3是根据一示例性实施例示出的一种信息分类方法中步骤S104的流程图。

如图3所示,在一个实施例中,上述步骤S104包括步骤S301-S304:

在步骤S301中,将当前文本数据信息作为用户意图分类模型的输入,得到当前文
本数据信息对应的第一分类结果;

在步骤S302中,获取当前文本数据信息对应的上一句文本数据信息所属的意图类
别;

在步骤S303中,根据上一句文本数据信息所属的意图类别和目标转移概率矩阵,
确定当前文本数据信息对应的第二分类结果;

在步骤S304中,根据第一分类结果和第二分类结果确定当前文本数据信息所属的
目标意图分类。

在一个实施例中,所述根据所述第一分类结果和所述第二分类结果确定所述当前
文本数据信息所属的目标意图分类,包括:

根据所述第一分类结果和所述第二分类结果的乘积,确定所述当前文本数据信息
所属的目标意图分类。

在该实施例中,将当前文本数据信息作为用户意图分类模型的输入,得到文本数
据信息对应的第一分类结果,该第一分类结果表明当前文本数据信息属于各个意图分类的
概率,其是一个1*N维的特征向量,并根据上一句文本数据信息和目标转移概率矩阵计算出
当前文本数据信息属于每个意图类别的概率矩阵,该矩阵可以是N*N维的,进而根据两者的
乘积得到文本数据信息属于每个意图类别的总概率,进而将总概率值最高对应的意图类别
确定为目标意图类别。

下述为本发明装置实施例,可以用于执行本发明方法实施例。

图4是根据一示例性实施例示出的一种信息分类装置的框图,该装置可以通过软
件、硬件或者两者的结合实现成为终端设备的部分或者全部。如图4所示,该信息分类装置
包括:

第一获取模块41,用于获取用户已输入的历史语音数据信息对应的文本数据信息
的意图分类日志记录;

第二获取模块42,用于从所述意图分类日志记录中获取多个相似的查询请求对应
的文本数据信息;

第一确定模块43,用于根据所述多个相似的查询请求对应的文本数据信息、预设
的卷积神经网络模型和预设的转移概率矩阵,确定用户意图分类模型和目标转移概率矩
阵;

第二确定模块44,用于使用所述用户意图分类模型和目标转移概率矩阵确定接收
到的当前语音数据信息对应的当前文本数据信息所属的目标意图类别;

查找模块45,用于在所述目标意图类别对应的数据库中查找与所述当前语音数据
信息对应的应答信息。

在该实施例中,在对历史语音数据信息进行分类后,可以获取意图分类日志记录,
并从该记录中获取每个意图类别中的多个相似的查询请求对应的文本数据信息,进而根据
多个相似的查询请求对应的文本数据信息和预设的卷积神经网络模型和预设的转移概率
矩阵,确定用户意图分类模型和目标转移概率矩阵,并使用所述用户意图分类模型和目标
转移概率矩阵确定接收到的当前语音数据信息对应的当前文本数据信息所属的目标意图
类别,在所述目标意图类别对应的数据库中查找与所述语音数据信息对应的应答信息。这
样,不但可以为用户提供更准确的应答信息,还可以减少查找时间,提高查找效率,提升用
户的使用体验。

其中,历史语音数据信息,可以采用历史用户意图分类模型和历史目标转移概率
矩阵进行分类,这样,在分类的过程中,不断根据历史分类记录完善用户意图分类模型和目
标转移概率矩阵,从而使得分类准确率不断提高。

图5是根据一示例性实施例示出的一种信息分类装置中第一确定模块的框图。

如图5所示,在一个实施例中,所述第一确定模块43包括:

第一训练子模块51,用于将所述多个相似的查询请求对应的文本数据信息作为意
图分类训练语料,利用预设的卷积神经网络模型进行训练,得到用户意图分类模型;

第一获取子模块52,用于获取所述多个相似的查询请求对应的文本数据信息中任
意两个相似的查询请求对应的文本数据信息之间的上下文关系;

第二训练子模块53,用于利用所述相似的查询请求对应的文本数据信息之间的上
下文关系和所述预设的转移概率矩阵进行训练,得到所述目标转移概率矩阵。

例如,日志中两个同意图的文本数据信息为query1与query3,两者之间的文本书
数据信息为query2,查看query1与query3之间的关系,可能query1与query3属于同一分类,
那么,根据query1,query2和query 3的分类对预设的转移概率矩阵进行训练。

在该实施例中,利用所述意图分类训练语料和所述预设的卷积神经网络模型进行
训练,得到所述用户意图分类模型,利用相似的查询请求对应的文本数据信息之间的上下
文关系和预设的转移概率矩阵进行训练,得到目标转移概率矩阵这样,根据用户意图分类
模型和目标转移概率矩阵进行意图分类,可以保证分类结果的准确性。

在一个实施例中,所述文本数据信息包括以下至少一项:文本信息和拼音信息;

所述意图分类训练语料包括以下至少一种形式:

文本语料和拼音预料。

在该实施例中,在进行卷积神经网络训练时,不但可以采用训练语料的文本形式
进行训练,还可以采用训练语料的拼音形式进行训练,这样,可以有效的过滤噪音,避免错
误累积。

图6是根据一示例性实施例示出的一种信息分类装置中第二确定模块的框图。

如图6所示,在一个实施例中,所述第二确定模块44包括:

处理子模块61,用于将所述当前文本数据信息作为所述用户意图分类模型的输
入,得到所述当前文本数据信息对应的第一分类结果;

第二获取子模块62,用于获取所述当前文本数据信息对应的上一句文本数据信息
所属的意图类别;

第一确定子模块63,用于根据所述上一句文本数据信息所属的意图类别和所述目
标转移概率矩阵,确定所述当前文本数据信息对应的第二分类结果;

第二确定子模块64,用于根据所述第一分类结果和所述第二分类结果确定所述当
前文本数据信息所属的目标意图分类。

在一个实施例中,所述第二确定子模块64用于:

根据所述第一分类结果和所述第二分类结果的乘积,确定所述当前文本数据信息
所属的目标意图分类。

在该实施例中,将当前文本数据信息作为用户意图分类模型的输入,得到文本数
据信息对应的第一分类结果,该第一分类结果表明当前文本数据信息属于各个意图分类的
概率,其是一个1*N维的特征向量,并根据上一句文本数据信息和目标转移概率矩阵计算出
当前文本数据信息属于每个意图类别的概率矩阵,该矩阵可以是N*N维的,进而根据两者的
乘积得到文本数据信息属于每个意图类别的总概率,进而将总概率值最高对应的意图类别
确定为目标意图类别。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序
产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实
施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机
可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形
式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程
图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流
程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序
指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产
生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实
现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特
定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指
令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或
多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计
算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或
其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一
个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精
神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围
之内,则本发明也意图包含这些改动和变型在内。

信息分类方法及装置.pdf_第1页
第1页 / 共15页
信息分类方法及装置.pdf_第2页
第2页 / 共15页
信息分类方法及装置.pdf_第3页
第3页 / 共15页
点击查看更多>>
资源描述

《信息分类方法及装置.pdf》由会员分享,可在线阅读,更多相关《信息分类方法及装置.pdf(15页珍藏版)》请在专利查询网上搜索。

本发明是关于一种信息分类方法及装置,其中,方法包括:获取用户已输入的历史语音数据信息对应的文本数据信息的意图分类日志记录;从意图分类日志记录中获取多个相似的查询请求对应的文本数据信息;根据多个相似的查询请求对应的文本数据信息、预设的卷积神经网络模型和预设的转移概率矩阵,确定用户意图分类模型和目标转移概率矩阵;使用用户意图分类模型和目标转移概率矩阵确定接收到的当前语音数据信息对应的当前文本数据信息所。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1