《识别业务类型的方法及装置.pdf》由会员分享,可在线阅读,更多相关《识别业务类型的方法及装置.pdf(27页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 (43)申请公布日 (21)申请号 201310354245.X(22)申请日 2013.08.14G06F 9/445(2006.01)H04L 29/06(2006.01)(71)申请人华为技术有限公司地址 518129 广东省深圳市龙岗区坂田华为总部办公楼(72)发明人贾江涛 顾翀(74)专利代理机构北京中博世达专利商标代理有限公司 11274代理人申健(54) 发明名称识别业务类型的方法及装置(57) 摘要本发明公开了一种识别业务类型的方法,涉及数据处理领域,通过从用户输入的业务信息中提取一个或多个目标语块共现信息,并通过在预先配置的概率分布信息中查找所述目标语块共。
2、现信息在各个业务类型中的概率分布,并计算各业务类型下的所述一个或多个目标语块共现信息的概率分布之和,根据计算结果来判断用户所期望的目标业务类型;并在确定用户期望的目标业务类型后,即可为用户提供相应服务。本发明主要应用于呼叫应答服务等相关流程中。(51)Int.Cl.(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书3页 说明书18页 附图5页(10)申请公布号 CN 104375847 A(43)申请公布日 2015.02.25CN 104375847 A1/3页21.一种识别业务类型的方法,其特征在于,包括:获取用户输入的业务信息;提取所述业务信息中的一个或多个目标语块共现信。
3、息;根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布;其中,所述概率分布信息中记录有各语块共现信息和各种业务类型,以及所述各语块共现信息在每一种业务类型中的概率分布;根据所述得到的目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和;根据计算结果,确定所述业务信息所请求的目标业务类型,并根据确定的目标业务类型提供对应所述业务信息的业务服务。2.根据权利要求1所述的方法,其特征在于,所述计算每个指定业务类型下各目标语块共现信息的概率分布之和,具体包括:依次遍历概率分布信息中记录有的各个业务类型,并对于遍历到的每个业务类型,。
4、计算各目标语块共现信息在该业务类型中的概率分布之和;或者,在概率分布信息中查找各目标语块共现信息过程中,记录所述业务信息中各目标语块共现信息所涉及到的一个或多个业务类型;遍历记录下来的每个业务类型,并计算在该业务类型下各目标语块共现信息的概率分布之和。3.根据权利要求2所述的方法,其特征在于,所述根据计算结果,确定所述业务信息所请求的目标业务类型,具体包括:选择对应所述计算结果的值最大的业务类型,作为所述业务信息所请求的目标业务类型;或者,根据所述计算结果,按照计算结果的值由大到小的顺序排列,从排列顺序中选取至少一个业务类型,并将选取的至少一个业务类型通知给用户;接收用户从被通知的至少一个业务。
5、类型中选择的目标业务类型。4.根据权利要求1至3任意一项所述的方法,其特征在于,所述概率分布信息中还记录有每种业务类型的加权值,所述加权值是历史上被所有用户请求过的业务类型中每种业务类型所占的比率;则所述根据得到的所述目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和,具体包括:在计算每个指定业务类型下各目标语块共现信息的概率分布之和时,获取该业务类型的加权值,并将该业务类型下各目标语块共现信息的概率分布相加的结果与加权值作乘积运算,得到每个指定业务类型下各目标语块共现信息的概率分布之和。5.根据权利要求1至4任意一项所述的方法,其特征在于,所述提。
6、取所述业务信息中的一个或多个目标语块共现信息,具体包括:将所述业务信息划分为至少一个信息片段;从所述信息片段中,选取在所述信息片段以及语块集合中同时存在的语块;根据从同一个信息片段中选取出来的语块,生成目标语块共现信息。6.根据权利要求1至4任意一项所述的方法,其特征在于,所述提取所述业务信息中的语块共现信息,具体包括:将所述业务信息划分为至少一个信息片段;权 利 要 求 书CN 104375847 A2/3页3从所述信息片段中,选取在所述信息片段以及语块集合中同时存在的语块;并根据语块集合中的各语块的特征标签,从上述选取的语块中筛选出核心词语;根据筛选到的每个核心词语,以及,与所述各核心词语。
7、属于同一信息片段的语块,分别生成语块共现信息。7.根据权利要求1至6任意一项所述的方法,其特征在于,所述根据确定的目标业务类型提供对应所述业务信息的业务服务,还包括:接收到用户返回的信息,服务器在根据所述用户返回的信息确定所述确定的目标业务类型不符合用户的需求时,所述服务器为用户提供人工坐席服务或者互动式语音应答服务IVR,以便所述用户找到所需要的业务类型。8.根据权利要求9所述的方法,其特征在于,在所述为用户提供人工坐席服务或者IVR服务之后,还包括:服务器从人工坐席服务或者IVR服务中获取最终由所述用户选择的业务类型;服务器从所述业务信息的一个或多个语块共现信息中,确认在最终用户所选择的业。
8、务类型中存在有概率分布的语块共现信息;服务器对所述用户输入的业务信息进行分词处理和词性定义处理,并基于所述语块共现信息中语块的词性构造新的语块共现信息;服务器为新构造的一个或多个语块共现信息分配最低概率分布;所述最低概率分布的值是根据计算出的目标业务类型的概率分布之和与用户所选择的业务类型的概率分布之和两者计算得到;并将所述新构造的语块共现信息和所述新构造的语块共现信息在所述用户所选择的业务类型下的概率分布,更新到所述概率分布信息中。9.根据权利要求1至8任意一项所述的方法,其特征在于,所述根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布,具体包括:在所述概率分布。
9、信息中记录有的语块共现信息中查找每个目标语块共现信息;并将查找到的相应语块共现信息在各业务类型中的概率分布,作为当前所查找的目标语块共现信息在各业务类型中的概率分布。10.一种识别业务类型的装置,其特征在于,包括:通信单元,用于获取用户输入的业务信息;语块共现信息提取单元,用于提取所述业务信息中的一个或多个目标语块共现信息;查找单元,用于根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布;计算单元,用于根据所述得到的目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和;服务单元,用于根据计算结果,确定所述业务信息所请求的目。
10、标业务类型,并根据确定的目标业务类型提供对应所述业务信息的业务服务。11.根据权利要求10所述的装置,其特征在于,所述计算单元,具体用于依次遍历概率分布信息中记录有的各个业务类型,并对于遍历到的每个业务类型,计算各目标语块共现信息在该业务类型中的概率分布之和;或者,在概率分布信息中查找目标语块共现信息过程中,记录所述业务信息中各目标语块共权 利 要 求 书CN 104375847 A3/3页4现信息所涉及的一个或多个业务类型;遍历记录下来的每个业务类型,并计算在该业务类型下各目标语块共现信息的概率分布之和。12.根据权利要求11所述的装置,其特征在于,所述服务单元还包括:第一反馈单元,用于选择。
11、对应所述计算结果的值最大的业务类型,作为所述业务信息所请求的目标业务类型;或者,第二反馈单元,用于根据所述计算结果,按照计算结果的值由大到小的顺序排列,从排列顺序选取至少一个业务类型,并将选取的至少一个业务类型通知给用户;接收用户从被通知的至少一个业务类型中选择的目标业务类型。13.根据权利要求10至12任意一项所述的装置,其特征在于,所述服务单元还包括:第三反馈模块,接收到用户返回的信息,在根据所述用户返回的信息确定所述确定的目标业务类型不符合用户的需求时,所述服务器为用户提供人工坐席服务或者互动式语音应答服务IVR,以便所述用户找到所需要的业务类型。14.根据权利要求13所述的装置,其特征。
12、在于,所述服务单元还包括:第五提取模块,从人工坐席服务或者IVR服务中获取最终由所述用户选择的业务类型;并从所述业务信息的一个或多个语块共现信息中,确认在最终用户所选择的业务类型中存在有概率分布的语块共现信息;分词模块,用于对所述用户输入的业务信息进行分词处理和词性定义处理,并基于所述语块共现信息中语块的词性构造新的语块共现信息;最适概率计算模块,为新构造的一个或多个语块共现信息分配最低概率分布;所述最低概率分布根据计算出的目标业务类型的概率分布之和与最终用户所选择的业务类型的概率分布之和计算得到;更新模块,用于将新构造的语块共现信息和所述新构造的语块共现信息在所述用户所选择的业务类型下的概率。
13、分布,更新到所述概率分布信息中。15.根据权利要求10至14任意一项所述的装置,其特征在于,所述查找单元还包括:第一匹配单元,用于在所述概率分布信息中记录有的语块共现信息中查找每个目标语块共现信息;并将查找到的相应语块共现信息在各业务类型中的概率分布,作为所述某个目标语块共现信息在各业务类型中的概率分布。权 利 要 求 书CN 104375847 A1/18页5识别业务类型的方法及装置技术领域0001 本发明涉及数据处理领域,尤其涉及一种识别业务类型的方法及装置。背景技术0002 呼叫中心(英文Call Center或Call Centre)也叫客户服务中心之类的,早期的呼叫中心就是些热线电话。
14、、咨询电话,由受过训练的话务员专门接听处理来电客户的各类问题如咨询、投诉、建议。现代呼叫中心已经涉及到了计算机(软硬件)技术、Internet技术、计算机电话集成技术(CTI)、数据仓库(商业智能BI)技术、客户关系管理(CRM)技术、交换机(PBX)通讯技术、企业ERP技术和企业管理、项目管理、团队管理等诸多方面的内容。它已经成为一个统一、高效的服务工作平台,它将企业内分属各职能部门集中在一个统一的对外联系的窗口,集中化地安置坐席,采用统一的标准服务模式,为用户提供系统化、智能化、人性化的服务。呼叫中心已经成为与企业连为一体的一个完整的综合信息服务系统,是现代企业运营不可或缺的一部分,同时也。
15、成为企业间竞争的有力工具。0003 交互式语音应答(Interactive Voice Response,IVR)为呼叫中心主要使用的技术之一,其功能主要是利用自助语音提示,引导用户选择服务内容和输入服务所需的数据,并接受用户在电话拨号键盘多次交互输入的信息,实现对计算机数据库等信息资料的交互式访问。例如,当客户拨打移动服务电话时,首先接入IVR系统,在确认用户信息后,根据IVR给出的指引信息,用户选择对应的功能键,经过几次选择之后到达所需要的服务菜单。0004 在实现交互式语音应答的过程中,发明人发现现有技术中至少存在如下问题:用户与IVR系统需要完成多次交互,增加了交互次数,影响了处理效率。
16、。发明内容0005 本发明的实施例提供一种识别业务类型的方法及装置,能够减少用户与客户服务器的交互次数,提高交互效率。0006 为达到上述目的,本发明的实施例采用如下技术方案:0007 第一方面,本发明实施例提供了一种识别业务类型的方法,其特征在于,包括:获取用户输入的业务信息;提取所述业务信息中的一个或多个目标语块共现信息;根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布;其中,所述概率分布信息中记录有各语块共现信息和各种业务类型,以及所述各语块共现信息在每一种业务类型中的概率分布;根据所述得到的目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各。
17、目标语块共现信息的概率分布之和;根据计算结果,确定所述业务信息所请求的目标业务类型,并根据确定的目标业务类型提供对应所述业务信息的业务服务。0008 结合第一方面,在第一种可能的实现方式中,所述计算每个指定业务类型下各目标语块共现信息的概率分布之和,具体包括:依次遍历概率分布信息中记录有的各个业务类型,并对于遍历到的每个业务类型,计算各目标语块共现信息在该业务类型中的概率分说 明 书CN 104375847 A2/18页6布之和;或者,在概率分布信息中查找各目标语块共现信息过程中,记录所述业务信息中各目标语块共现信息所涉及到的一个或多个业务类型;遍历记录下来的每个业务类型,并计算在该业务类型下。
18、各目标语块共现信息的概率分布之和。0009 结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述根据计算结果,确定所述业务信息所请求的目标业务类型,具体包括:选择对应所述计算结果的值最大的业务类型,作为所述业务信息所请求的目标业务类型;或者,根据所述计算结果,按照计算结果的值由大到小的顺序排列,从排列顺序中选取至少一个业务类型,并将选取的至少一个业务类型通知给用户;接收用户从被通知的至少一个业务类型中选择的目标业务类型。0010 结合第一方面、第一方面的第一种可能或第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述概率分布信息中还记录有每种业务类型的加权值,所述加权值。
19、是历史上被所有用户请求过的业务类型中每种业务类型所占的比率;则所述根据得到的所述目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和,具体包括:在计算每个指定业务类型下各目标语块共现信息的概率分布之和时,获取该业务类型的加权值,并将该业务类型下各目标语块共现信息的概率分布相加的结果与加权值作乘积运算,得到每个指定业务类型下各目标语块共现信息的概率分布之和。0011 结合第一方面、第一方面的第一种可能、第一方面的第二种可能或第一方面的第三种可能的实现方式,在第四种可能的实现方式中,所述提取所述业务信息中的一个或多个目标语块共现信息,具体包括:将所述业务。
20、信息划分为至少一个信息片段;从所述信息片段中,选取在所述信息片段以及语块集合中同时存在的语块;根据从同一个信息片段中选取出来的语块,生成目标语块共现信息。0012 结合第一方面、第一方面的第一种可能、第一方面的第二种可能、第一方面的第三种可能或第一方面的第四种可能的实现方式,在第五种可能的实现方式中,所述提取所述业务信息中的语块共现信息,具体包括:将所述业务信息划分为至少一个信息片段;从所述信息片段中,选取在所述信息片段以及语块集合中同时存在的语块;并根据语块集合中的各语块的特征标签,从上述选取的语块中筛选出核心词语;根据筛选到的每个核心词语,以及,与所述各核心词语属于同一信息片段的语块,分别。
21、生成语块共现信息。0013 结合第一方面、第一方面的第一种可能、第一方面的第二种可能、第一方面的第三种可能或第一方面的第四种可能的实现方式,在第六种可能的实现方式中,所述根据确定的目标业务类型提供对应所述业务信息的业务服务,还包括:接收到用户返回的信息,服务器在根据所述用户返回的信息确定所述确定的目标业务类型不符合用户的需求时,所述服务器为用户提供人工坐席服务或者互动式语音应答服务IVR,以便所述用户找到所需要的业务类型。0014 结合第一方面的第六种可能的实现方式,在第七种可能的实现方式中,在所述为用户提供人工坐席服务或者IVR服务之后,还包括:服务器从人工坐席服务或者IVR服务中获取最终由。
22、所述用户选择的业务类型;服务器从所述业务信息的一个或多个语块共现信息中,确认在最终用户所选择的业务类型中存在有概率分布的语块共现信息;服务器对所述用户输入的业务信息进行分词处理和词性定义处理,并基于所述语块共现信息中语块的说 明 书CN 104375847 A3/18页7词性构造新的语块共现信息;服务器为新构造的一个或多个语块共现信息分配最低概率分布;所述最低概率分布的值是根据计算出的目标业务类型的概率分布之和与用户所选择的业务类型的概率分布之和两者计算得到;并将所述新构造的语块共现信息和所述新构造的语块共现信息在所述用户所选择的业务类型下的概率分布,更新到所述概率分布信息中。0015 结合第。
23、一方面或结合第一方面的上述几种可能的实现方式的,在第八种可能的实现方式中,所述根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布,具体包括:在所述概率分布信息中记录有的语块共现信息中查找每个目标语块共现信息;并将查找到的相应语块共现信息在各业务类型中的概率分布,作为当前所查找的目标语块共现信息在各业务类型中的概率分布。0016 第二方面,本发明实施例提供了一种识别业务类型的装置,包括:通信单元,用于获取用户输入的业务信息;语块共现信息提取单元,用于提取所述业务信息中的一个或多个目标语块共现信息;查找单元,用于根据预先配置的概率分布信息,得到所述各目标语块共现信息在各。
24、业务类型中的概率分布;计算单元,用于根据所述得到的目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和;服务单元,用于根据计算结果,确定所述业务信息所请求的目标业务类型,并根据确定的目标业务类型提供对应所述业务信息的业务服务。0017 结合第二方面,在第一种可能的实现方式中,所述计算单元,具体用于依次遍历概率分布信息中记录有的各个业务类型,并对于遍历到的每个业务类型,计算各目标语块共现信息在该业务类型中的概率分布之和;或者,在概率分布信息中查找目标语块共现信息过程中,记录所述业务信息中各目标语块共现信息所涉及的一个或多个业务类型;遍历记录下来的每个业。
25、务类型,并计算在该业务类型下各目标语块共现信息的概率分布之和。0018 结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述服务单元还包括:第一反馈单元,用于选择对应所述计算结果的值最大的业务类型,作为所述业务信息所请求的目标业务类型;或者,第二反馈单元,用于根据所述计算结果,按照计算结果的值由大到小的顺序排列,从排列顺序选取至少一个业务类型,并将选取的至少一个业务类型通知给用户;接收用户从被通知的至少一个业务类型中选择的目标业务类型。0019 结合第二方面、第二方面的第一种可能或第二方面的第二种可能的实现方式,在第三种可能的实现方式种,所述服务单元还包括:第三反馈模块,接收到用。
26、户返回的信息,在根据所述用户返回的信息确定所述确定的目标业务类型不符合用户的需求时,所述服务器为用户提供人工坐席服务或者互动式语音应答服务IVR,以便所述用户找到所需要的业务类型。0020 结合第二方面的第三种可能的实现方式,在第四种可能的实现方式中,所述服务单元还包括:第五提取模块,从人工坐席服务或者IVR服务中获取最终由所述用户选择的业务类型;并从所述业务信息的一个或多个语块共现信息中,确认在最终用户所选择的业务类型中存在有概率分布的语块共现信息;分词模块,用于对所述用户输入的业务信息进行分词处理和词性定义处理,并基于所述语块共现信息中语块的词性构造新的语块共现信息;最适概率计算模块,为新。
27、构造的一个或多个语块共现信息分配最低概率分布;所述最低概率分布根据计算出的目标业务类型的概率分布之和与最终用户所选择的业务类型的概率分布之和计算得到;更新模块,用于将新构造的语块共现信息和所述新构造的语块共说 明 书CN 104375847 A4/18页8现信息在所述用户所选择的业务类型下的概率分布,更新到所述概率分布信息中。0021 结合第二方面或第二方面的以上几种可能的实现方式,在第五种可能的实现方式中,所述查找单元还包括:第一匹配单元,用于在所述概率分布信息中记录有的语块共现信息中查找每个目标语块共现信息;并将查找到的相应语块共现信息在各业务类型中的概率分布,作为所述某个目标语块共现信息。
28、在各业务类型中的概率分布。0022 本发明实施例提供了一种识别业务类型的方法及装置,通过从用户输入的业务信息中提取目标语块共现信息,并计算提取到的目标语块共现信息在各个业务类型中的概率分布之和,并结合概率分布之和的结果来判断用户期望的目标业务类型,在判断出用户所期望的目标业务类型后,即可为用户提供相应服务,从而实现了用户仅输入业务信息后即可等待业务响应,相比于现有技术中的IVR机制,本发明的操作更为简单和高效。附图说明0023 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对。
29、于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。0024 图1为本发明实施例提供的一种识别业务类型的方法流程图;0025 图2为本发明实施例提供的另一种识别业务类型的方法流程图;0026 图3为本发明实施例提供的另一种识别业务类型的方法流程图;0027 图4为本发明实施例提供的另一种识别业务类型的方法流程图;0028 图5为本发明实施例提供的另一种识别业务类型的方法流程图;0029 图6为本发明实施例提供的一种识别业务类型的装置组成框图;0030 图7为本发明实施例提供的另一种识别业务类型的装置组成框图;0031 图8为本发明实施例提供的另一种识别业务类。
30、型的装置组成框图;0032 图9为本发明实施例提供的另一种识别业务类型的装置组成框图;0033 图10为本发明实施例提供的另一种识别业务类型的装置组成框图;0034 图11为本发明实施例提供的另一种识别业务类型的装置组成框图;0035 图12为本发明实施例提供的另一种识别业务类型的装置组成框图;0036 图13为本发明实施例提供的另一种识别业务类型的装置组成框图。具体实施方式0037 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下。
31、所获得的所有其他实施例,都属于本发明保护的范围。0038 本发明实施例提供了一种识别业务类型的方法,图1是其流程示意图,包括:0039 101、获取用户输入的业务信息。0040 其中,业务信息可以是用户提供的文本信息,或者是由用户提供的语音信息转化而成的文本信息。其接收输入的对象可以是手机、个人电脑或其他通用的输入设备。说 明 书CN 104375847 A5/18页90041 特别说明的是,本发明实施例使用的文本信息通常情况下需要标点符号或空格等标识信息作为分隔符,用以区分不同的信息片段,例如句子或段落。0042 102、提取所述业务信息中的一个或多个目标语块共现信息。0043 其中,“语块。
32、共现信息”是指由两个或多个语块之间的相关性组合起来的对象;所述目标语块共现信息用于限定是从用户所输入的业务信息中提取的,用于与概率分布信息中的语块共现信息区别称呼,如:目标业务类型和概率分布信息中的业务类型之间的关系;所述目标语块共现信息可以由核心词语组成,也可以由语块组成,还可以由核心词语和语块共同组成。其中,核心词语可以理解为有指定特征标签的语块。0044 在本发明中,特征标签包括下面所描述的一种或者多种标签:1)特定词性的语块标签,如:“取消套餐中”的“取消”是分配有动词词性的语块标签;“查询话费”中的“查询”也是分配有动词词性的语块标签;2)特定业务类型名称的标签,如:“我的神州行”中。
33、的“神州行”是分配有业务类型名称的标签,类似的业务类型名称还有“3G”、“全球通”、“人工服务”等等;3)特定业务类型涉及的数值类型的标签,如:96元套餐中的“96”是分配有数值类型的标签,类似的还有300M的上网流量套餐中的“300M”。0045 其中,所述语块可以是由字和字共同组成的短语,还可以是由字和词共同组成的短语,还可以是由词和词共同组成的短语。确定业务信息中语块共现信息的方法在后面的实施例中详述。0046 103、根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布。0047 其中,所述概率分布信息中记录有各语块共现信息和各种业务类型,以及所述各语块共现信。
34、息在每一种业务类型中的概率分布。0048 具体的,所述概率分布可以是通过已收集的所有语块共现信息在不同业务类型中分布情况预先统计得到的。该概率分布信息是由服务器计算生成的或者是在服务器中保存有的,具体的所述概率分布信息在执行步骤101之前就由用户输入,并存储在服务器中;也可以是由服务器根据历史数据临时计算出来的;还可以是由服务器根据历史数据临时计算出来的,并进一步由服务器在运行的过程中周期性的来更新和维护的。所述概率分布信息可以是数据结构模型,并以文本格式或者HTML格式存储于服务器中。本领域技术人员根据已公开的内容,容易想到现有的其它存储格式也能被运用到本发明中。103步骤的具体实现,参见后。
35、续详细说明。0049 104、根据得到的所述目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和。0050 其中,每个指定业务类型下各目标语块共现信息的概率分布之和是指:服务器先指定一种业务类型,然后对各目标语块共现信息在该业务类型下的概率分布求和;完成步骤104后,用户输入的业务信息对应于每个指定的业务类型都会有相应的一个概率分布之和的值。0051 105、根据计算结果,确定所述业务信息所请求的目标业务类型,并根据确定的目标业务类型提供对应所述业务信息的业务服务。0052 本发明实施例提供了一种识别业务类型的方法,通过从用户输入的业务信息中提取目标。
36、语块共现信息,并计算提取到的目标语块共现信息在各个业务类型中的概率分布之说 明 书CN 104375847 A6/18页10和,并结合对应不同业务类型获得的概率分布之和来判断用户期望的目标业务类型,相比于现有技术中的IVR机制,操作更为简单和高效。0053 在步骤101至105基础上,在本发明实施例的另一种可选的实施方式中,针对步骤102的如何实现目标语块共现信息的提取,具体提供了三种不同的实现方式,下面将针对三种不同的实现方式分别作具体描述。0054 实现方式一,如流程图2所示,包括:0055 A1021、对用户提供的业务信息进行分词处理和词性标注处理。0056 分词处理指的是将一个文本序列。
37、切分成一个一个单独的词;词性标注处理指对每一个词附上相应的词性。在本发明实施例中分词处理和词性标注处理都可以参照业内通用实现方式,本发明实施例在此不做特别限定。现有的分词处理方法包括:最小匹配算法(Minimum Matching)、正向(逆向)最大匹配法(Maximum Matching)、逐字匹配算法、神经网络法、联想一回溯法、基于N至最短路径分词算法等等。0057 A1022、从所述业务信息中选取指定特征标签的语块作为核心词语。0058 本发明实施例中提到的指定特征标签的词语可以是动词、动词短语或者是业务名词等等,例如,提供、调整、降低和服务都是业务信息中动词特征标签的语块。0059 A。
38、1023、根据选取的每个核心词语,分别生成目标语块共现信息。0060 在本实施例中,每个目标语块共现信息由一个核心词语组成,其表示形式可以为“(核心词语)”,例如:(服务)和(拨打)。0061 在本实现方式中,由于用户在输入业务信息之前,服务器是有可能通过用户拨打的服务电话的号码信息知道用户所需的业务类型的范围,例如:用户拨打101901可能就是跟查询话费有关。在这种情况下,服务器只需要提取到和查询话费相关的业务名词的核心词语就可以确定业务类型了。此时,服务器就可以仅提取核心词语来确定业务类型,从而尽可能减少数据处理量。0062 实现方式二,如流程图3所示,包括:0063 B1021、将所述业。
39、务信息划分为至少一个信息片段。0064 其中,此处描述信息片段可以为一个句子或多个句子形成的一段话。具体实现方法可以通过业务信息中的标点符号进行划分,例如分号或句号等,或者通过特殊标记来对进行划分,例如空格等。0065 B1022、从所述划分出的信息片段中,选取在所述信息片段以及语块集合中同时存在的语块。0066 其中,所述语块集合可以是由管理员单独输入的。所述语块集合的更新方式可以是管理员手动的增加、删除或者修改;还可以是在每次由服务器确认出目标业务类型并非是用户所需要的时,服务器进一步采用分词处理和词性划分的方式,获取更多的语块来扩展当前的语块集,其具体实现方式将在后面描述。0067 优选的,语块集合中的语块会比概率分布信息中记录的构成历史语块共现信息的语块对象更丰富,这是为了在后续服务器针对某个业务信息确定目标业务类型出错时或者说并非用户所需要的业务类型时,提供动态调整所需的备选语块共现信息,其方法将在后面实施方式中具体描述。0068 B1023、根据从同一个信息片段中选取出来的语块,生成目标语块共现信息。说 明 书CN 104375847 A10。