一种基于抽象语义的智能交互方法.pdf

上传人:r5 文档编号:6355235 上传时间:2019-06-03 格式:PDF 页数:5 大小:198.17KB
返回 下载 相关 举报
摘要
申请专利号:

CN201510603559.8

申请日:

2015.09.21

公开号:

CN105183716A

公开日:

2015.12.23

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/27申请日:20150921|||公开

IPC分类号:

G06F17/27

主分类号:

G06F17/27

申请人:

上海智臻智能网络科技股份有限公司

发明人:

李波; 曾永梅; 姚贡之; 朱频频

地址:

201803 上海市嘉定区金沙江西路1555弄398号7层

优先权:

专利代理机构:

上海大邦律师事务所 31252

代理人:

袁洋

PDF下载: PDF下载
内容摘要

本发明公开了一种基于抽象语义的智能交互方法,包括以下步骤:A、对用户发出的信息进行分词;B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;C、对步骤A所述分词后的字、词及词组进行语义标注分析;D、对步骤A所述分词后的字、词及词组进行文本纠错;E、对用户发出的信息进行句法分析;F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正,所述步骤C中通过一组语义表达式在组成元素上进行了扩充,语义表达式的集合来描述一个语义的不同表达。本发明提高了在与机器人交互时,机器人识别指令的准确性。

权利要求书

权利要求书
1.  一种基于抽象语义的智能交互方法,包括以下步骤:
A、对用户发出的信息进行分词;
B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;
C、对步骤A所述分词后的字、词及词组进行语义标注分析;
D、对步骤A所述分词后的字、词及词组进行文本纠错;
E、对用户发出的信息进行句法分析;
F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正,其特征在于:
所述步骤C中通过一组语义表达式在组成元素上进行了扩充,语义表达式的集合来描述一个语义的不同表达。

2.  根据权利要求1所述的基于抽象语义的智能交互方法,其特征在于:
所述语义表达式包括行为方式自身的抽象,行为方式的判断的抽象,行为的原因的抽象。

3.  根据权利要求1所述的基于抽象语义的智能交互方法,其特征在于:
所述步骤A中的分词会基于特定领域的实例。

4.  根据权利要求1所述的基于抽象语义的智能交互方法,其特征在于:
所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。

5.  根据权利要求1所述的基于抽象语义的智能交互方法,其特征在于:
所述步骤E中的句法分析根据重要度进行区分,区分方法包括开放领域和专业领域。

说明书

说明书一种基于抽象语义的智能交互方法
技术领域
本发明涉及一种智能交互方法,更具体的说是涉及一种基于抽象语义用于智能交互的语义模型方法。
背景技术
在传统的智能交互中,智能交互的一般采用模板方式来应对复杂的对话,准确度较低,或者对信息进行各种分词后进行分析,但一般的分词结果种类多,准确度较低。
发明内容
本发明公开了一种用于智能交互的语义模型方法,包括以下步骤:
A、对用户发出的信息进行分词;
B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;
C、对步骤A所述分词后的字、词及词组进行语义标注分析;
D、对步骤A所述分词后的字、词及词组进行文本纠错;
E、对用户发出的信息进行句法分析;
F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正;
所述步骤C中通过一组语义表达式在组成元素上进行了扩充,语义表达式的集合来描述一个语义的不同表达。
所述步骤A中的分词会基于特定领域的实例。
所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。
所述步骤E中的句法分析根据重要度进行区分,区分方法包括开放领域和专业领域。
具体实施方式
下面对本方法进行具体说明:
A、对用户发出的信息进行分词;
分词是计算机语言学或人工智能领域的常用技术手段,一般采用“最大匹配分词法”或“最大概率法分词”,
B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;
对于实体,是本体的实例化,
所谓本体,是对概念的一种明确且详细的说明,是对现实世界的一种描述方法。或者说,本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达。一般包含:
——具体的本体实例(对象Object)
——本体的属性
——所属的本体类别。
本体实例化后,就可以继承本体的属性,为其后的语义标注分析做好准备;
C、对步骤A所述分词后的字、词及词组进行语义标注分析;
对于语义标注分析,包括词性标注和词义标注两个部分:
对于词性标注:一般采用隐马尔科夫模型或者基于转换的错误驱动的磁性标注方法;
对于词义标注:一般采用基于互信息的词义排歧方法或基于词典的排歧方法;
对于本发明来说,抽象语义语法与语义表达式语法类似,由语义成份符、词类、词、以及语法符号构成,其中语义成份符是对语义表达式在其元素上的扩充。抽象语义表达的语义粒度应该足够的细,且可以和其他语义有一定的辨析度。
当这些扩充的元素一旦被赋予了相应的值就可以表达各种各样的具体语义。
抽象语义来源于两个方面,其一是对本体类属性的抽象,其二是对一些通用语义的归纳。
具体举例来说:
1)对于行为方式的抽象:
日常生活中,很多行为都是对一种业务如何操作,这种行为就可以归纳为一个概念和一个行为,例如concept=信用卡action=申请;concept=基金action=购买,对于这种抽象语义,就可以将其通用的语义给与抽象,例如:
当经过分析,发现用户的输入语句是:
[concept]<有|用|以><何种|哪些><办法|方法|方式|流程|途径|步骤|规程|手续>[action]或者是
<如何|怎么|怎么样|怎样><才可以|才能|才能够>[action][concept]这种模式,我们就知道,实际用户是想知道
关于[concept]应该如何[action],
2)行为方式的判断:
有时,某件事涉及一个动作及两个名词性概念,例如:concept1=网上银行action=办理concept2=信用卡;concept1=自由职业者action=申请concept2=贷款
当经过分析,发现用户的输入语句是:
<可以|能够|能>[concept1][action][concept2]吗
<是否|是不是>[concept1]<都|也|均><能够|可以|可|能?>支持{[action]-[concept2]}
我们也知道,用户实际是想知道
[concept1]<能不能>[action][concept2]
3)行为的原因
还有时,某件事涉及一件事的原因,例如concept1=信用卡action=降低concept2=额度;concept1=电脑action=显示concept2=乱码如果经过分析,语句符合下述模式:
[concept1]<为何|为什么|怎么><就?><会?>[action][concept2]<了?>
[concept1]会[action][concept2]<的?>原因<是什么|有哪些|有什么?>
[concept1][action][concept2]<了?><是?>怎么回事
实际上都是在问
[concept1]会[action][concept2]是什么原因<造成的|导致的?>
经过上述描述的抽象,对于用户的语义理解可以更加准确。
D、对步骤A所述分词后的字、词及词组进行文本纠错;
E、对用户发出的信息进行句法分析;
F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正。
本系统还会根据用户数据日志来调整权重。例如:“不”字基于统计学不重要,但经过统计分析,“不”字出现及句尾比例较高,其含义完全不同,所以当“不”字出现在句尾时,例如“我能开通彩铃不”调整“不”字权重。
所述步骤A中的分词会基于特定领域的实例。
具体来说,本专利的分词会基于特定领域,因为相同的汉字或词组在不同领域其分词
所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。
所述步骤E中的句法分析根据重要度进行区分,区分方法包括开放领域和专业领域。

一种基于抽象语义的智能交互方法.pdf_第1页
第1页 / 共5页
一种基于抽象语义的智能交互方法.pdf_第2页
第2页 / 共5页
一种基于抽象语义的智能交互方法.pdf_第3页
第3页 / 共5页
点击查看更多>>
资源描述

《一种基于抽象语义的智能交互方法.pdf》由会员分享,可在线阅读,更多相关《一种基于抽象语义的智能交互方法.pdf(5页珍藏版)》请在专利查询网上搜索。

本发明公开了一种基于抽象语义的智能交互方法,包括以下步骤:A、对用户发出的信息进行分词;B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;C、对步骤A所述分词后的字、词及词组进行语义标注分析;D、对步骤A所述分词后的字、词及词组进行文本纠错;E、对用户发出的信息进行句法分析;F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正,所述步骤C中通过一组语义表达式在组成元素上进行了扩。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1