用于构建极性词素数据库以及确定词的极性的方法和装置.pdf

上传人:大师****2 文档编号:975704 上传时间:2018-03-22 格式:PDF 页数:22 大小:518KB
返回 下载 相关 举报
摘要
申请专利号:

CN201010257635.1

申请日:

2010.08.17

公开号:

CN102375838A

公开日:

2012.03.14

当前法律状态:

驳回

有效性:

无权

法律详情:

发明专利申请公布后的驳回IPC(主分类):G06F 17/30申请公布日:20120314|||实质审查的生效IPC(主分类):G06F 17/30申请日:20100817|||公开

IPC分类号:

G06F17/30; G06F17/27

主分类号:

G06F17/30

申请人:

富士通株式会社

发明人:

张洁; 孟遥; 于浩

地址:

日本神奈川县

优先权:

专利代理机构:

北京集佳知识产权代理有限公司 11227

代理人:

潘士霖;李春晖

PDF下载: PDF下载
内容摘要

用于构建极性词素数据库以及确定词的极性的方法和装置。用于确定词的极性的方法包括:对于要确定极性的词,计算其与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、与所述极性词素数据库中的每个极性为贬义的词之间的互信息;根据所计算的词与极性词素数据库中的每个极性为褒义的词之间的互信息,计算词与极性词素数据库中的所有极性为褒义的词之间的关联性,根据所计算的词与极性词素数据库中的每个极性为贬义的词之间的互信息,计算词与极性词素数据库中的所有极性为贬义的词之间的关联性;以及对以上两种关联性进行比较,根据比较结果

权利要求书

1: 一种用于构建极性词素数据库的方法, 包括 : 从语料库和 / 或词语库中提取具有极性的单音节词 ; 以及 对所述具有极性的单音节词标注极性, 所述被标注极性的单音节词构成所述极性词素 数据库。
2: 一种用于确定词的极性的方法, 包括 : 对于要确定极性的词, 计算所述词与预定的极性词素数据库中的每个极性为褒义的 词之间的互信息、 以及所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信 息; 根据所计算的所述词与所述极性词素数据库中的每个极性为褒义的词之间的互信息, 计算所述词与所述极性词素数据库中的所有极性为褒义的词之间的关联性, 并根据所计算 的所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息, 计算所述词与所 述极性词素数据库中的所有极性为贬义的词之间的关联性 ; 以及 对所述词与所述极性词素数据库中的所有极性为褒义的词之间的关联性以及所述词 与所述极性词素数据库中的所有极性为贬义的词之间的关联性进行比较, 根据比较结果判 定所述词的极性。
3: 如权利要求 2 所述的方法, 其中所述计算关联性的步骤包括 : 对所计算的所述词与所述极性词素数据库中的每个极性为褒义的词之间的互信息进 行求和, 获得第一求和结果 ; 以及 对所计算的所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息进 行求和, 获得第二求和结果。
4: 如权利要求 3 所述的方法, 其中所述判定的步骤包括 : 对所述第一求和结果和第二 求和结果进行比较, 如果第一求和结果大于第二求和结果则判定所述词的极性为褒义, 如 果第一求和结果小于第二求和结果则判定所述词的极性为贬义。
5: 如权利要求 2 所述的方法, 其中所述极性词素数据库为由权利要求 1 所述的方法构 建的极性词素数据库。
6: 一种用于构建极性词素数据库的装置, 包括 : 提取单元, 被配置用于从语料库和 / 或词语库中提取具有极性的单音节词 ; 以及 标注单元, 被配置用于对所述具有极性的单音节词标注极性, 所述被标注极性的单音 节词构成所述极性词素数据库。
7: 一种用于确定词的极性的装置, 包括 : 互信息计算单元, 被配置用于对于要确定极性的词, 计算所述词与预定的极性词素数 据库中的每个极性为褒义的词之间的互信息、 以及所述词与所述极性词素数据库中的每个 极性为贬义的词之间的互信息 ; 关联性计算单元, 被配置用于根据互信息计算单元所计算的所述词与所述极性词素数 据库中的每个极性为褒义的词之间的互信息, 计算所述词与所述极性词素数据库中的所有 极性为褒义的词之间的关联性, 并根据互信息计算单元所计算的所述词与所述极性词素数 据库中的每个极性为贬义的词之间的互信息, 计算所述词与所述极性词素数据库中的所有 极性为贬义的词之间的关联性 ; 以及 判定单元, 被配置用于对关联性计算单元所计算的所述词与所述极性词素数据库中的 2 所有极性为褒义的词之间的关联性以及所述词与所述极性词素数据库中的所有极性为贬 义的词之间的关联性进行比较, 根据比较结果判定所述词的极性。
8: 如权利要求 7 所述的装置, 其中所述关联性计算单元包括 : 第一求和模块, 被配置用于对互信息计算单元所计算的所述词与所述极性词素数据库 中的每个极性为褒义的词之间的互信息进行求和, 获得第一求和结果 ; 以及 第二求和模块, 被配置用于对互信息计算单元所计算的所述词与所述极性词素数据库 中的每个极性为贬义的词之间的互信息进行求和, 获得第二求和结果。
9: 如权利要求 8 所述的装置, 其中所述判定单元被配置成 : 对所述关联性计算单元所 获得的所述第一求和结果和第二求和结果进行比较, 如果第一求和结果大于第二求和结果 则判定所述词的极性为褒义, 如果第一求和结果小于第二求和结果则判定所述词的极性为 贬义。
10: 如权利要求 7 所述的装置, 其中所述极性词素数据库为由权利要求 6 所述的装置构 建的极性词素数据库。

说明书


用于构建极性词素数据库以及确定词的极性的方法和装置

    【技术领域】
     本发明一般地涉及文字处理。更具体地, 本发明涉及词的极性的判断。背景技术
     词的极性 (polarity) 的确定广泛应用于文章分类、 观点挖掘和情感分析等。在传 统的方法中, 为了提高词的极性识别的性能, 构造包括大量的具有手工标注词性的词的词 典。构造这样的词典费时且成本高。发明内容
     根据本发明的第一方面, 提供了一种用于构建极性词素数据库的方法, 包括 : 从语 料库和 / 或词语库中提取具有极性的单音节词 ; 以及对具有极性的单音节词标注极性, 被 标注极性的单音节词构成极性词素数据库。 根据本发明的第二方面, 提供了一种用于确定词的极性的方法, 包括 :
     对于要确定极性的词, 计算词与预定的极性词素数据库中的每个极性为褒义的词 之间的互信息、 以及词与极性词素数据库中的每个极性为贬义的词之间的互信息 ; 根据所 计算的词与极性词素数据库中的每个极性为褒义的词之间的互信息, 计算词与极性词素数 据库中的所有极性为褒义的词之间的关联性, 并根据所计算的词与极性词素数据库中的每 个极性为贬义的词之间的互信息, 计算词与极性词素数据库中的所有极性为贬义的词之间 的关联性 ; 以及对词与极性词素数据库中的所有极性为褒义的词之间的关联性以及词与极 性词素数据库中的所有极性为贬义的词之间的关联性进行比较, 根据比较结果判定词的极 性。
     根据本发明的第三方面, 提供了一种用于构建极性词素数据库的装置, 包括 : 提取 单元, 被配置用于从语料库和 / 或词语库中提取具有极性的单音节词 ; 以及标注单元, 被配 置用于对具有极性的单音节词标注极性, 被标注极性的单音节词构成极性词素数据库。
     根据本发明的第四方面, 提供了一种用于确定词的极性的装置, 包括 : 互信息计 算单元, 被配置用于对于要确定极性的词, 计算词与预定的极性词素数据库中的每个极性 为褒义的词之间的互信息、 以及词与极性词素数据库中的每个极性为贬义的词之间的互信 息; 关联性计算单元, 被配置用于根据互信息计算单元所计算的词与极性词素数据库中的 每个极性为褒义的词之间的互信息, 计算词与极性词素数据库中的所有极性为褒义的词之 间的关联性, 并根据互信息计算单元所计算的词与极性词素数据库中的每个极性为贬义的 词之间的互信息, 计算词与极性词素数据库中的所有极性为贬义的词之间的关联性 ; 以及 判定单元, 被配置用于对关联性计算单元所计算的词与极性词素数据库中的所有极性为褒 义的词之间的关联性以及词与极性词素数据库中的所有极性为贬义的词之间的关联性进 行比较, 根据比较结果判定词的极性。
     依据本发明的其它实施例, 还提供了相应的计算机可读存储介质和计算机程序产 品。
     根据本发明的实施例, 可以有效地构建极性词素数据库以及确定词的极性。
     通过以下结合附图对本发明的最佳实施例的详细说明, 本发明的这些以及其它的 优点将更加明显。 附图说明 参照下面结合附图对本发明实施例的说明, 会更加容易地理解本发明的以上和其 它目的、 特点和优点。附图中的部件只是为了示出本发明的原理。在附图中, 相同的或类似 的技术特征或部件将采用相同或类似的附图标记来表示。附图中 :
     图 1 示出了根据本发明的一个实施例的构建极性词素数据库的方法的流程图 ;
     图 2 示出了根据本发明的另一个实施例的构建极性词素数据库的方法的流程图 ;
     图 3 示出了根据本发明的另一个实施例的构建极性词素数据库的方法的流程图 ;
     图 4 示出了根据本发明的另一个实施例的构建极性词素数据库的方法的流程图 ;
     图 5 示出了根据本发明的一个实施例的用于确定词的极性的方法的流程图 ;
     图 6 示出了根据本发明的另一个实施例的用于确定词的极性的方法的流程图 ;
     图 7 示出了根据本发明的一个实施例的用于构建极性词素数据库的装置的框图 ;
     图 8 示出了根据本发明的另一个实施例的用于构建极性词素数据库的装置的框 图;
     图 9 示出了根据本发明的一个实施例的用于确定词的极性的装置的框图 ;
     图 10 示出了根据本发明的另一个实施例的用于确定词的极性的装置的框图 ; 以 及
     图 11 示出了可用于实施根据本发明实施例的方法和装置的计算机的示意性框 图。
     具体实施方式
     在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起见, 在说明书中并未描述实际实施方式的所有特征。 然而, 应该了解, 在开发任何这种实际实施 例的过程中必须做出很多特定于实施方式的决定, 以便实现开发人员的具体目标, 例如, 符 合与系统及业务相关的那些限制条件, 并且这些限制条件可能会随着实施方式的不同而有 所改变。此外, 还应该了解, 虽然开发工作有可能是非常复杂和费时的, 但对得益于本公开 内容的本领域技术人员来说, 这种开发工作仅仅是例行的任务。
     在此, 还需要说明的一点是, 为了避免因不必要的细节而模糊了本发明, 在附图和 说明中仅仅描述了与根据本发明的方案密切相关的装置结构和 / 或处理步骤, 而省略了对 与本发明关系不大的、 本领域普通技术人员已知的部件和处理的表示和描述。
     在以下的部分描述中, 以汉语为例子介绍了本发明的实施例。但是本发明不限于 此。本发明也可以适用于与汉语类似的语言。
     图 1 示出了一个实施例的构建极性词素数据库的方法的流程图。
     在步骤 S101 中, 从语料库和 / 或词语库中提取具有极性的单音节词。 在步骤 S102 中, 对具有极性的单音节词标注极性, 被标注极性的单音节词可以构成极性词素数据库。
     语料库可以是任何包含大量语料 ( 句子 ) 的集合。词语库可以是包括大量词语的词典。 在步骤 S102 中可以通过查询现有的极性词素数据库的方式来为单音节词标注极 性, 即褒义 (positive) 或者贬义 (negative), 也可以通过显示提取的单音节词并接收操作 者输入的该单音节词的极性的方式来标注极性。
     在本实施例中, 只利用具有极性的单音节词构成极性词素数据库。由于具有极性 的单音节词的数目相对较少, 而具有极性的双音节词或多音节词数量庞大。 另外, 绝大多数 具有极性的双音节词或多音节词都可以根据其中所包括的单音节词来确定其极性。 也就是 说, 一般地可以由单音节词的极性来确定双音节词或多音节词的词性。因此通过构建具有 较少数目的单音节词的极性词素数据库, 可以节省时间和成本。
     图 2 示出了根据本发明的另一个实施例的构建极性词素数据库的方法的流程图。
     在步骤 S201 中, 从语料库和 / 或词语库中提取具有极性的单音节词。
     在步骤 S202 中, 从具有极性的单音节词中选择预定数量的常用的单音节词。
     在步骤 S203 中, 对所选择的所述预定数量的常用的单音节词标注极性。被标注极 性的单音节词可以构成极性词素数据库。
     图 2 的实施例与图 1 的不同之处在于, 只选择预定数量的常用的单音节词进行标 注。在一个示例中, 步骤 S202 可以包括显示提取的单音节词并接收操作者的对与该单音节 词是否为常用的单音节词的输入。在另一个示例中, 步骤 S202 可以包括根据单音节词出现 的频率, 选择出现频率最高的预定数量的单音节词。单音词出现的频率可以通过查询现有 的统计结果获得, 或者可以在步骤 S201 中统计具有极性的单音节词在语料库和 / 或词语库 中出现的频率。
     在本实施例中, 通过只选择预定数量的常用的单音节词, 可以进一步减小极性词 素数据库的规模, 从而可以进一步节省时间和成本。
     图 3 示出了根据本发明的一个实施例的构建极性词素数据库的方法的流程图。
     在步骤 S301 中, 将双音节词语库中的双音节词切分成单音节词。
     在步骤 S302 中, 分析所切分的各个单音节词的词性。
     在步骤 S303 中, 根据所切分的各个单音节词的词性以及所切分的各个单音节词 在双音节词中的相对位置, 从切分的单音节词中选择非语义核心的具有极性的单音节词。
     在步骤 S304 中, 对具有极性的单音节词标注极性, 被标注极性的单音节词可以构 成极性词素数据库。
     在本实施例中, 从双音节词语库中提取具有极性的单音节词。双音节词语库可以 是任何已有双音节词语库, 可以是从通用词语库中选取双音节词而构成的双音节词语库。
     在步骤 S301 中, 将双音节词切分成单音节词是本领域的技术人员可以实现的。这 里不再详细描述。
     在步骤 S302 中, 可以采用各种已知的词性分析方法来分析所切分的各个单音节 词的词性。例如, 对于双音节词 “劣质” , 对其进行词性分析可以得到 “[ 劣 .a.][ 质 .n.]” , 即表示 “劣” 为形容词, “质” 为名词。
     在步骤 S303 中, 根据所切分的各个单音节词的词性以及所切分的各个单音节词 在双音节词中的相对位置, 从切分的单音节词中选择非语义核心的具有极性的单音节词。 可以采用各种方法来确定双音节词中哪个单音节词是具有极性的单音节词。例如, 对于
     “[ 劣 .a.][ 质 .n.]” , 由于第一个单音节词是形容词, 第二个单音节词是名词, 所以可以确 定 “劣” 是具有极性的单音节词。这里, 在双音节词 “劣质” 中, “质” 是语义核心, 而 “劣” 是 非语义核心。注意, 有可能一个双音节词中的两个单音节词都不被认为是具有极性的单音 节词。或者, 有可能一个双音节词中的两个单音节词都被认为是具有极性的单音节词。本 领域的技术人员还可以设想其他确定具有极性的单音节词的规则, 这里不再详细描述。
     步骤 S304 与图 1 中的步骤 S103 类似, 这里不再详细描述。
     与图 2 中的实施例类似, 在图 3 的实施例中, 也可以只选择预定数量的单音节词来 构成极性语素数据库。
     图 4 示出了根据本发明的另一个实施例的构建极性词素数据库的方法的流程图。
     在步骤 S401 中, 对语料库中的语句进行分词处理。
     在步骤 S402 中, 分析分词后的语句中的各个词的词性。
     在步骤 S403 中, 根据分词后的语句中的各个词的词性及相对位置, 从分词后的语 句中的各个词中选择非语义核心的具有极性的单音节词。
     在步骤 S404 中, 对具有极性的单音节词标注极性, 被标注极性的单音节词可以构 成极性词素数据库。 在步骤 S401 中, 本领域的技术人员可以采用各种方法进行分词处理。在本实施例 中, 一般将语句分词为单音节词和 / 或双音节词。 例如, 可以将语句 “从结果来看, 自动白平 衡所能获得的色温是非常准确的。 ” 分词为 “从 / 结果 / 来看 /, / 自动 / 白 / 平衡 / 所 / 能 / 获得 / 的 / 色 / 温 / 是 / 非常 / 准确 / 的 /。/” 。
     在步骤 S402 中, 可以采用各种已知的词性分析方法来分析分词后的语句中的各 个词的词性。例如, 对 “从 / 结果 / 来看 /, / 自动 / 白 / 平衡 / 所 / 能 / 获得 / 的 / 色 / 温 / 是 / 非常 / 准确 / 的 /。/” 进行词性分析可以得到 “从 /p 结果 /n 来看 /u, /w 自动 /d 白 /d 平衡 /a 所 /u 能 /v 获得 /v 的 /u 色 /n 温 /Ng 是 /v 非常 /d 准确 /a 的 /u。/w” , 其中 p 表示介词, n 表示名词, u 表示其他助词, w 表示标点符号, d 表示副词, a 表示形容词, v 表示 动词, Ng 表示名词性语素。
     在步骤 S403 中, 首先可以根据分词后的语句中的各个词的词性及相对位置, 从分 词后的语句中的各个词中选择具有极性的词。例如 “非常” 是副词, 其后的 “准确” 是形容 词, 可以将 “准确” 确定为具有极性的词。然后, 如果所确定的具有极性的词是双音节词或 多音节词, 可以将其切分为单音节词, 在根据所切分的各个单音节词的词性以及所切分的 各个单音节词在双音节词中的相对位置, 从切分的单音节词中选择非语义核心的具有极性 的单音节词。例如可以将 “准确” 中的 “准” 确定为非语义核心的具有极性的单音节词。
     步骤 S404 与图 2 中的步骤 S203 类似, 这里不再详细描述。
     与图 2 中的实施例类似, 在图 4 的实施例中, 也可以只选择预定数量的单音节词来 构成极性语素数据库。
     在一个实施例中, 可以将图 3 和图 4 相结合, 即将在步骤 303 和步骤 304 中获得的 具有极性的单音节词相组合, 对其标注极性, 从而构成极性语素数据库。
     图 5 示出了根据本发明的一个实施例的用于确定词的极性的方法的流程图。
     在步骤 S501 中, 对于要确定极性的词, 计算该词与预定的极性词素数据库中的每 个极性为褒义的词之间的互信息、 以及词与极性词素数据库中的每个极性为贬义的词之间
     的互信息。
     在步骤 S502 中, 根据所计算的词与极性词素数据库中的每个极性为褒义的词之 间的互信息, 计算词与极性词素数据库中的所有极性为褒义的词之间的关联性, 并根据所 计算的词与极性词素数据库中的每个极性为贬义的词之间的互信息, 计算词与极性词素数 据库中的所有极性为贬义的词之间的关联性。
     在步骤 S503 中, 对词与极性词素数据库中的所有极性为褒义的词之间的关联性 以及词与极性词素数据库中的所有极性为贬义的词之间的关联性进行比较, 根据比较结果 判定词的极性。
     在步骤 S501 中, 可以以各种方式计算词与词之间的互信息。
     例如, 可以采用如下公式计算互信息 :
     MI(w1, w2) = 2p(w1, w2)/[p(w1)+p(w2)]
     其中 w1 和 w2 表示要计算互信息的两个词, p(w1, w2) 是 w1 与 w2 共现的次数, p(w1) 表示 w1 出现的次数, p(w2) 表示 w2 出现的次数, MI(w1, w2) 表示 w1 和 w2 之间的互信息。 p(w1, w2), p(w1) 和 p(w2) 可以从各种现有的统计结果中得到。
     另外, 可以采用逐点互信息 PMI(Pointwise Mutual Information)。计算互信息 :
     其中 w1 和 w2 表示要计算互信息的两个词, p(w1, w2) 是 w1 与 w2 共现的次数, p(w1) 表示 w1 出现的次数, p(w2) 表示 w2 出现的次数, MI(w1, w2) 表示 w1 和 w2 之间的互信息。 p(w1, w2), p(w1) 和 p(w2) 可以从各种现有的统计结果中得到。
     在步骤 S502 中, 在一个示例中, 词与极性词素数据库中的所有极性为褒义的词之 间的关联性可以与词与极性词素数据库中的每个极性为褒义的词之间的互信息成正比, 词 与极性词素数据库中的所有极性为贬义的词之间的关联性计可以与词与极性词素数据库 中的每个极性为贬义的词之间的互信息成正比。
     在步骤 S503 中, 可以判断词与极性词素数据库中的所有极性为褒义的词之间的 关联性以及词与极性词素数据库中的所有极性为贬义的词之间的关联性二者孰大。如果 该词与极性词素数据库中的所有极性为褒义的词之间的关联性较大, 则判断该词为褒义。 如果该词与极性词素数据库中的所有极性为贬义的词之间的关联性较大, 则判断该词为贬 义。若二者相等, 可以判定该词无极性或者为中性词。
     图 6 示出了根据本发明的另一个实施例的用于确定词的极性的方法的流程图。
     在步骤 S601 中, 计算词与预定的极性词素数据库中的每个极性为褒义的词之间 的互信息、 以及词与极性词素数据库中的每个极性为贬义的词之间的互信息。
     在步骤 S602 中, 对所计算的词与极性词素数据库中的每个极性为褒义的词之间 的互信息进行求和, 获得第一求和结果。
     在步骤 S603 中, 对所计算的词与极性词素数据库中的每个极性为贬义的词之间 的互信息进行求和, 获得第二求和结果。
     在步骤 S604 中, 如果第一求和结果大于第二求和结果则判定词的极性为褒义, 如 果第一求和结果小于第二求和结果则判定词的极性为贬义。
     步骤 S601 与图 5 中的步骤 S501 类似, 这里不再详细描述。
     在步骤 S602 中, 利用以下公式计算第一求和结果 :其中 w 表示要确定极性的词, pw 表示预定的极性词素数据库中的极性为褒义的 词, p 表示极性词素数据库中的极性为褒义的词的集合, MI1 表示第一求和结果。
     在步骤 S603 中, 利用以下公式计算第二求和结果 :
     其中 w 表示要确定极性的词, nw 表示预定的极性词素数据库中的极性为贬义的 词, n 表示极性词素数据库中的极性为贬义的词的集合, MI2 表示第二求和结果。
     在步骤 S604 中, 如果 MI1 大于 MI2 则判定词的极性为褒义, 如果 MI1 小于 MI2 则 判定词的极性为贬义, 如果 MI1 等于 MI2, 可以判定该词无极性或者为中性词。
     在图 5 和图 6 所示的用于确定词的极性的方法的实施例中所利用的极性词素数据 库可以是在如图 1 ~图 4 所示的实施例中构建的极性词素数据库。但是, 本发明的实施例 不限于此。在图 5 和图 6 的实施例中也可以采用其他极性词素数据库, 例如既包括单音节 词也包括多音节词的极性词素数据库。
     图 7 示出了根据本发明的一个实施例的用于构建极性词素数据库的装置 700 的框 图。装置 700 包括提取单元 701 和标注单元 702。提取单元 701 被配置用于从语料库和 / 或词语库中提取具有极性的单音节词。标注单元 702 被配置用于对具有极性的单音节词标 注极性, 被标注极性的单音节词构成所述极性词素数据库。
     可选地, 上述词语库是双音节词语库, 并且提取单元 701 包括 : 切分模块, 被配置 用于将双音节词语库中的双音节词切分成单音节词 ; 分析模块, 被配置用于分析切分模块 所切分的各个单音节词的词性 ; 以及选择模块, 被配置用于根据所切分的各个单音节词的 词性以及所切分的各个单音节词在所述双音节词中的相对位置, 从切分模块所切分的单音 节词中选择非语义核心的具有极性的单音节词。
     可选地, 提取单元 701 包括 : 分词模块, 被配置用于对所述语料库中的语句进行分 词处理 ; 分析模块, 被配置用于分析被所述分词模块分词后的语句中的各个词的词性 ; 以 及选择模块, 被配置用于根据分析模块所分析的分词后的语句中的各个词的词性及相对位 置, 从被分词模块分词后的语句中的各个词中选择非语义核心的具有极性的单音节词。
     标注单元 702 可以通过查询现有的极性词素数据库的方式来为单音节词标注极 性。
     标注单元 702 也可以通过显示提取的单音节词并接收操作者输入的该单音节词 的极性的方式来标注极性。此时, 标注单元 702 可以包括显示器等显示模块或者鼠标等输 入模块。
     关于装置 700 的各个部分的操作和功能的细节可以参照结合图 1, 图 3 和图 4 描述 的本发明的实施例, 这里不再详细描述。
     图 8 示出了根据本发明的另一个实施例的用于构建极性词素数据库的装置 800 的 框图。装置 800 包括提取单元 801、 选择单元 802 和标注单元 803。提取单元 801 被配置用 于从语料库和 / 或词语库中提取具有极性的单音节词。选择单元 802 被配置用于从具有极
     性的单音节词中选择预定数量的常用的单音节词。标注单元 803 被配置用于对选择单元 802 所选择的所述预定数量的常用的单音节词标注极性, 被标注极性的单音节词构成所述 极性词素数据库。
     关于装置 800 的各个部分的操作和功能的细节可以参照结合图 2 描述的本发明的 实施例, 这里不再详细描述。
     图 9 示出了根据本发明的一个实施例的用于确定词的极性的装置 900 的框图。装 置 900 包括互信息计算单元 901, 被配置用于对于要确定极性的词, 计算词与预定的极性词 素数据库中的每个极性为褒义的词之间的互信息、 以及词与极性词素数据库中的每个极性 为贬义的词之间的互信息 ; 关联性计算单元 902, 被配置用于根据互信息计算单元所计算 的词与极性词素数据库中的每个极性为褒义的词之间的互信息, 计算词与极性词素数据库 中的所有极性为褒义的词之间的关联性, 并根据互信息计算单元所计算的词与极性词素数 据库中的每个极性为贬义的词之间的互信息, 计算词与极性词素数据库中的所有极性为贬 义的词之间的关联性 ; 以及判定单元 903, 被配置用于对关联性计算单元所计算的词与极 性词素数据库中的所有极性为褒义的词之间的关联性以及词与极性词素数据库中的所有 极性为贬义的词之间的关联性进行比较, 根据比较结果判定词的极性。 关于装置 900 的各个部分的操作和功能的细节可以参照结合图 5 描述的本发明的 实施例, 这里不再详细描述。
     图 10 示出了根据本发明的另一个实施例的用于确定词的极性的装置 1000 的框 图。装置 1000 包括互信息计算单元 1001、 关联性计算单元 1002 和判定单元 1005。
     互信息计算单元 1001 被配置用于对于要确定极性的词, 计算词与预定的极性词 素数据库中的每个极性为褒义的词之间的互信息、 以及词与极性词素数据库中的每个极性 为贬义的词之间的互信息。
     关联性计算单元 1002 包括第一求和模块 1003, 被配置用于对互信息计算单元所 计算的词与极性词素数据库中的每个极性为褒义的词之间的互信息进行求和, 获得第一求 和结果 ; 以及第二求和模块 1004, 被配置用于对互信息计算单元所计算的词与极性词素数 据库中的每个极性为贬义的词之间的互信息进行求和, 获得第二求和结果。
     判定单元 1005 被配置成 : 对关联性计算单元 1002 所获得的第一求和结果和第二 求和结果进行比较, 如果第一求和结果大于第二求和结果则判定词的极性为褒义, 如果第 一求和结果小于第二求和结果则判定词的极性为贬义。
     关于装置 1000 的各个部分的操作和功能的细节可以参照结合图 6 描述的本发明 的实施例, 这里不再详细描述。
     在图 9 和图 10 的装置 900 和装置 1000 中所利用的极性词素数据库可以是通过如 图 7 ~图 8 所示装置 700 和装置 800 构建的极性词素数据库。但是, 本发明的实施例不限 于此。装置 900 和装置 1000 中也可以采用其他极性词素数据库, 例如既包括单音节词也包 括多音节词的极性词素数据库。
     图 11 示出了可用于实施根据本发明实施例的方法和装置的计算机的示意性框 图。在图 11 中, 中央处理单元 (CPU)1101 根据只读存储器 (ROM)1102 中存储的程序或从存 储部分 1108 加载到随机存取存储器 (RAM)1103 的程序执行各种处理。在 RAM 1103 中, 还 根据需要存储当 CPU 1101 执行各种处理等等时所需的数据。CPU 1101、 ROM 1102 和 RAM
     1103 经由总线 504 彼此连接。输入 / 输出接口 1105 也连接到总线 1104。
     下述部件连接到输入 / 输出接口 1105 : 输入部分 1106( 包括键盘、 鼠标等等 )、 输 出部分 1107( 包括显示器, 比如阴极射线管 (CRT)、 液晶显示器 (LCD) 等, 和扬声器等 )、 存 储部分 1108( 包括硬盘等 )、 通信部分 1109( 包括网络接口卡比如 LAN 卡、 调制解调器等 )。 通信部分 1109 经由网络比如因特网执行通信处理。 根据需要, 驱动器 1110 也可连接到输入 / 输出接口 1105。可拆卸介质 1111 比如磁盘、 光盘、 磁光盘、 半导体存储器等等可以根据需 要被安装在驱动器 1110 上, 使得从中读出的计算机程序根据需要被安装到存储部分 1108 中。
     在通过软件实现上述系列处理的情况下, 从网络比如因特网或存储介质比如可拆 卸介质 1111 安装构成软件的程序。
     本领域的技术人员应当理解, 这种存储介质不局限于图 11 所示的其中存储有程 序、 与设备相分离地分发以向用户提供程序的可拆卸介质 1111。可拆卸介质 1111 的例子 包含磁盘 ( 包含软盘 ( 注册商标 ))、 光盘 ( 包含光盘只读存储器 (CD-ROM) 和数字通用盘 (DVD))、 磁光盘 ( 包含迷你盘 (MD)( 注册商标 )) 和半导体存储器。或者, 存储介质可以是 ROM 1102、 存储部分 1108 中包含的硬盘等等, 其中存有程序, 并且与包含它们的设备一起 被分发给用户。 本发明还提出一种存储有机器可读取的指令代码的程序产品。 所述指令代码由机 器读取并执行时, 可执行上述根据本发明实施例的方法。
     相应地, 用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包 括在本发明的公开中。所述存储介质包括但不限于软盘、 光盘、 磁光盘、 存储卡、 存储棒等 等。
     在上面对本发明具体实施例的描述中, 针对一种实施方式描述和 / 或示出的特征 可以以相同或类似的方式在一个或更多个其它实施方式中使用, 与其它实施方式中的特征 相组合, 或替代其它实施方式中的特征。
     应该强调, 术语 “包括 / 包含” 在本文使用时指特征、 要素、 步骤或组件的存在, 但 并不排除一个或更多个其它特征、 要素、 步骤或组件的存在或附加。
     此外, 本发明的方法不限于按照说明书中描述的时间顺序来执行, 也可以按照其 他的时间顺序地、 并行地或独立地执行。 因此, 本说明书中描述的方法的执行顺序不对本发 明的技术范围构成限制。
     尽管上面已经通过对本发明的具体实施例的描述对本发明进行了披露, 但是, 应 该理解, 上述的所有实施例和示例均是示例性的, 而非限制性的。 本领域的技术人员可在所 附权利要求的精神和范围内设计对本发明的各种修改、 改进或者等同物。 这些修改、 改进或 者等同物也应当被认为包括在本发明的保护范围内。
     关于包括以上各实施例的实施方式, 还公开了以下的附记。
     附记
     1. 一种用于构建极性词素数据库的方法, 包括 :
     从语料库和 / 或词语库中提取具有极性的单音节词 ; 以及
     对所述具有极性的单音节词标注极性, 所述被标注极性的单音节词构成所述极性 词素数据库。
     2. 如附记 1 所述的方法, 在所述标注之前还包括从所述具有极性的单音节词中选 择预定数量的常用的单音节词, 并且所述标注包括对所选择的所述预定数量的常用的单音 节词标注极性。
     3. 如附记 1 所述的方法, 其中所述词语库是双音节词语库, 并且所述提取具有极 性的单音节词包括 :
     将所述双音节词语库中的双音节词切分成单音节词 ;
     分析所切分的各个单音节词的词性 ; 以及
     根据所切分的各个单音节词的词性以及所切分的各个单音节词在所述双音节词 中的相对位置, 从所述切分的单音节词中选择非语义核心的具有极性的单音节词。
     4. 如附记 1 所述的方法, 其中所述提取具有极性的单音节词包括 :
     对所述语料库中的语句进行分词处理 ;
     分析分词后的语句中的各个词的词性 ; 以及
     根据分词后的语句中的各个词的词性及相对位置, 从分词后的语句中的各个词中 选择非语义核心的具有极性的单音节词。
     5. 一种用于确定词的极性的方法, 包括 : 对于要确定极性的词, 计算所述词与预定的极性词素数据库中的每个极性为褒义 的词之间的互信息、 以及所述词与所述极性词素数据库中的每个极性为贬义的词之间的互 信息 ;
     根据所计算的所述词与所述极性词素数据库中的每个极性为褒义的词之间的互 信息, 计算所述词与所述极性词素数据库中的所有极性为褒义的词之间的关联性, 并根据 所计算的所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息, 计算所述 词与所述极性词素数据库中的所有极性为贬义的词之间的关联性 ; 以及
     对所述词与所述极性词素数据库中的所有极性为褒义的词之间的关联性以及所 述词与所述极性词素数据库中的所有极性为贬义的词之间的关联性进行比较, 根据比较结 果判定所述词的极性。
     6. 如附记 5 所述的方法, 其中所述计算关联性的步骤包括 :
     对所计算的所述词与所述极性词素数据库中的每个极性为褒义的词之间的互信 息进行求和, 获得第一求和结果 ; 以及
     对所计算的所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信 息进行求和, 获得第二求和结果。
     7. 如附记 6 所述的方法, 其中所述判定的步骤包括 : 对所述第一求和结果和第二 求和结果进行比较, 如果第一求和结果大于第二求和结果则判定所述词的极性为褒义, 如 果第一求和结果小于第二求和结果则判定所述词的极性为贬义。
     8. 如附记 5 所述的方法, 其中所述极性词素数据库为由附记 1-4 中任一项所述的 方法构建的极性词素数据库。
     9. 一种用于构建极性词素数据库的装置, 包括 :
     提取单元, 被配置用于从语料库和 / 或词语库中提取具有极性的单音节词 ; 以及
     标注单元, 被配置用于对所述具有极性的单音节词标注极性, 所述被标注极性的 单音节词构成所述极性词素数据库。
     10. 如附记 9 所述的装置, 还包括选择单元, 被配置用于从所述具有极性的单音节 词中选择预定数量的常用的单音节词 ; 并且所述标注单元被配置用于对所述选择单元所选 择的所述预定数量的常用的单音节词标注极性。
     11. 如附记 9 所述的装置, 其中所述词语库是双音节词语库, 并且所述提取单元包 括:
     切分模块, 被配置用于将所述双音节词语库中的双音节词切分成单音节词 ;
     分析模块, 被配置用于分析切分模块所切分的各个单音节词的词性 ; 以及
     选择模块, 被配置用于根据所切分的各个单音节词的词性以及所切分的各个单音 节词在所述双音节词中的相对位置, 从切分模块所切分的单音节词中选择非语义核心的具 有极性的单音节词。
     12. 如附记 9 所述的装置, 其中所述提取单元包括 :
     分词模块, 被配置用于对所述语料库中的语句进行分词处理 ;
     分析模块, 被配置用于分析被所述分词模块分词后的语句中的各个词的词性 ; 以 及
     选择模块, 被配置用于根据所述分析模块所分析的分词后的语句中的各个词的词 性及相对位置, 从被所述分词模块分词后的语句中的各个词中选择非语义核心的具有极性 的单音节词。
     13. 一种用于确定词的极性的装置, 包括 :
     互信息计算单元, 被配置用于对于要确定极性的词, 计算所述词与预定的极性词 素数据库中的每个极性为褒义的词之间的互信息、 以及所述词与所述极性词素数据库中的 每个极性为贬义的词之间的互信息 ;
     关联性计算单元, 被配置用于根据互信息计算单元所计算的所述词与所述极性词 素数据库中的每个极性为褒义的词之间的互信息, 计算所述词与所述极性词素数据库中的 所有极性为褒义的词之间的关联性, 并根据互信息计算单元所计算的所述词与所述极性词 素数据库中的每个极性为贬义的词之间的互信息, 计算所述词与所述极性词素数据库中的 所有极性为贬义的词之间的关联性 ; 以及
     判定单元, 被配置用于对关联性计算单元所计算的所述词与所述极性词素数据库 中的所有极性为褒义的词之间的关联性以及所述词与所述极性词素数据库中的所有极性 为贬义的词之间的关联性进行比较, 根据比较结果判定所述词的极性。
     14. 如附记 13 所述的装置, 其中所述关联性计算单元包括 :
     第一求和模块, 被配置用于对互信息计算单元所计算的所述词与所述极性词素数 据库中的每个极性为褒义的词之间的互信息进行求和, 获得第一求和结果 ; 以及
     第二求和模块, 被配置用于对互信息计算单元所计算的所述词与所述极性词素数 据库中的每个极性为贬义的词之间的互信息进行求和, 获得第二求和结果。
     15. 如附记 14 所述的装置, 其中所述判定单元被配置成 : 对所述关联性计算单元 所获得的所述第一求和结果和第二求和结果进行比较, 如果第一求和结果大于第二求和结 果则判定所述词的极性为褒义, 如果第一求和结果小于第二求和结果则判定所述词的极性 为贬义。
     16. 如附记 13 所述的装置, 其中所述极性词素数据库为由附记 9-12 中任一项所述的装置构建的极性词素数据库。

用于构建极性词素数据库以及确定词的极性的方法和装置.pdf_第1页
第1页 / 共22页
用于构建极性词素数据库以及确定词的极性的方法和装置.pdf_第2页
第2页 / 共22页
用于构建极性词素数据库以及确定词的极性的方法和装置.pdf_第3页
第3页 / 共22页
点击查看更多>>
资源描述

《用于构建极性词素数据库以及确定词的极性的方法和装置.pdf》由会员分享,可在线阅读,更多相关《用于构建极性词素数据库以及确定词的极性的方法和装置.pdf(22页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN102375838A43申请公布日20120314CN102375838ACN102375838A21申请号201010257635122申请日20100817G06F17/30200601G06F17/2720060171申请人富士通株式会社地址日本神奈川县72发明人张洁孟遥于浩74专利代理机构北京集佳知识产权代理有限公司11227代理人潘士霖李春晖54发明名称用于构建极性词素数据库以及确定词的极性的方法和装置57摘要用于构建极性词素数据库以及确定词的极性的方法和装置。用于确定词的极性的方法包括对于要确定极性的词,计算其与预定的极性词素数据库中的每个极性为褒义的词之间的互信。

2、息、与所述极性词素数据库中的每个极性为贬义的词之间的互信息;根据所计算的词与极性词素数据库中的每个极性为褒义的词之间的互信息,计算词与极性词素数据库中的所有极性为褒义的词之间的关联性,根据所计算的词与极性词素数据库中的每个极性为贬义的词之间的互信息,计算词与极性词素数据库中的所有极性为贬义的词之间的关联性;以及对以上两种关联性进行比较,根据比较结果判定词的极性。51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书11页附图8页CN102375845A1/2页21一种用于构建极性词素数据库的方法,包括从语料库和/或词语库中提取具有极性的单音节词;以及对所述具有极性的。

3、单音节词标注极性,所述被标注极性的单音节词构成所述极性词素数据库。2一种用于确定词的极性的方法,包括对于要确定极性的词,计算所述词与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、以及所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息;根据所计算的所述词与所述极性词素数据库中的每个极性为褒义的词之间的互信息,计算所述词与所述极性词素数据库中的所有极性为褒义的词之间的关联性,并根据所计算的所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息,计算所述词与所述极性词素数据库中的所有极性为贬义的词之间的关联性;以及对所述词与所述极性词素数据库中的所有极性为褒义的词之间的关联。

4、性以及所述词与所述极性词素数据库中的所有极性为贬义的词之间的关联性进行比较,根据比较结果判定所述词的极性。3如权利要求2所述的方法,其中所述计算关联性的步骤包括对所计算的所述词与所述极性词素数据库中的每个极性为褒义的词之间的互信息进行求和,获得第一求和结果;以及对所计算的所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息进行求和,获得第二求和结果。4如权利要求3所述的方法,其中所述判定的步骤包括对所述第一求和结果和第二求和结果进行比较,如果第一求和结果大于第二求和结果则判定所述词的极性为褒义,如果第一求和结果小于第二求和结果则判定所述词的极性为贬义。5如权利要求2所述的方法,其中所述。

5、极性词素数据库为由权利要求1所述的方法构建的极性词素数据库。6一种用于构建极性词素数据库的装置,包括提取单元,被配置用于从语料库和/或词语库中提取具有极性的单音节词;以及标注单元,被配置用于对所述具有极性的单音节词标注极性,所述被标注极性的单音节词构成所述极性词素数据库。7一种用于确定词的极性的装置,包括互信息计算单元,被配置用于对于要确定极性的词,计算所述词与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、以及所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息;关联性计算单元,被配置用于根据互信息计算单元所计算的所述词与所述极性词素数据库中的每个极性为褒义的词之间的互信息,。

6、计算所述词与所述极性词素数据库中的所有极性为褒义的词之间的关联性,并根据互信息计算单元所计算的所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息,计算所述词与所述极性词素数据库中的所有极性为贬义的词之间的关联性;以及判定单元,被配置用于对关联性计算单元所计算的所述词与所述极性词素数据库中的权利要求书CN102375838ACN102375845A2/2页3所有极性为褒义的词之间的关联性以及所述词与所述极性词素数据库中的所有极性为贬义的词之间的关联性进行比较,根据比较结果判定所述词的极性。8如权利要求7所述的装置,其中所述关联性计算单元包括第一求和模块,被配置用于对互信息计算单元所计算。

7、的所述词与所述极性词素数据库中的每个极性为褒义的词之间的互信息进行求和,获得第一求和结果;以及第二求和模块,被配置用于对互信息计算单元所计算的所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息进行求和,获得第二求和结果。9如权利要求8所述的装置,其中所述判定单元被配置成对所述关联性计算单元所获得的所述第一求和结果和第二求和结果进行比较,如果第一求和结果大于第二求和结果则判定所述词的极性为褒义,如果第一求和结果小于第二求和结果则判定所述词的极性为贬义。10如权利要求7所述的装置,其中所述极性词素数据库为由权利要求6所述的装置构建的极性词素数据库。权利要求书CN102375838ACN1。

8、02375845A1/11页4用于构建极性词素数据库以及确定词的极性的方法和装置技术领域0001本发明一般地涉及文字处理。更具体地,本发明涉及词的极性的判断。背景技术0002词的极性POLARITY的确定广泛应用于文章分类、观点挖掘和情感分析等。在传统的方法中,为了提高词的极性识别的性能,构造包括大量的具有手工标注词性的词的词典。构造这样的词典费时且成本高。发明内容0003根据本发明的第一方面,提供了一种用于构建极性词素数据库的方法,包括从语料库和/或词语库中提取具有极性的单音节词;以及对具有极性的单音节词标注极性,被标注极性的单音节词构成极性词素数据库。0004根据本发明的第二方面,提供了一。

9、种用于确定词的极性的方法,包括0005对于要确定极性的词,计算词与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、以及词与极性词素数据库中的每个极性为贬义的词之间的互信息;根据所计算的词与极性词素数据库中的每个极性为褒义的词之间的互信息,计算词与极性词素数据库中的所有极性为褒义的词之间的关联性,并根据所计算的词与极性词素数据库中的每个极性为贬义的词之间的互信息,计算词与极性词素数据库中的所有极性为贬义的词之间的关联性;以及对词与极性词素数据库中的所有极性为褒义的词之间的关联性以及词与极性词素数据库中的所有极性为贬义的词之间的关联性进行比较,根据比较结果判定词的极性。0006根据本发明的。

10、第三方面,提供了一种用于构建极性词素数据库的装置,包括提取单元,被配置用于从语料库和/或词语库中提取具有极性的单音节词;以及标注单元,被配置用于对具有极性的单音节词标注极性,被标注极性的单音节词构成极性词素数据库。0007根据本发明的第四方面,提供了一种用于确定词的极性的装置,包括互信息计算单元,被配置用于对于要确定极性的词,计算词与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、以及词与极性词素数据库中的每个极性为贬义的词之间的互信息;关联性计算单元,被配置用于根据互信息计算单元所计算的词与极性词素数据库中的每个极性为褒义的词之间的互信息,计算词与极性词素数据库中的所有极性为褒义的词。

11、之间的关联性,并根据互信息计算单元所计算的词与极性词素数据库中的每个极性为贬义的词之间的互信息,计算词与极性词素数据库中的所有极性为贬义的词之间的关联性;以及判定单元,被配置用于对关联性计算单元所计算的词与极性词素数据库中的所有极性为褒义的词之间的关联性以及词与极性词素数据库中的所有极性为贬义的词之间的关联性进行比较,根据比较结果判定词的极性。0008依据本发明的其它实施例,还提供了相应的计算机可读存储介质和计算机程序产品。说明书CN102375838ACN102375845A2/11页50009根据本发明的实施例,可以有效地构建极性词素数据库以及确定词的极性。0010通过以下结合附图对本发明。

12、的最佳实施例的详细说明,本发明的这些以及其它的优点将更加明显。附图说明0011参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。附图中0012图1示出了根据本发明的一个实施例的构建极性词素数据库的方法的流程图;0013图2示出了根据本发明的另一个实施例的构建极性词素数据库的方法的流程图;0014图3示出了根据本发明的另一个实施例的构建极性词素数据库的方法的流程图;0015图4示出了根据本发明的另一个实施例的构建极性词素数据库的方法的流程图;001。

13、6图5示出了根据本发明的一个实施例的用于确定词的极性的方法的流程图;0017图6示出了根据本发明的另一个实施例的用于确定词的极性的方法的流程图;0018图7示出了根据本发明的一个实施例的用于构建极性词素数据库的装置的框图;0019图8示出了根据本发明的另一个实施例的用于构建极性词素数据库的装置的框图;0020图9示出了根据本发明的一个实施例的用于确定词的极性的装置的框图;0021图10示出了根据本发明的另一个实施例的用于确定词的极性的装置的框图;以及0022图11示出了可用于实施根据本发明实施例的方法和装置的计算机的示意性框图。具体实施方式0023在下文中将结合附图对本发明的示范性实施例进行描。

14、述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。0024在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图和说明中仅仅描述了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了对与本发明关系不大的、本领域普通技术人员已知的。

15、部件和处理的表示和描述。0025在以下的部分描述中,以汉语为例子介绍了本发明的实施例。但是本发明不限于此。本发明也可以适用于与汉语类似的语言。0026图1示出了一个实施例的构建极性词素数据库的方法的流程图。0027在步骤S101中,从语料库和/或词语库中提取具有极性的单音节词。在步骤S102中,对具有极性的单音节词标注极性,被标注极性的单音节词可以构成极性词素数据库。0028语料库可以是任何包含大量语料句子的集合。词语库可以是包括大量词语的说明书CN102375838ACN102375845A3/11页6词典。0029在步骤S102中可以通过查询现有的极性词素数据库的方式来为单音节词标注极性,。

16、即褒义POSITIVE或者贬义NEGATIVE,也可以通过显示提取的单音节词并接收操作者输入的该单音节词的极性的方式来标注极性。0030在本实施例中,只利用具有极性的单音节词构成极性词素数据库。由于具有极性的单音节词的数目相对较少,而具有极性的双音节词或多音节词数量庞大。另外,绝大多数具有极性的双音节词或多音节词都可以根据其中所包括的单音节词来确定其极性。也就是说,一般地可以由单音节词的极性来确定双音节词或多音节词的词性。因此通过构建具有较少数目的单音节词的极性词素数据库,可以节省时间和成本。0031图2示出了根据本发明的另一个实施例的构建极性词素数据库的方法的流程图。0032在步骤S201中。

17、,从语料库和/或词语库中提取具有极性的单音节词。0033在步骤S202中,从具有极性的单音节词中选择预定数量的常用的单音节词。0034在步骤S203中,对所选择的所述预定数量的常用的单音节词标注极性。被标注极性的单音节词可以构成极性词素数据库。0035图2的实施例与图1的不同之处在于,只选择预定数量的常用的单音节词进行标注。在一个示例中,步骤S202可以包括显示提取的单音节词并接收操作者的对与该单音节词是否为常用的单音节词的输入。在另一个示例中,步骤S202可以包括根据单音节词出现的频率,选择出现频率最高的预定数量的单音节词。单音词出现的频率可以通过查询现有的统计结果获得,或者可以在步骤S20。

18、1中统计具有极性的单音节词在语料库和/或词语库中出现的频率。0036在本实施例中,通过只选择预定数量的常用的单音节词,可以进一步减小极性词素数据库的规模,从而可以进一步节省时间和成本。0037图3示出了根据本发明的一个实施例的构建极性词素数据库的方法的流程图。0038在步骤S301中,将双音节词语库中的双音节词切分成单音节词。0039在步骤S302中,分析所切分的各个单音节词的词性。0040在步骤S303中,根据所切分的各个单音节词的词性以及所切分的各个单音节词在双音节词中的相对位置,从切分的单音节词中选择非语义核心的具有极性的单音节词。0041在步骤S304中,对具有极性的单音节词标注极性,。

19、被标注极性的单音节词可以构成极性词素数据库。0042在本实施例中,从双音节词语库中提取具有极性的单音节词。双音节词语库可以是任何已有双音节词语库,可以是从通用词语库中选取双音节词而构成的双音节词语库。0043在步骤S301中,将双音节词切分成单音节词是本领域的技术人员可以实现的。这里不再详细描述。0044在步骤S302中,可以采用各种已知的词性分析方法来分析所切分的各个单音节词的词性。例如,对于双音节词“劣质”,对其进行词性分析可以得到“劣A质N”,即表示“劣”为形容词,“质”为名词。0045在步骤S303中,根据所切分的各个单音节词的词性以及所切分的各个单音节词在双音节词中的相对位置,从切分。

20、的单音节词中选择非语义核心的具有极性的单音节词。可以采用各种方法来确定双音节词中哪个单音节词是具有极性的单音节词。例如,对于说明书CN102375838ACN102375845A4/11页7“劣A质N”,由于第一个单音节词是形容词,第二个单音节词是名词,所以可以确定“劣”是具有极性的单音节词。这里,在双音节词“劣质”中,“质”是语义核心,而“劣”是非语义核心。注意,有可能一个双音节词中的两个单音节词都不被认为是具有极性的单音节词。或者,有可能一个双音节词中的两个单音节词都被认为是具有极性的单音节词。本领域的技术人员还可以设想其他确定具有极性的单音节词的规则,这里不再详细描述。0046步骤S30。

21、4与图1中的步骤S103类似,这里不再详细描述。0047与图2中的实施例类似,在图3的实施例中,也可以只选择预定数量的单音节词来构成极性语素数据库。0048图4示出了根据本发明的另一个实施例的构建极性词素数据库的方法的流程图。0049在步骤S401中,对语料库中的语句进行分词处理。0050在步骤S402中,分析分词后的语句中的各个词的词性。0051在步骤S403中,根据分词后的语句中的各个词的词性及相对位置,从分词后的语句中的各个词中选择非语义核心的具有极性的单音节词。0052在步骤S404中,对具有极性的单音节词标注极性,被标注极性的单音节词可以构成极性词素数据库。0053在步骤S401中,。

22、本领域的技术人员可以采用各种方法进行分词处理。在本实施例中,一般将语句分词为单音节词和/或双音节词。例如,可以将语句“从结果来看,自动白平衡所能获得的色温是非常准确的。”分词为“从/结果/来看/,/自动/白/平衡/所/能/获得/的/色/温/是/非常/准确/的/。/”。0054在步骤S402中,可以采用各种已知的词性分析方法来分析分词后的语句中的各个词的词性。例如,对“从/结果/来看/,/自动/白/平衡/所/能/获得/的/色/温/是/非常/准确/的/。/”进行词性分析可以得到“从/P结果/N来看/U,/W自动/D白/D平衡/A所/U能/V获得/V的/U色/N温/NG是/V非常/D准确/A的/U。。

23、/W”,其中P表示介词,N表示名词,U表示其他助词,W表示标点符号,D表示副词,A表示形容词,V表示动词,NG表示名词性语素。0055在步骤S403中,首先可以根据分词后的语句中的各个词的词性及相对位置,从分词后的语句中的各个词中选择具有极性的词。例如“非常”是副词,其后的“准确”是形容词,可以将“准确”确定为具有极性的词。然后,如果所确定的具有极性的词是双音节词或多音节词,可以将其切分为单音节词,在根据所切分的各个单音节词的词性以及所切分的各个单音节词在双音节词中的相对位置,从切分的单音节词中选择非语义核心的具有极性的单音节词。例如可以将“准确”中的“准”确定为非语义核心的具有极性的单音节词。

24、。0056步骤S404与图2中的步骤S203类似,这里不再详细描述。0057与图2中的实施例类似,在图4的实施例中,也可以只选择预定数量的单音节词来构成极性语素数据库。0058在一个实施例中,可以将图3和图4相结合,即将在步骤303和步骤304中获得的具有极性的单音节词相组合,对其标注极性,从而构成极性语素数据库。0059图5示出了根据本发明的一个实施例的用于确定词的极性的方法的流程图。0060在步骤S501中,对于要确定极性的词,计算该词与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、以及词与极性词素数据库中的每个极性为贬义的词之间说明书CN102375838ACN10237584。

25、5A5/11页8的互信息。0061在步骤S502中,根据所计算的词与极性词素数据库中的每个极性为褒义的词之间的互信息,计算词与极性词素数据库中的所有极性为褒义的词之间的关联性,并根据所计算的词与极性词素数据库中的每个极性为贬义的词之间的互信息,计算词与极性词素数据库中的所有极性为贬义的词之间的关联性。0062在步骤S503中,对词与极性词素数据库中的所有极性为褒义的词之间的关联性以及词与极性词素数据库中的所有极性为贬义的词之间的关联性进行比较,根据比较结果判定词的极性。0063在步骤S501中,可以以各种方式计算词与词之间的互信息。0064例如,可以采用如下公式计算互信息0065MIW1,W2。

26、2PW1,W2/PW1PW20066其中W1和W2表示要计算互信息的两个词,PW1,W2是W1与W2共现的次数,PW1表示W1出现的次数,PW2表示W2出现的次数,MIW1,W2表示W1和W2之间的互信息。PW1,W2,PW1和PW2可以从各种现有的统计结果中得到。0067另外,可以采用逐点互信息PMIPOINTWISEMUTUALINFORMATION。计算互信息00680069其中W1和W2表示要计算互信息的两个词,PW1,W2是W1与W2共现的次数,PW1表示W1出现的次数,PW2表示W2出现的次数,MIW1,W2表示W1和W2之间的互信息。PW1,W2,PW1和PW2可以从各种现有的统。

27、计结果中得到。0070在步骤S502中,在一个示例中,词与极性词素数据库中的所有极性为褒义的词之间的关联性可以与词与极性词素数据库中的每个极性为褒义的词之间的互信息成正比,词与极性词素数据库中的所有极性为贬义的词之间的关联性计可以与词与极性词素数据库中的每个极性为贬义的词之间的互信息成正比。0071在步骤S503中,可以判断词与极性词素数据库中的所有极性为褒义的词之间的关联性以及词与极性词素数据库中的所有极性为贬义的词之间的关联性二者孰大。如果该词与极性词素数据库中的所有极性为褒义的词之间的关联性较大,则判断该词为褒义。如果该词与极性词素数据库中的所有极性为贬义的词之间的关联性较大,则判断该词。

28、为贬义。若二者相等,可以判定该词无极性或者为中性词。0072图6示出了根据本发明的另一个实施例的用于确定词的极性的方法的流程图。0073在步骤S601中,计算词与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、以及词与极性词素数据库中的每个极性为贬义的词之间的互信息。0074在步骤S602中,对所计算的词与极性词素数据库中的每个极性为褒义的词之间的互信息进行求和,获得第一求和结果。0075在步骤S603中,对所计算的词与极性词素数据库中的每个极性为贬义的词之间的互信息进行求和,获得第二求和结果。0076在步骤S604中,如果第一求和结果大于第二求和结果则判定词的极性为褒义,如果第一求和。

29、结果小于第二求和结果则判定词的极性为贬义。0077步骤S601与图5中的步骤S501类似,这里不再详细描述。说明书CN102375838ACN102375845A6/11页90078在步骤S602中,利用以下公式计算第一求和结果00790080其中W表示要确定极性的词,PW表示预定的极性词素数据库中的极性为褒义的词,P表示极性词素数据库中的极性为褒义的词的集合,MI1表示第一求和结果。0081在步骤S603中,利用以下公式计算第二求和结果00820083其中W表示要确定极性的词,NW表示预定的极性词素数据库中的极性为贬义的词,N表示极性词素数据库中的极性为贬义的词的集合,MI2表示第二求和结果。

30、。0084在步骤S604中,如果MI1大于MI2则判定词的极性为褒义,如果MI1小于MI2则判定词的极性为贬义,如果MI1等于MI2,可以判定该词无极性或者为中性词。0085在图5和图6所示的用于确定词的极性的方法的实施例中所利用的极性词素数据库可以是在如图1图4所示的实施例中构建的极性词素数据库。但是,本发明的实施例不限于此。在图5和图6的实施例中也可以采用其他极性词素数据库,例如既包括单音节词也包括多音节词的极性词素数据库。0086图7示出了根据本发明的一个实施例的用于构建极性词素数据库的装置700的框图。装置700包括提取单元701和标注单元702。提取单元701被配置用于从语料库和/或。

31、词语库中提取具有极性的单音节词。标注单元702被配置用于对具有极性的单音节词标注极性,被标注极性的单音节词构成所述极性词素数据库。0087可选地,上述词语库是双音节词语库,并且提取单元701包括切分模块,被配置用于将双音节词语库中的双音节词切分成单音节词;分析模块,被配置用于分析切分模块所切分的各个单音节词的词性;以及选择模块,被配置用于根据所切分的各个单音节词的词性以及所切分的各个单音节词在所述双音节词中的相对位置,从切分模块所切分的单音节词中选择非语义核心的具有极性的单音节词。0088可选地,提取单元701包括分词模块,被配置用于对所述语料库中的语句进行分词处理;分析模块,被配置用于分析被。

32、所述分词模块分词后的语句中的各个词的词性;以及选择模块,被配置用于根据分析模块所分析的分词后的语句中的各个词的词性及相对位置,从被分词模块分词后的语句中的各个词中选择非语义核心的具有极性的单音节词。0089标注单元702可以通过查询现有的极性词素数据库的方式来为单音节词标注极性。0090标注单元702也可以通过显示提取的单音节词并接收操作者输入的该单音节词的极性的方式来标注极性。此时,标注单元702可以包括显示器等显示模块或者鼠标等输入模块。0091关于装置700的各个部分的操作和功能的细节可以参照结合图1,图3和图4描述的本发明的实施例,这里不再详细描述。0092图8示出了根据本发明的另一个。

33、实施例的用于构建极性词素数据库的装置800的框图。装置800包括提取单元801、选择单元802和标注单元803。提取单元801被配置用于从语料库和/或词语库中提取具有极性的单音节词。选择单元802被配置用于从具有极说明书CN102375838ACN102375845A7/11页10性的单音节词中选择预定数量的常用的单音节词。标注单元803被配置用于对选择单元802所选择的所述预定数量的常用的单音节词标注极性,被标注极性的单音节词构成所述极性词素数据库。0093关于装置800的各个部分的操作和功能的细节可以参照结合图2描述的本发明的实施例,这里不再详细描述。0094图9示出了根据本发明的一个实施。

34、例的用于确定词的极性的装置900的框图。装置900包括互信息计算单元901,被配置用于对于要确定极性的词,计算词与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、以及词与极性词素数据库中的每个极性为贬义的词之间的互信息;关联性计算单元902,被配置用于根据互信息计算单元所计算的词与极性词素数据库中的每个极性为褒义的词之间的互信息,计算词与极性词素数据库中的所有极性为褒义的词之间的关联性,并根据互信息计算单元所计算的词与极性词素数据库中的每个极性为贬义的词之间的互信息,计算词与极性词素数据库中的所有极性为贬义的词之间的关联性;以及判定单元903,被配置用于对关联性计算单元所计算的词与极性。

35、词素数据库中的所有极性为褒义的词之间的关联性以及词与极性词素数据库中的所有极性为贬义的词之间的关联性进行比较,根据比较结果判定词的极性。0095关于装置900的各个部分的操作和功能的细节可以参照结合图5描述的本发明的实施例,这里不再详细描述。0096图10示出了根据本发明的另一个实施例的用于确定词的极性的装置1000的框图。装置1000包括互信息计算单元1001、关联性计算单元1002和判定单元1005。0097互信息计算单元1001被配置用于对于要确定极性的词,计算词与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、以及词与极性词素数据库中的每个极性为贬义的词之间的互信息。0098关。

36、联性计算单元1002包括第一求和模块1003,被配置用于对互信息计算单元所计算的词与极性词素数据库中的每个极性为褒义的词之间的互信息进行求和,获得第一求和结果;以及第二求和模块1004,被配置用于对互信息计算单元所计算的词与极性词素数据库中的每个极性为贬义的词之间的互信息进行求和,获得第二求和结果。0099判定单元1005被配置成对关联性计算单元1002所获得的第一求和结果和第二求和结果进行比较,如果第一求和结果大于第二求和结果则判定词的极性为褒义,如果第一求和结果小于第二求和结果则判定词的极性为贬义。0100关于装置1000的各个部分的操作和功能的细节可以参照结合图6描述的本发明的实施例,这。

37、里不再详细描述。0101在图9和图10的装置900和装置1000中所利用的极性词素数据库可以是通过如图7图8所示装置700和装置800构建的极性词素数据库。但是,本发明的实施例不限于此。装置900和装置1000中也可以采用其他极性词素数据库,例如既包括单音节词也包括多音节词的极性词素数据库。0102图11示出了可用于实施根据本发明实施例的方法和装置的计算机的示意性框图。在图11中,中央处理单元CPU1101根据只读存储器ROM1102中存储的程序或从存储部分1108加载到随机存取存储器RAM1103的程序执行各种处理。在RAM1103中,还根据需要存储当CPU1101执行各种处理等等时所需的数。

38、据。CPU1101、ROM1102和RAM说明书CN102375838ACN102375845A8/11页111103经由总线504彼此连接。输入/输出接口1105也连接到总线1104。0103下述部件连接到输入/输出接口1105输入部分1106包括键盘、鼠标等等、输出部分1107包括显示器,比如阴极射线管CRT、液晶显示器LCD等,和扬声器等、存储部分1108包括硬盘等、通信部分1109包括网络接口卡比如LAN卡、调制解调器等。通信部分1109经由网络比如因特网执行通信处理。根据需要,驱动器1110也可连接到输入/输出接口1105。可拆卸介质1111比如磁盘、光盘、磁光盘、半导体存储器等等可。

39、以根据需要被安装在驱动器1110上,使得从中读出的计算机程序根据需要被安装到存储部分1108中。0104在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质1111安装构成软件的程序。0105本领域的技术人员应当理解,这种存储介质不局限于图11所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1111。可拆卸介质1111的例子包含磁盘包含软盘注册商标、光盘包含光盘只读存储器CDROM和数字通用盘DVD、磁光盘包含迷你盘MD注册商标和半导体存储器。或者,存储介质可以是ROM1102、存储部分1108中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起。

40、被分发给用户。0106本发明还提出一种存储有机器可读取的指令代码的程序产品。所述指令代码由机器读取并执行时,可执行上述根据本发明实施例的方法。0107相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。所述存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等等。0108在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。0109应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其。

41、它特征、要素、步骤或组件的存在或附加。0110此外,本发明的方法不限于按照说明书中描述的时间顺序来执行,也可以按照其他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。0111尽管上面已经通过对本发明的具体实施例的描述对本发明进行了披露,但是,应该理解,上述的所有实施例和示例均是示例性的,而非限制性的。本领域的技术人员可在所附权利要求的精神和范围内设计对本发明的各种修改、改进或者等同物。这些修改、改进或者等同物也应当被认为包括在本发明的保护范围内。0112关于包括以上各实施例的实施方式,还公开了以下的附记。0113附记01141一种用于构建极性。

42、词素数据库的方法,包括0115从语料库和/或词语库中提取具有极性的单音节词;以及0116对所述具有极性的单音节词标注极性,所述被标注极性的单音节词构成所述极性词素数据库。说明书CN102375838ACN102375845A9/11页1201172如附记1所述的方法,在所述标注之前还包括从所述具有极性的单音节词中选择预定数量的常用的单音节词,并且所述标注包括对所选择的所述预定数量的常用的单音节词标注极性。01183如附记1所述的方法,其中所述词语库是双音节词语库,并且所述提取具有极性的单音节词包括0119将所述双音节词语库中的双音节词切分成单音节词;0120分析所切分的各个单音节词的词性;以及。

43、0121根据所切分的各个单音节词的词性以及所切分的各个单音节词在所述双音节词中的相对位置,从所述切分的单音节词中选择非语义核心的具有极性的单音节词。01224如附记1所述的方法,其中所述提取具有极性的单音节词包括0123对所述语料库中的语句进行分词处理;0124分析分词后的语句中的各个词的词性;以及0125根据分词后的语句中的各个词的词性及相对位置,从分词后的语句中的各个词中选择非语义核心的具有极性的单音节词。01265一种用于确定词的极性的方法,包括0127对于要确定极性的词,计算所述词与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、以及所述词与所述极性词素数据库中的每个极性为贬义。

44、的词之间的互信息;0128根据所计算的所述词与所述极性词素数据库中的每个极性为褒义的词之间的互信息,计算所述词与所述极性词素数据库中的所有极性为褒义的词之间的关联性,并根据所计算的所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息,计算所述词与所述极性词素数据库中的所有极性为贬义的词之间的关联性;以及0129对所述词与所述极性词素数据库中的所有极性为褒义的词之间的关联性以及所述词与所述极性词素数据库中的所有极性为贬义的词之间的关联性进行比较,根据比较结果判定所述词的极性。01306如附记5所述的方法,其中所述计算关联性的步骤包括0131对所计算的所述词与所述极性词素数据库中的每个极性。

45、为褒义的词之间的互信息进行求和,获得第一求和结果;以及0132对所计算的所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息进行求和,获得第二求和结果。01337如附记6所述的方法,其中所述判定的步骤包括对所述第一求和结果和第二求和结果进行比较,如果第一求和结果大于第二求和结果则判定所述词的极性为褒义,如果第一求和结果小于第二求和结果则判定所述词的极性为贬义。01348如附记5所述的方法,其中所述极性词素数据库为由附记14中任一项所述的方法构建的极性词素数据库。01359一种用于构建极性词素数据库的装置,包括0136提取单元,被配置用于从语料库和/或词语库中提取具有极性的单音节词;以及。

46、0137标注单元,被配置用于对所述具有极性的单音节词标注极性,所述被标注极性的单音节词构成所述极性词素数据库。说明书CN102375838ACN102375845A10/11页13013810如附记9所述的装置,还包括选择单元,被配置用于从所述具有极性的单音节词中选择预定数量的常用的单音节词;并且所述标注单元被配置用于对所述选择单元所选择的所述预定数量的常用的单音节词标注极性。013911如附记9所述的装置,其中所述词语库是双音节词语库,并且所述提取单元包括0140切分模块,被配置用于将所述双音节词语库中的双音节词切分成单音节词;0141分析模块,被配置用于分析切分模块所切分的各个单音节词的词。

47、性;以及0142选择模块,被配置用于根据所切分的各个单音节词的词性以及所切分的各个单音节词在所述双音节词中的相对位置,从切分模块所切分的单音节词中选择非语义核心的具有极性的单音节词。014312如附记9所述的装置,其中所述提取单元包括0144分词模块,被配置用于对所述语料库中的语句进行分词处理;0145分析模块,被配置用于分析被所述分词模块分词后的语句中的各个词的词性;以及0146选择模块,被配置用于根据所述分析模块所分析的分词后的语句中的各个词的词性及相对位置,从被所述分词模块分词后的语句中的各个词中选择非语义核心的具有极性的单音节词。014713一种用于确定词的极性的装置,包括0148互信。

48、息计算单元,被配置用于对于要确定极性的词,计算所述词与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、以及所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息;0149关联性计算单元,被配置用于根据互信息计算单元所计算的所述词与所述极性词素数据库中的每个极性为褒义的词之间的互信息,计算所述词与所述极性词素数据库中的所有极性为褒义的词之间的关联性,并根据互信息计算单元所计算的所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息,计算所述词与所述极性词素数据库中的所有极性为贬义的词之间的关联性;以及0150判定单元,被配置用于对关联性计算单元所计算的所述词与所述极性词素数据。

49、库中的所有极性为褒义的词之间的关联性以及所述词与所述极性词素数据库中的所有极性为贬义的词之间的关联性进行比较,根据比较结果判定所述词的极性。015114如附记13所述的装置,其中所述关联性计算单元包括0152第一求和模块,被配置用于对互信息计算单元所计算的所述词与所述极性词素数据库中的每个极性为褒义的词之间的互信息进行求和,获得第一求和结果;以及0153第二求和模块,被配置用于对互信息计算单元所计算的所述词与所述极性词素数据库中的每个极性为贬义的词之间的互信息进行求和,获得第二求和结果。015415如附记14所述的装置,其中所述判定单元被配置成对所述关联性计算单元所获得的所述第一求和结果和第二求和结果进行比较,如果第一求和结果大于第二求和结果则判定所述词的极性为褒义,如果第一求和结果小于第二求和结果则判定所述词的极性为贬义。015516如附记13所述的装置,其中所述极性词素数据库为由附记912中任一项所述说明书CN102375838ACN102375845A11/11页14的装置构建的极性词素数据库。说明书CN102375838ACN102375845A1/8页15图1图2说明书附图CN102375838ACN102375845A2/8页16图3说明书附图CN102375838ACN102375845A3/8页17图4说明书附图CN102375838ACN102375845A。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1