《检索装置、检索方法及程序.pdf》由会员分享,可在线阅读,更多相关《检索装置、检索方法及程序.pdf(45页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103430172 A(43)申请公布日 2013.12.04CN103430172A*CN103430172A*(21)申请号 201280002861.2(22)申请日 2012.06.252012-063349 2012.03.21 JPG06F 17/30(2006.01)(71)申请人株式会社东芝地址日本东京都申请人东芝解决方案株式会社(72)发明人仲野亘 真锅俊彦 国分智晴稻叶真纯(74)专利代理机构永新专利商标代理有限公司 72002代理人戚宏梅 杨谦(54) 发明名称检索装置、检索方法及程序(57) 摘要第一存储部(14)存储根据预先确定的规则将成为检。
2、索关键词的候选的关键词候选成组化而生成的关键词组。第一取得部(17)取得与确定前的输入字符串部分一致的关键词候选即第一推荐关键词。第二取得部(18)取得第一推荐关键词所隶属的关键词组中包含的、除了第一推荐关键词以外的其他关键词候选即第二推荐关键词。输出部(19)输出将第一推荐关键词及第二推荐关键词以可选择的方式进行显示的检索画面。检索部(20)进行以从检索画面选择的第一推荐关键词或者第二推荐关键词为检索关键词的检索。(30)优先权数据(85)PCT申请进入国家阶段日2013.03.13(86)PCT申请的申请数据PCT/JP2012/066183 2012.06.25(87)PCT申请的公布数。
3、据WO2013/140636 JA 2013.09.26(51)Int.Cl.权利要求书3页 说明书22页 附图19页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书3页 说明书22页 附图19页(10)申请公布号 CN 103430172 ACN 103430172 A1/3页21.一种检索装置,其特征在于,具备:第一存储部,存储根据预先确定的规则将成为检索关键词的候选的关键词候选成组化而生成的关键词组;第一取得部,取得部分地包含有确定前的输入字符串的所述关键词候选即第一推荐关键词;第二取得部,取得所述第一推荐关键词所隶属的所述关键词组中包含的、除了所述第一推荐关键词以外的。
4、其他所述关键词候选即第二推荐关键词;输出部,输出将所述第一推荐关键词及所述第二推荐关键词以可选择的方式进行显示的检索画面;以及检索部,进行以从所述检索画面选择的所述第一推荐关键词或者所述第二推荐关键词为检索关键词的检索。2.如权利要求1所述的检索装置,其特征在于,所述第一取得部每当所述输入字符串发生变化时取得所述第一推荐关键词,所述第二取得部每当所述第一推荐关键词发生变化时取得所述第二推荐关键词,所述输出部每当所述第一推荐关键词和所述第二推荐关键词的至少某个发生变化时,更新所输出的所述检索画面。3.如权利要求1所述的检索装置,其特征在于,在进行了所述检索部的检索之后,在所述输入字符串没有发生变。
5、化的期间,继续显示在所述检索部的检索进行之前显示在所述检索画面上的所述第一推荐关键词及所述第二推荐关键词。4.如权利要求1所述的检索装置,其特征在于,所述检索装置还具备:第二存储部,存储预先收集的所述关键词候选;以及生成部,将所述第二存储部所存储的所述关键词候选成组化而生成所述关键词组;所述第一存储部存储所述生成部生成的所述关键词组,所述第一取得部从所述第二存储部取得所述第一推荐关键词。5.如权利要求1所述的检索装置,其特征在于,所述检索装置还具备:第三存储部,存储表示在所述检索部的检索中使用过的检索关键词的履历的履历信息;所述第二取得部基于所述履历信息,决定要取得的所述第二推荐关键词及该第二。
6、推荐关键词在所述检索画面中的排序。6.如权利要求1所述的检索装置,其特征在于,所述检索装置还具备:第三存储部,存储表示在所述检索部的检索中使用过的检索关键词的履历的履历信息;所述第一取得部,在未输入有输入字符串的情况下,取得在前一次检索中使用的检索关键词所隶属的所述关键词组中包含的、除了在前一次检索中使用的检索关键词以外的其他所述关键词候权 利 要 求 书CN 103430172 A2/3页3选,作为所述第一推荐关键词;在输入有输入字符串的情况下,优先地取得部分地包含有所述输入字符串的所述关键词候选中的、被包含在前一次检索中使用的检索关键词所隶属的所述关键词组中的所述关键词候选,作为所述第一推。
7、荐关键词。7.如权利要求1所述的检索装置,其特征在于,所述第二取得部在所述第一取得部取得的所述第一推荐关键词的个数为预先确定的规定值以下的情况下,取得所述第二推荐关键词。8.如权利要求1所述的检索装置,其特征在于,所述检索装置还具备:第三存储部,存储表示规定的所述关键词候选与该关键词候选所不隶属的所述关键词组且与该关键词候选具有关连性的所述关键词组之间的对应关系的组输出判定规则;所述第二取得部除了取得所述第一推荐关键词所隶属的所述关键词组中包含的、除了所述第一推荐关键词以外的其他所述关键词候选之外,还取得所述组输出判定规则作为与所述第一推荐关键词具有关连性的所述关键词组而示出的所述关键词组中包。
8、含的所述关键词候选,作为所述第二推荐关键词。9.如权利要求1所述的检索装置,其特征在于,所述检索画面具有:第一显示区域,显示所述第一推荐关键词;和第二显示区域,显示所述第二推荐关键词;在所述第一显示区域中,以可选择的方式与所述第一推荐关键词一起显示用于指定该第一推荐关键词所隶属的所述关键词组的字符信息;在选择了所述字符信息的情况下,所述第一推荐关键词所隶属的所述关键词组中包含的、除了所述第一推荐关键词以外的其他所述关键词候选作为所述第二推荐关键词被显示在所述第二区域中。10.如权利要求9所述的检索装置,其特征在于,所述字符信息是对所述关键词组赋予的组名。11.一种检索方法,在具备存储部的检索装。
9、置中执行,该存储部存储根据预先确定的规则将成为检索关键词的候选的关键词候选成组化而生成的关键词组,其特征在于,包括:所述检索装置的第一取得部取得部分地包含有确定前的输入字符串的所述关键词候选即第一推荐关键词的步骤;所述检索装置的第二取得部取得所述第一推荐关键词所隶属的所述关键词组中包含的、除了所述第一推荐关键词以外的其他所述关键词候选即第二推荐关键词的步骤;所述检索装置的输出部输出将所述第一推荐关键词及所述第二推荐关键词以可选择的方式进行显示的检索画面的步骤;和所述检索装置的检索部进行以从所述检索画面选择的所述第一推荐关键词或者所述第二推荐关键词为检索关键词的检索的步骤。12.一种程序,使具备。
10、存储部的计算机实现如下功能,该存储部存储根据预先确定的规则将成为检索关键词的候选的关键词候选成组化而生成的关键词组,其特征在于,所述功能为:取得部分地包含有确定前的输入字符串的所述关键词候选即第一推荐关键词的功权 利 要 求 书CN 103430172 A3/3页4能;取得所述第一推荐关键词所隶属的所述关键词组中包含的、除了所述第一推荐关键词以外的其他所述关键词候选即第二推荐关键词的功能;输出将所述第一推荐关键词及所述第二推荐关键词以可选择的方式进行显示的检索画面的功能;以及进行以从所述检索画面选择的所述第一推荐关键词或者所述第二推荐关键词为检索关键词的检索的功能。权 利 要 求 书CN 10。
11、3430172 A1/22页5检索装置、 检索方法及程序技术领域0001 本发明的实施方式涉及检索装置、检索方法及程序。背景技术0002 伴随着文章的电子化或World Wide Web(万维网,简称WWW)的普及,文章检索在日常生活或各种业务中被广泛利用。在此,所谓文章检索是指按照指定了检索关键词的检索请求来对包含文本数据的各种内容进行检索的技术。关于文章检索所检索的内容,除了例如文献等文章本身之外,包含文本数据的Web页面、作为超数据而具有文本数据的影像内容等各种内容都是对象。0003 文章检索的检索结果例如作为符合检索关键词的内容的标题一览而被输出。用户经过输入检索关键词、从作为检索结果。
12、而被输出的标题一览中选择内容、确认内容这样的步骤,如果必要的话反复同样的步骤,来得到所需的信息。0004 以往,提出了各种用于减少上述那样的文章检索的步骤及工时来提高用户的作业效率的方法。这些方法之一有检索关键词的输入补足(建议功能)。检索建议功能是取得与所输入的字符串之间表达或者读法部分一致的检索关键词的候选并提示给用户的技术。通过利用该检索建议功能,用户即便不以完整的形式输入检索关键词,也能够从被提示的候选中选择检索关键词来进行检索请求,能够减少检索关键词的输入的工时。但是,在检索建议功能中,由于将与所输入的字符串之间表达或读法部分一致的检索关键词的候选提示给用户,因此,在依次指定表达或读。
13、法不同的多个检索关键词来反复进行检索的情况下,需要每次都要从头开始重新进行字符串的输入。0005 作为减少依次指定多个检索关键词来反复进行检索的情况下的工时的方法,已知有如下技术:若输入某个检索关键词,则与基于该检索关键词的检索结果一起,将与检索中使用的检索关键词相关连其他语句作为下一个检索关键词的候选来提示。根据该技术,用户能够从被提示的检索关键词的候选选择下一个检索关键词来进行新的检索请求,能够减少依次指定多个检索关键词来反复进行检索的情况下的工时。但是,在该技术中,若某个检索关键词不确定,则无法提示下一个检索关键词的候选,为了提示与被提示的检索关键词的候选进而相关连的其他候选,需要每次都。
14、使检索关键词确定来进行检索。0006 如以上所述,在减少文章检索的步骤及工时的现有技术中,在提高用户的作业效率方面仍然有改进的余地,期待着提供能够实现进一步效率提高的技术。0007 先行技术文献0008 专利文献0009 专利文献1:特开201086472号公报0010 专利文献2:特开2010182340号公报发明内容0011 发明所要解决的课题说 明 书CN 103430172 A2/22页60012 本发明所要解决的课题在于提供一种能够提高与检索相关的用户的作业效率的检索装置、检索方法及程序。0013 用于解决课题的手段0014 实施方式的检索装置具备第一存储部、第一取得部、第二取得部、。
15、输出部和检索部。第一存储部存储根据预先确定的规则将成为检索关键词的候选的关键词候选成组化而生成的关键词组。第一取得部取得与确定前的输入字符串部分一致的所述关键词候选即第一推荐关键词。第二取得部取得所述第一推荐关键词所隶属的所述关键词组中包含的、除了所述第一推荐关键词以外的其他所述关键词候选即第二推荐关键词。输出部输出将所述第一推荐关键词及所述第二推荐关键词以可选择的方式进行显示的检索画面。检索部进行以从所述检索画面选择的所述第一推荐关键词或者所述第二推荐关键词为检索关键词的检索。附图说明0015 图1是包含实施方式的检索装置的信息系统的构成图。0016 图2是表示包含第一实施方式的检索装置的功。
16、能性构成的框图。0017 图3是表示关键词存储部所保持的关键词信息的一个例子的图。0018 图4是表示关键词组存储部所保持的组信息的一个例子的图。0019 图5是表示关键词组生成规则存储部所保持的关键词组生成规则的一个例子的图。0020 图6是表示用户终端的显示装置所显示的检索画面的一个例子的图。0021 图7是表示将与输入字符串对应的第一推荐关键词及第二推荐关键词以可选择的方式显示在检索画面上的一系列处理的流程的流程图。0022 图8是表示第一推荐关键词取得部的处理的一个例子的流程图。0023 图9是表示第二推荐关键词取得部的处理的一个例子的流程图。0024 图10是表示输入了输入字符串“”。
17、的情况下的检索画面的一个例子的图。0025 图11是表示选择了作为第一推荐关键词的“日本动物园”的情况下的检索画面的一个例子的图。0026 图12是表示第二实施方式的检索装置的功能性构成的框图。0027 图13是表示检索关键词存储部所保持的检索关键词履历信息的一个例子的图。0028 图14是表示第二实施方式的第二推荐关键词取得部的处理的一个例子的流程图。0029 图15是表示第三实施方式的检索装置的功能性构成的框图。0030 图16是表示第三实施方式的第一推荐关键词取得部的处理的一个例子的流程图。0031 图17是表示第三实施方式中的检索画面的画面例的图。0032 图18是表示第四实施方式的检。
18、索装置的功能性构成的框图。0033 图19是表示第四实施方式的第二推荐关键词取得部的处理的一个例子的流程图。0034 图20是表示第四实施方式中的检索画面的画面例的图。说 明 书CN 103430172 A3/22页70035 图21是表示第五实施方式的检索装置的功能性构成的框图。0036 图22是表示关键词组输出判定规则存储部所保持的关键词组输出判定规则的一个例子的图。0037 图23是表示第五实施方式的第二推荐关键词取得部的处理的一个例子的流程图。0038 图24是说明检索画面的变形例的图。具体实施方式0039 以下,参照附图来说明实施方式的检索装置、检索方法及程序。以下所示出的实施方式是。
19、向服务器/客户端型的信息系统中的服务器进行应用的应用例。0040 (信息系统)0041 首先,对包含实施方式的检索装置的信息系统的概要进行说明。图1是包含实施方式的检索装置1的信息系统的构成图。如图1所示,该信息系统是作为提供检索服务的服务器发挥功能的检索装置1、相对于检索装置1成为客户端的多个用户终端21、22、2n(以下,通称为“用户终端2”。)和储存并管理各种内容的内容服务器31、32、3n(以下,通称为“内容服务器3”。)经由通信网络4被连接的构成。0042 检索装置1是提供进行各种内容的检索的检索服务的信息处理装置。检索装置1作为硬件构成,具备例如CPU等控制装置、ROM或RAM等内。
20、部存储装置、以及硬盘、CD、DVD、闪存等外部存储装置,能够采用利用了通常的计算机的硬件构成。在该情况下,计算机执行程序,由此实现检索装置1中的后述的功能性构成,例如能够向用户提供以Web为基础的检索服务。0043 用户终端2是接受检索服务的用户所使用的装置。作为用户终端2,能够使用作为硬件而具备例如个人计算机、数字家电、图形输入板(tablet)终端、移动电话等用于用户进行各种操作的输入设备及用于显示各种信息的显示装置且作为软件而搭载有Web浏览器的各种信息处理终端。此外,也可以组合多个信息处理装置来构成1个用户终端2。0044 内容服务器3是储存并管理在通信网络4上公开的各种内容的装置。内。
21、容服务器3与检索装置1同样,能够采用利用了通常的计算机的硬件构成。通信网络4的方式是任意的,例如能够利用因特网、LAN(局域网)等。0045 另外,也能够使检索装置1具有内容服务器3的功能。换句话说,检索装置1具有进行各种内容的储存/管理的功能,也能够提供以自己所管理的内容为检索对象的检索服务。此外,也能够在用户终端2中实现检索装置1的功能。0046 在图1的信息系统中,若用户使用用户终端2访问检索装置1,则检索装置1使用户终端2的显示装置显示检索画面。然后,若用户进行在该检索画面上指定了检索关键词的检索请求,则检索装置1执行以内容服务器3所管理的各种内容为检索对象的检索,例如,将与检索关键词。
22、符合的内容的标题一览作为检索结果返回给用户终端2。标题一览中包含的各标题成为向内容服务器3所管理的各内容的保存场所的链接。用户通过从标题一览中选择所需的标题,能够访问所需的内容,取得需要的信息。0047 在此,实施方式的检索装置1为了使用户能够使用检索画面简便地进行指定检索关键词的操作,将成为检索关键词的候选的关键词候选中的、部分地包含有用户所输入的说 明 书CN 103430172 A4/22页8输入字符串(确定前的输入字符串)的关键词候选,作为第一推荐关键词显示在检索画面上而提示给用户。此外,与此同时,将与第一推荐关键词具有关连性的其他关键词候选,作为第二推荐关键词显示在检索画面上而提示给。
23、用户。显示在检索画面上的这些第一推荐关键词和第二推荐关键词,每当输入字符串发生变化时,换句话说随着用户对输入字符串的输入的进展,动态地变化。用户通过选择在检索画面上显示的第一推荐关键词和第二推荐关键词中的某个,确定检索关键词,从而能够对检索装置1进行检索请求。0048 以下,说明检索装置1的详细情况,作为第一至第五实施方式。另外,以下将第一实施方式的检索装置1表示为检索装置1A,将第二实施方式的检索装置1表示为检索装置1B,将第三实施方式的检索装置1表示为检索装置1C,将第四实施方式的检索装置1表示为检索装置1D,将第五实施方式的检索装置1表示为检索装置1E。0049 (第一实施方式)0050。
24、 图2是表示第一实施方式的检索装置1A的功能性构成的框图。如图2所示,本实施方式的检索装置1A具备关键词候选收集部11、关键词候选存储部12、关键词组生成部13、关键词组存储部14、关键词组生成规则存储部15、输入部16、第一推荐关键词取得部17、第二推荐关键词取得部18、输出部19以及检索部20。0051 关键词候选收集部11收集成为用户执行检索时使用的检索关键词的候选的关键词候选,并将收集到的关键词候选保存于关键词候选存储部12。作为收集关键词候选的方法,例如在工作中制作的文章或专利公报等文章为检索对象的情况下有从内容服务器3取得这些文章、通过作为公知技术的形态分析(Morphologic。
25、al Analysis)等从文章抽取关键词候选的方法。此外,从文章抽取关键词候选时,除了使用上述的形态分析之外,还能够使用固有表达抽取、复合词抽取等各种抽取方法。固有表达抽取中例如能够使用文献“質問応答日本語固有表現抽出固有表現体系関係考察、市村由美等,情報処理学会研究報告NL1613,2004)”所记载的公知的固有表达抽取方法。此外,复合词抽取中例如能够使用文献“Frantsi,K.and Ananiadou,S.Extracting Nested Collocations.,COLING96,pp.4146,1996”所记载的公知的复合词抽取方法。0052 另外,在从检索对象的文章抽取关键。
26、词候选的情况下,关键词候选收集部11可以根据形态分析的结果,仅抽取“名词”等特定的词性来作为关键词候选,也可以根据基于上述方法得到的固有表达抽取的结果,仅抽取“地名”或“动物名”等带有特定种类的意思属性的关键词候选。而且,在文章以XML(Extensible Markup Language:可扩展标记语言)等带有构造信息的形式被记述的情况下,关键词候选收集部11也可以是例如在“TITLE”或“AUTHOR”等特定标签下截取被围起的文本区域来作为1个关键词候选等那样,基于构造信息抽取文章中的特定部位来作为关键词候选。0053 此外,关键词候选收集部11不限于如上述那样从检索对象的文章抽取关键词候。
27、选的方法,能够以各种方法收集关键词候选。例如可以是,关键词候选收集部11利用上述的抽取方法,从WWW上的预先确定的特定Web页面的文本数据或辞典数据收集关键词候选,将收集到的关键词候选的关键词信息保存于关键词候选存储部12。此外,关键词候选收集部11也可以根据以这样的方法收集到的关键词候选,仅将检索对象的文章中出现的关键词候选的关键词信息保存于关键词候选存储部12。此外,在检索对象包含有WWW上的Web页面或带有超数据的影像内容的情况下,也可以是,关键词候选收集部11利用上述的抽取说 明 书CN 103430172 A5/22页9方法,从检索对象的Web页面的文本数据或影像内容的超数据收集关键。
28、词候选。此外,在内容服务器3具有利用上述的抽取方法从内容抽取成为关键词候选的语句的功能的情况下,也可以是,关键词候选收集部11收集由内容服务器3预先从各种内容抽取到的关键词候选。0054 关键词候选存储部12对关键词候选收集部11收集到的关键词候选进行存储。具体地说,关键词候选存储部12针对关键词候选收集部11收集到的全部关键词候选,保持表示各关键词候选的关键词信息。0055 图3是表示关键词存储部12所保持的关键词信息的一个例子的图。图3所示的关键词信息100是以XML记述的关键词信息的例子。但是,关键词信息也可以是,以XML形式以外的形式,例如表构造或插入有中断字符的明码文本形式等,保存于。
29、关键词存储部12。在此,假定了如下情况:对检索对象的文章,分别执行基于形态分析、固有表达抽取、复合词抽取以及构造信息而进行的特定部位抽取的4个方法,根据各自的结果,将带有特定的词性或意思属性的语句抽取为关键词候选。0056 关键词信息100例如具有:用于识别关键词候选的“关键词ID”101;关键词候选的“表达” 102;关键词候选的“读法” 103;关键词候选的语法上的类别等、除了表示意思上的类别以外的用于确定关键词候选的类别的“语句类别” 104;表示关键词候选的意思上的类别的“意思类别”105;表示关键词候选的作为检索关键词的优先度的“评分信息”106。图3的关键词信息100示出的关键词候。
30、选示出了“关键词ID”101为“1000”、“表达”102为“日本动物园”、“读法”103为“”、“语句类别”104为“固有名词”、“意思类别”105为“观光施设”、“评分信息”106为“30.52”的关键词候选。0057 另外,关键词信息100的“读法” 103例如是通过针对关键词候选收集部11收集到的关键词候选,对关键词实施形态分析,将形态分析辞典登录好的词素(或称语素,Morpheme)单位的读法连接组合起来而被赋予的。此外,“语句类别” 104例如如果关键词候选是对文章实施了形态分析时得到的则记述其词性名,如果是以其他抽取方法取得的则记述其抽取方法名。此外,“意思类别” 105能够根据。
31、对文章应用了固有表达抽取而得到的结果,或者,根据外部的辞典或百科辞典所保持的知识来取得。此外,“评分信息” 106可以直接使用取得了关键词候选的文章集合中的TF(Term Frequency,关键词的出现次数)或DF(Document Frequency,出现了关键词的文章数),也可以通过组合两者的tfidf(term frequencyinverse document frequency)法等来计算。此外,“评分信息”106也可以进一步组合基于语句类别104或意思类别105的值得到的固定的值来计算。0058 另外,在通过不同抽取方法抽取了多个带有相同“表达”102的关键词候选的情况下,将这些。
32、多个关键词候选归为1个关键词信息100。在该情况下,只有“语句类别”104和“意思类别” 105会因抽取方法而内容数据有可能不同,在关键词信息100中一并记载其全部。0059 关键词组生成部13通过将由关键词候选收集部11收集且保存在关键词候选存储部12中的关键词候选成组化,来生成关键词组,将所生成的关键词组保存在关键词组存储部14中。关键词组生成部13对关键词候选进行成组化时,使用在关键词组生成规则存储部15中预先存储的关键词组生成规则。另外,也可以是,关键词组生成部13除了将由关键词候选收集部11收集到的关键词候选成组化之外,例如还将在概念辞典等、同时保持有语说 明 书CN 1034301。
33、72 A6/22页10句和语句间关系的外部知识中包含的关键词候选、对WWW上的Web页面等外部文章进行解析而得到的关键词候选等一并成组化,来生成关键词组。0060 关键词组存储部14对由关键词组生成部13生成的关键词组进行存储。具体地说,关键词组存储部14按照由关键词组生成部13生成的每个关键词组,保持表示各关键词组的组信息。0061 图4是表示关键词组存储部14所保持的组信息的一个例子的图。图4所示的组信息是通过与各个关键词组有关的第一信息200、与各个关键词候选所属的关键词组有关的第二信息300这2个信息的XML形式的组合来记述的。0062 第一信息200例如具有用于识别关键词组的“组ID。
34、”201,作为表示隶属于该关键词组的关键词候选的“所属关键词”202,具有用于识别各关键词候选的“关键词ID”203。在图4的例子中示出了在“组ID”201为“12”的关键词组中,作为“所属关键词”202,“关键词ID”203为“184”的关键词候选、“关键词ID”203为“982”的关键词候选、“关键词ID”203为“1000”的关键词候选、“关键词ID”203为“20765”的关键词候选隶属于该关键词组。另外,“关键词ID”203与图3的关键词信息100中的“关键词ID”101对应,在表示相同的值时表示是相同的关键词候选。0063 第二信息300具有:用于识别关键词候选的“关键词ID”30。
35、1;表示该关键词候选所隶属的关键词组的“所属组ID”302。在图4的例子中示出了“关键词ID”301为“1000”的关键词候选隶属于:“所属组ID”302为“3”的关键词组、“所属组ID”302为“12”的关键词组、“所属组ID”302为“14”的关键词组、“所属组ID”302为“76”的关键词组。另外,“关键词ID”301与图3的关键词信息100中的“关键词ID”101及第一信息200中的“关键词ID”203对应,“所属组ID”302与第一信息200中的“组ID”201对应,分别在表示相同的值时表示是相同的关键词候选及关键词组。0064 关键词组生成规则存储部15对关键词组生成部13生成关键。
36、词组时使用的关键词组生成规则进行保持。0065 图5是表示关键词组生成规则存储部15所保持的关键词组生成规则的一个例子的图。图5所示的关键词组生成规则400是以XML来记述的关键词组生成规则的例子。但是,关键词组生成规则也可以是以XML形式以外的形式,例如以表构造或记述了逻辑式的文本形式等,保存在关键词组生成规则存储部15中。在此,假定按照所生成的每个关键词组来规定在该关键词组的生成时使用的关键词组生成规则的情况。0066 关键词组生成规则400具有:用于识别根据该规则生成的关键词组的“组ID”401;构成该规则的“子规则”402;构成“子规则”402的“条件”403;构成“条件”403的“值。
37、”404。在图5的例子中示出了生成“组ID”401为“12”的关键词组的规则是由2个“子规则”402构成的,子规则1是由2个“条件” 403构成的,子规则2是由1个“条件” 403构成的。并且,示出了子规则1的条件1是关键属性中具有“意思类别”、值中具有“观光施设”和“主题乐园”这样的条件,子规则1的条件2是关键属性中具有“语句类别”、值中具有“固有名词”这样的条件。此外,示出了子规则2的条件1是关键属性中具有“意思类别”、值中具有“名胜”这样的条件。另外,“组ID”401与图4的第一信息200中的“组ID”201对应,分别在表示相同的值时表示是相同的关键词组。0067 若应用图5所示的关键词组生成规则400,则在图3例示的关键词信息100中,意说 明 书CN 103430172 A10。