信息搜索支持系统,计算机程序和程序存储媒体.pdf

上传人:00****42 文档编号:516641 上传时间:2018-02-20 格式:PDF 页数:37 大小:1.98MB
返回 下载 相关 举报
摘要
申请专利号:

CN02822730.1

申请日:

2002.10.21

公开号:

CN1589444A

公开日:

2005.03.02

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):G06F 17/30公开日:20050302|||实质审查的生效|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

JAM株式会社;

发明人:

野口纯生; 阿部义之

地址:

日本东京

优先权:

2001.11.14 JP 348151/2001

专利代理机构:

中国国际贸易促进委员会专利商标事务所

代理人:

吴丽丽

PDF下载: PDF下载
内容摘要

提供与用户终端通信的部分,访问预备信息数据库的部分,从用户终端获得搜索关键字的部分,根据搜索关键字,从预备信息数据库获得预备信息的部分,把通过聚集预备信息准备的详细关键字集合传送给用户终端的部分,获得用户终端从详细关键字集合选择的字词的部分,以选择的字词作为搜索关键字,搜索预备信息数据库,以获得对应预备信息的部分,和把获得的预备信息作为搜索结果传送给用户终端。

权利要求书

1: 一种信息搜索支持系统,包括: 通过预定的信息通信网络,与用户操作的用户终端通信的部分; 访问预备信息数据库的数据库访问部分,预备信息数据库积累并 管理向用户提供的各种信息; 通过与用户终端的通信,获得用户终端输入的搜索关键字的输入 关键字采集部分; 关于输入关键字采集部分获得的搜索关键字,查阅预备信息数据 库,并获得其中按照预定格式排列对应预备信息的表格的搜索部分; 聚集预备信息搜索部分获得的预备信息表格,准备详细关键字集 合,并把详细关键字集合传送给用户终端的详细关键字集合传输部分, 所述详细关键字集合包含要作为搜索关键字的多个字词,以及和相应 字词相关的信息的位置; 获得用户终端从详细关键字集合选择的字词的详细搜索条件采 集部分; 关于从详细搜索条件采集部分接收的作为搜索关键字的字词,查 阅预备信息数据库,并获得对应的预备信息的详细搜索部分;和 把详细搜索部分获得的预备信息按照预定格式排列成搜索结果 信息,并把搜索结果信息传送给用户终端的搜索结果传输部分。
2: 一种信息搜索支持系统,包括: 通过预定信息通信网络,与用户操作的用户终端通信的部分; 访问预备信息数据库的数据库访问部分,预备信息数据库积累并 管理向用户提供的各种信息; 通过与用户终端的通信,获得用户终端输入的搜索关键字的输入 关键字采集部分; 关于输入关键字采集部分获得的搜索关键字,查阅预备信息数据 库,并获得其中按照预定格式排列对应的预备信息的表格的搜索部分; 聚集搜索部分获得的预备信息表格,准备详细关键字集合,并把 详细关键字集合传送给用户终端的详细关键字集合传输部分,所述详 细关键字集合包含要作为搜索关键字的多个字词,以及和相应字词相 关的信息的位置。
3: 按照权利要求1或2所述的信息搜索支持系统,包括保存数 据库位置信息的部分,所述数据库位置信息使多个搜索关键字与预备 信息数据库的位置相联系, 其中搜索部分根据该数据库位置信息,获得对应于搜索关键字的 预备信息数据库的位置,并关于搜索关键字,查阅该位置的预备信息 数据库。
4: 一种信息搜索支持系统,包括: 通过预定信息通信网络,与用户操作的用户终端通信的部分; 访问预备信息数据库的数据库访问部分,所述预备信息数据库积 累并管理向用户提供的各种信息; 通过与用户终端的通信,获得用户终端输入的搜索关键字的输入 关键字采集部分; 关于输入关键字采集部分获得的搜索关键字,查阅预备信息数据 库,并获得对应的预备信息的搜索部分; 把包含在搜索部分获得的预备信息中的文档分割成字词的预备 信息分割部分;和 把详细关键字集合传送给用户终端的搜索结果传输部分,所述详 细关键字集合描述预备信息分割部分分割的相应字词和作为相应字词 的分割来源的预备信息之间的对应性。
5: 一种信息搜索支持系统,包括: 通过预定通信网络,与用户操作的用户终端通信的部分; 访问预备信息数据库的数据库访问部分,所述预备信息数据库积 累并管理向用户提供的各种信息; 通过与用户终端的通信,获得用户终端输入的搜索关键字的输入 关键字采集部分; 关于输入关键字采集部分获得的搜索关键字,查阅预备信息数据 库,并获得对应预备信息的搜索部分; 把包含在搜索部分获得的预备信息中的文档分割成字词的预备 信息分割部分;和 准备其中描述预备信息分割部分分割的字词的详细关键字集合, 并把详细关键字集合传送给用户终端的详细关键字集合传输部分; 获得用户终端从详细关键字集合选择的字词的详细搜索条件采 集部分; 关于详细搜索条件采集部分获得的作为搜索关键字的字词,查阅 预备信息数据库,并获得对应预备信息的详细搜索部分; 把详细搜索部分获得的预备信息按照预定格式排列成搜索结果 信息,并把该信息传送给用户终端的搜索结果传输部分。
6: 按照权利要求5所述的信息搜索支持系统, 其中详细关键字集合传输部分准备详细关键字集合,所述详细关 键字集合描述每个分割字词和作为每个字词的分割来源的预备信息之 间的对应性。
7: 按照权利要求6所述的信息搜索支持系统, 其中如果搜索条件采集部分获得的字词未包含在包括于预先传 送给用户终端的详细关键字集合中的某一预备信息中,则该预备信息 被排除在详细关键字集合之外,从而准备随后被传送给用户终端的新 的详细关键字集合的搜索结果传输部分。
8: 按照权利要求4-7任一所述的信息搜索支持系统,包括保存 要求基本字典的部分,所述要求基本字典包含根据特定要求被分类的 多个字词,其中详细关键字集合传输部分准备描述每个分割字词和分 类要求的对应性的详细关键字集合。
9: 按照权利要求8所述的信息搜索支持系统,其中预备信息分 割部分根据要求基本字典,分割获得的预备信息。
10: 按照权利要求7-9任一所述的信息搜索支持系统, 其中详细关键字集合传输部分准备包含和分割字词属于相同要 求的其它字词的详细关键字集合。
11: 按照权利要求7-10任一所述的信息搜索支持系统,其中详 细关键字集合传输部分按照一个或多个字词与每个要求相联系,一个 或多个预备信息与每个字词相联系的分层结构,准备描述要求、字词 和预备信息之间的关系的详细关键字集合。
12: 按照权利要求11所述的信息搜索支持系统,其中相应要求 被进一步归入预定类别,并且详细关键字集合传输部分准备其中在分 层结构的最高层中排列相应类别的详细关键字集合。
13: 按照权利要求1或5中所述的信息搜索支持系统, 其中当该详细搜索条件采集部分接受用户终端选择的每个搜索 关键字的权重信息时,搜索结果传输部分根据向其指定权重信息的字 词的存在与否,以及指定给该字词的权重信息的值,评估获得的预备 信息,并优先传送高度评价的预备信息。
14: 按照权利要求13所述的信息搜索支持系统, 其中,搜索结果传输部分包括以将传送给用户终端的预备信息 内,作为预备信息的传输来源的权重信息的值为基础的总分。
15: 按照权利要求1-14任一所述的信息搜索支持系统,包括保 存向预备信息数据库提供的代表性搜索关键字的同义字的同义字字典 的部分, 其中搜索部分利用作为同义字,从输入关键字采集部分获得的搜 索关键字,查阅同义字字典,以便取回对应的代表性搜索关键字,并 关于该代表性搜索关键字查阅预备信息数据库。
16: 按照权利要求15所述的信息搜索支持系统,其中搜索部分 关于代表性搜索关键字,另外关于该代表性搜索关键字的同义字,查 阅预备信息数据库。
17: 按照权利要求15所述的信息搜索支持系统,其中详细关键 字集合传输部分准备描述代表性搜索关键字的详细关键字集合,所述 代表性搜索关键字是代替分割字词的分割字词同义字,或者除分割字 词之外的分割字词同义字。
18: 按照权利要求15-17任一所述的信息搜索支持系统,其中为 相应领域准备许多同义字字典, 输入关键字采集部分从用户终端接收字典选择信息,以指定特定 领域的同义字字典,和 搜索部分关于搜索关键字,查阅和字典选择信息对应的领域的同 义字字典。
19: 按照权利要求15-17任一所述的信息搜索支持系统,其中为 相应领域准备多个同义字字典, 提供根据输入关键字采集部分获得的搜索关键字,确定特定领域 的同义字字典的部分, 搜索部分关于搜索关键字,查阅该部分确定的同义字字典。
20: 一种计算机程序,通过在计算机中安装并执行所述计算机程 序,所述计算机程序使计算机能够起按照权利要求1-19任一所述的信 息搜索支持系统的作用。
21: 一种保存按照权利要求20所述的计算机程序的程序存储媒 体。

说明书


信息搜索支持系统, 计算机程序和程序存储媒体

    【技术领域】

    本发明涉及当用户打算从诸如因特网之类信息通信网络上的海量信息中获得目标信息时,通过干预信息源和用户终端之间的数据交换路径,使用户能够确定并且快速地访问目标信息的信息搜索支持系统。

    背景技术

    随着信息通信网络,尤其是因特网的普及,用户获得了访问海量信息的环境。另一方面,正变得难以从海量信息中直接获得目标信息。为此,例如在因特网上,正在广泛使用称为搜索站点的网站。搜索站点借助和WWW服务器一起工作,称为搜索引擎的计算机系统或程序,向用户提供信息搜索服务,以便从海量信息中获得所需的信息。

    搜索引擎在伴随数据库(预备(provision)信息数据库)中积累并管理关于因特网上的海量信息的信息(预备信息),例如内容、位置等,所述预备信息可被用作获得用户最终想要的信息的线索。搜索引擎向预备信息数据库询问从用户操纵地客户计算机(用户终端)的浏览器接收的搜索查询,并以网页的形式返回预备信息的相应列表。预备信息的内容可包括可从信息源的位置(URL)获得的完整信息,或者可以只包括完整信息的摘要或摘录。用户可从表示成搜索结果的预备信息列表中找到(可能)包括和想要的信息相关的内容的预备信息,并通过利用浏览器指定附属于预备信息的URL,获得目标信息。

    搜索引擎包括机器人型搜索引擎和目录型搜索引擎,区别在于获得作为预备信息来源的信息的程序,或者预备信息数据库的结构等等。机器人型搜索引擎在任何时候收集因特网上的网页,并借助称为爬行(crawler)机器人的计算机,把收集的网页及它们的URL一起保存在预备信息数据库中。机器人型搜索引擎随后关于预备信息数据库,查阅从用户终端接收的搜索关键字,并进行全文搜索。许多情况下,对应网页的本体的头部被表示成预定字母数内的搜索结果。

    另一方面,目录型搜索引擎采用一种数据库结构,其中按照分层树形(目录)结构的形式使多个类别系统化,多个预备信息被归入任意最低层类别中。用户从上层到下层追踪目录,同时预测目标信息包含在哪个目录中。随后,找到包括目标预备信息的类别。另一方面,通过在表格的预定列中输入搜索关键字,搜索引擎搜索包括这种搜索关键字的类别。随后,包括在搜索到的类别中的预备信息以列表的形式被返回给用户终端,作为搜索结果。在许多目录型搜索引擎中,实际取回网页,之后检查其内容,并在管理和操作方产生目录的摘要,以便把摘要提供为预备信息。在任何情形下,就通过根据给定的搜索关键字,访问预备信息数据库,并通过在浏览器中显示对应预备信息的列表,获得对应预备信息的基本功能来说,不存在任何差异。

    目前,由于硬件本身的性能升级,搜索算法的改进,以及数据存储结构的有效设计,搜索引擎能够根据模糊的搜索关键字或同义词(计算机、computor、PC、个人计算机等)搜索相同的预备信息,以及通过解释作为输入的自然句子的语境,以独立单词的形式抽取搜索关键字,评估在网页的本体内,许多搜索关键字彼此有多接近,根据相应搜索关键字的出现频率,确定搜索结果列表中的呈现顺序等等。顺便提及,在Shojiro Nishio和其它五位作者的“Sturcturing and SearchingInformation”(第一版,2000年3月27日,第52-71和第264-277页)中详细说明了信息搜索的技术。

    由于搜索算法和数据库结构的改进,近来的搜索引擎被设计成当给定任意搜索关键字时,提供相同的信息,作为搜索结果,只要关键字的含义是相同的。但是,不同用户针对的信息各不相同,从私人(backyard)信息到诸如学术论文之类专业信息,即使不同的用户向搜索引擎提供相同的搜索关键字,也不一定意味着每个用户想得到相同的信息。例如,想购买特定电视机的个人,和想了解特定电视机的说明书的个人获得信息的目的完全不同。然而,相似的术语可能被选为搜索关键字。

    【发明内容】

    鉴于常规搜索技术的上述问题,做出了本发明。本发明的目的是提供一种信息搜索支持系统,当用户搜索信息通信网络寻找信息时,所述信息搜索支持系统能够从依据平常的搜索关键字搜索的各种信息中,高度准确地提供用户寻找的信息。

    为了实现上述目的,根据本发明的信息搜索支持系统包括:通过预定的信息通信网络与用户操作的用户终端通信的部分;访问预备信息数据库的数据库访问部分,预备信息数据库积累并管理提供给用户的各种信息;通过与用户终端的通信,获得用户终端输入的搜索关键字的输入关键字采集部分;关于输入关键字采集部分获得的搜索关键字,查阅预备信息数据库,并获得其中按照预定格式排列对应的预备信息的表格的搜索部分;聚集预备信息搜索部分获得的预备信息表格,准备详细关键字集合,并把详细关键字集合传送给用户终端的详细关键字集合传输部分,所述详细关键字集合包含要作为搜索关键字的多个字词,以及和相应字词相关的信息的位置;获得用户终端从详细关键字集合选择的字词的详细搜索条件采集部分;关于从详细搜索条件采集部分接收的作为搜索关键字的字词,查阅预备信息数据库,并获得对应的预备信息项的详细搜索部分;和按照预定格式,把详细搜索部分获得的预备信息排列成搜索结果信息,并把搜索结果信息传送给用户终端的搜索结果传输部分。

    另一方面,信息搜索支持系统可包括:通过预定信息通信网络,与用户操作的用户终端通信的部分;访问预备信息数据库的数据库访问部分,预备信息数据库积累并管理向用户提供的各种信息;通过与用户终端的通信,获得用户终端输入的搜索关键字的输入关键字采集部分;关于输入关键字采集部分获得的搜索关键字,查阅预备信息数据库,并获得其中按照预定格式排列对应的预备信息的表格的搜索部分;聚集搜索部分获得的预备信息表格,准备详细关键字集合,并把详细关键字集合传送给用户终端的详细关键字集合传输部分,所述详细关键字集合包含要作为搜索关键字的多个字词,以及和相应字词相关的信息的位置。

    上述信息搜索支持系统可包括保存数据库位置信息的部分,所述数据库位置信息使多个搜索关键字与预备信息数据库的位置相联系,其中搜索部分根据该数据库位置信息,获得对应于搜索关键字的预备信息数据库的位置,并关于搜索关键字,查阅该位置的预备信息数据库。

    根据本发明,搜索部分可被设计成自己获得预备信息,而不是通过其中按照预定格式排列预备信息的表格。按照这种方式设计的信息搜索支持系统包括:通过预定信息通信网络,与用户操作的用户终端通信的部分;访问预备信息数据库的数据库访问部分,所述预备信息数据库积累并管理向用户提供的各种信息;通过与用户终端的通信,获得用户终端输入的搜索关键字的输入关键字采集部分;关于输入关键字采集部分获得的搜索关键字,查阅预备信息数据库,并获得对应的预备信息的搜索部分;把包含在搜索部分获得的预备信息中的文档分割成字词的预备信息分割部分;和把详细关键字集合传送给用户终端的搜索结果传输部分,所述详细关键字集合描述预备信息分割部分分割的相应字词和作为相应字词的分割来源的预备信息之间的对应性。

    另一方面,信息搜索支持系统可包括:通过预定通信网络,与用户操作的用户终端通信的部分;访问预备信息数据库的数据库访问部分,所述预备信息数据库积累并管理向用户提供的各种信息;通过与用户终端的通信,获得用户终端输入的搜索关键字的输入关键字采集部分;关于输入关键字采集部分获得的搜索关键字,查阅预备信息数据库,并获得对应预备信息的搜索部分;把包含在搜索部分获得的预备信息中的文档分割成字词的预备信息分割部分;和准备其中描述预备信息分割部分分割的字词的详细关键字集合,并把详细关键字集合传送给用户终端的详细关键字集合传输部分;获得用户终端从详细关键字集合选择的字词的详细搜索条件采集部分;关于详细搜索条件采集部分获得的作为搜索关键字的字词,查阅预备信息数据库,并获得对应预备信息的详细搜索部分;把详细搜索部分获得的预备信息排列成预定格式的搜索结果信息,并把该信息传送给用户终端的搜索结果传输部分。顺便提及,详细关键字集合可描述每个分割字词和作为每个字词的分割来源的预备信息之间的对应性(correspondence)。

    此外,信息搜索支持系统可被设计成以致如果搜索条件采集部分获得的字词未包含在包括于预先传送给用户终端的详细关键字集合中的某一预备信息中,则该预备信息被排除在详细关键字集合之外,从而准备新的详细关键字集合,所述新的详细关键字集合随后被传送给用户终端。

    在信息搜索支持系统自己获得预备信息的情况下,可提供保存要求基本字典的部分,所述要求基本字典包含根据特定要求分类的多个字词,其中详细关键字集合传输部分准备描述每个分割字词和分类要求的对应性的详细关键字集合。预备信息分割部分可被设计成根据要求基本字典分割获得的预备信息。

    在提供用于保存要求基本字典的存储部分的情况下,详细关键字集合传输部分准备包含和分割字词属于相同要求的其它字词的详细关键字集合。另外,详细关键字集合传输部分可按照一个或多个字词与每个要求相联系,一个或多个预备信息与每个字词相联系的分层结构,准备描述要求、字词和预备信息之间的关系的详细关键字集合。顺便提及,信息搜索支持系统可被设计成以致相应要求被进一步归入预定类别,并且详细关键字集合传输部分准备其中在分层结构的最高层中排列相应类别的详细关键字集合。

    在信息搜索支持系统具备详细搜索条件采集部分的情况下,当该详细搜索条件采集部分接受用户终端选择的每个搜索关键字的权重信息时,搜索结果传输部分根据向其指定权重信息的字词的存在与否,以及指定给该字词的权重信息的值,评估获得的预备信息,并优先传送高度评价的预备信息。另外,搜索结果传输部分可包括以将传送给用户终端的预备信息内,预备信息的权重信息的值为基础的总分。

    在上述任意信息搜索支持系统中,提供用于保存向预备信息数据库提供的代表性搜索关键字的同义字的同义字字典的部分,其中搜索部分利用作为同义字,从输入关键字采集部分获得的搜索关键字,查阅同义字字典,以便取回对应的代表性搜索关键字,并关于该代表性搜索关键字查阅预备信息数据库。

    就具备保存同义字字典的存储部分的信息搜索支持系统来说,搜索部分关于代表性搜索关键字,另外关于该代表性搜索关键字的同义字,查阅预备信息数据库。详细关键字集合传输部分可准备描述代表性搜索关键字的详细关键字集合,所述代表性搜索关键字是代替分割字词,或者除分割字词之外的分割字词的同义字。

    信息搜索支持系统可被设计成以致为相应领域准备许多同义字字典,输入关键字采集部分从用户终端接收字典选择信息,以指定特定领域的同义字字典,搜索部分关于搜索关键字,查阅和字典选择信息对应的领域的同义字字典。另一方面,信息搜索支持系统可被设计成以致为相应领域准备多个同义字字典,提供根据输入关键字采集部分获得的搜索关键字,确定特定领域的同义字字典的部分,搜索部分关于搜索关键字,查阅该部分确定的同义字字典。

    此外,本发明适用于一种计算机程序和保存这种计算机程序的程序存储媒体,通过在计算机中安装并执行所述计算机程序,所述计算机程序使计算机能够起信息搜索支持系统的作用。

    【附图说明】

    图1表示了包括根据本发明一个实施例的信息搜索支持系统的网络结构。

    图2表示了因特网上的相应计算机和根据本发明第一实施例的信息搜索支持系统之间的通信程序。

    图3是由上述本发明第一实施例中的信息搜索支持系统管理的数据库位置信息的示意结构图。

    图4是由上述本发明第一实施例中的信息搜索支持系统从搜索引擎获得的预备信息的示意结构图。

    图5表示了将从上述本发明第一实施例中的信息搜索支持系统传送给用户终端的初始搜索屏幕。

    图6表示了将从上述本发明第一实施例中的信息搜索支持系统传送给用户终端的详细的关键字选择窗口。

    图7表示了在用户终端,上述详细的关键字选择窗口中的用户界面。

    图8表示了在用户终端,上述详细的关键字选择窗口中的用户界面。

    图9表示了将从上述本发明第一实施例中的信息搜索支持系统传送给用户终端的搜索结果屏幕。

    图10是根据上述本发明第一实施例的信息搜索支持系统准备的详细关键字集合的示意结构图。

    图11表示了因特网上的相应计算机和根据本发明第二实施例的信息搜索支持系统之间的通信程序。

    图12是由上述本发明第二实施例中的信息搜索支持系统管理的基于要求的字典的示意结构图。

    图13是表示由上述本发明第一实施例中的信息搜索支持系统获得的预备信息的内容的示意图。

    图14是表示从预备信息项抽取的,并由上述本发明第一实施例中的信息搜索支持系统获得的单词的示意图。

    图15是表示当上述本发明第一实施例中的信息搜索支持系统根据要求,对从某一预备信息抽取的单词分类时的状态的示意图。

    图16是根据上述本发明第二实施例的信息搜索支持系统准备的详细关键字集合的示意结构图。

    图17是将从上述本发明第二实施例的信息搜索支持系统传送给用户终端的详细关键字屏幕的示意图。

    图18是表示在用户终端,上述详细关键字屏幕中的用户界面的示意图。

    图19表示了因特网上的相应计算机和根据本发明第三实施例的信息搜索支持系统之间的通信程序。

    图20是表示将从根据上述本发明第三实施例的信息搜索支持系统传送给用户终端的搜索结果屏幕的示意图。

    【具体实施方式】

    ===网络结构===

    这里,因特网被用作包括根据本发明一个实施例的信息搜索支持系统的信息通信网络的例子。图1表示了信息通信网络的网络结构。因特网10与本发明的信息搜索支持系统1,用户终端20,例如其中安装普通公众用户操作的浏览器的个人计算机,以及多个WWW服务器30连接。这里假定公众可从WWW服务器30之一的网页得到某一用户想要的信息。

    在该例证网络结构中,信息搜索支持系统(下面称为支持系统)1具有WWW服务器的基本功能,并提供与搜索引擎2相联系的信息搜索支持服务。当然,可在支持系统1本身内实现搜索引擎2的功能。总之,所必需的只是提供访问预备信息数据库3的功能,预备信息数据库3积累并管理从因特网10收集的多个网页的内容和位置。

    另外,支持系统1的硬件可由单个计算机构成,或者由相互协同的许多计算机构成。在具有许多计算机的结构中,这些计算机之间的通信路径可以是专用线路、LAN、VPN或任意其它专用通信网络构成的结构,或者可以是通过诸如因特网10之类公共信息通信网络通信的结构。

    ===信息搜索支持服务===

    通过与用户终端20的HTTP通信,支持系统1提供呈现作为用户想要信息的可靠线索的预备信息的信息搜索支持服务。“信息搜索支持服务”提供用户界面环境,和常规的搜索引擎提供的“信息搜索服务”不同,所述用户界面环境被设计成使用户能够自然查找目标信息。为此,设计了各种信息的管理结构,以及通过通信网络与其它计算机的通信过程中的信息处理。

    本发明的技术原理包括用户界面数据管理结构,通信程序和信息处理等方面的各种变化。下面,在这些变化中选择几个实施例,详细说明本发明。

    ===第一实施例===

    图2表示了因特网10上的相应计算机2及20与根据本发明第一实施例的支持系统1之间的通信程序。顺便提及,本例中,支持系统1被配置成使用许多外部搜索引擎2,同时使搜索关键字与搜索引擎相联系的数据库位置信息被保存在支持系统1a一方的存储资源中。图3是这种数据库位置信息的示意结构图。

    在相应搜索引擎2的预备信息数据库中积累的预备信息是呈预定格式的字词组形式的表格,所述字词组表示从因特网10收集的多个网页中每个网页的详细信息和内容。预备信息数据库3管理与搜索关键字相关的表格。在该表格中,根据预定的分类体系,按照在目录结构中恰当排列的状态,组织相应的字词。图4是预备信息数据库中预备信息的示意结构图。本例中,从上层到下层规定相应各层的类别、要求、详细信息和具体条件,在每层内,对随着网页的内容的不同而不同的字词分类。例如,如果对应于任意搜索关键字“电视机”、“电器商店”和“公司A”的预备信息包含对应于类别“产品”的“制造者”是“公司A”的信息,作为网页的内容(所述网页是预备信息的信息源),则字词“产品”、“制造者”和“公司A”按照该上述顺序构成分层结构,从而使特定字词“公司A”与预定URL相联系。例如,该URL可以是公司A的主页。

    此外,在网页的内容属于“服务”类别,其中作为服务可获得“安装服务”并且免费的情况下,“服务”、“安装服务”、“可获得”和“免费”的分层结构与其中具体说明该信息的网页(详细说明页)的URL相关。当然,提供“安装服务”的定义的网页可和详细说明页相联系。详细说明页并不仅仅局限于在因特网上的其它WWW服务器中公开的网页,而且是在支持系统1a或搜索引擎2内具体提供的网页。

    图5-9是表示当支持系统1a提供信息搜索支持服务时,在用户终端20中显示的屏幕的示意图。用户通过利用他/她自己的用户终端20的浏览器,指定预定的URL,请求由支持系统1a公开的网页(s1和s2)。该网页(初始搜索屏幕:图5)包含输入搜索关键字的输入表格41,和把输入表格41的信息传送给在支持系统1a中实现的预定CGI程序的子例程。更具体地说,在把搜索关键字输入表格41中,并在同一页面中指定“搜索”按键42之后,一个HTTP请求被发送给因特网10,所述HTTP请求包括把搜索关键字作为表格数据传送给上述CGI程序的描述(s3)。这种情况下,假定输入搜索关键字“电视机”,该关键字被发送给CGI程序。

    支持系统1a用于根据数据库位置信息,借助CGI程序识别对应于搜索关键字“电视机”的搜索引擎的位置,之后把该搜索关键字传送给该位置的搜索引擎2(s4、s5)。这种情况下,假定对应于称为ABC和XYZ的两个搜索引擎2的位置被识别。这两个搜索引擎2随后根据给定的搜索关键字,搜索自己的预备信息数据库3,并返回包含相关预备信息的如上所述排列的数据(排列的预备信息)(s6、s7)。

    支持系统1a接收从相应搜索引擎2返回的排列的预备信息,关于其中包含的相应类别和要求,编辑详细信息和具体条件,并准备其中列举其结果的详细关键字集合(s8、s9)。图10是表示这种详细关键字集合的结构的示意图。按照网页的形式处理这种详细关键字集合,并以HTTP响应的形式,将其返回给发送上述HTTP请求的用户终端。

    该网页(详细关键字选择窗口:图6-8)包括使用户能够选择包含在相应要求中的详细信息和详细要求中的字词的功能,以及把选择的字词传送给支持系统1a作为搜索关键字的功能。此外,本例中,还提供规定用户选择的字词的权重的功能。当在用户终端20中显示详细关键字选择屏幕时,以表格的形式显示详细关键字集合,其中可从下拉列表框51中,自与每个要求相关的详细条件和与详细信息相联系的字词中选择用于重新搜索的搜索关键字。借助单选按钮52,可指定具有从0~11的11级分数的权重。当发送了详细关键字选择窗口时,下拉列表框51是没有任何供选择字词的空白区,权重分数选择屏幕都被置为0(图6)。用户从每个下拉列表框中的每个下拉列表框51,选择作为获得目标信息的条件的字词(用于重新搜索的搜索关键字)。另外,用户根据用于重新搜索的搜索关键字的重要性,指定权重分数(s11:图7)。

    顺便提及,对于和每个要求对应的详细条件和详细要求的每个字词,设置到网页(描述页)的链接,所述网页是字词的来源。当用户想获得关于某一字词的知识或定义时,通过把该字词指定为用于重新搜索的搜索关键字,随后按下“描述”列54(图8),能够获得对应的描述页。从而,如果用户执行关于每个要求的选择操作,并指定“发送”按钮53,则对应于选择操作的信息以表格数据的形式被传送给支持系统1a。同时,不仅标准HTML输入表格,而且使用这种JAVA(注册商标)小程序的任意恰当技术都可被用于实现在详细关键字选择屏幕中,把与详细信息,详细要求和权重分数的指定操作相一致的信息传送给支持系统1a的功能。

    当与详细信息和详细要求相关的字词从用户终端20被传送时,利用这些字词作为搜索关键字,支持系统1a再次根据数据库位置信息,识别对应的搜索引擎2。随后,搜索关键字被给予识别的搜索引擎2,以便重新搜索对应的预备信息(s12-s15)。

    当从搜索引擎2收到重新搜索的预备信息时,支持系统1a根据是否存在用户指定的字词和相对于该单词指定的权重信息,评估预备信息的内容(s16、s17)。例如,在优先抽取包含相对于用于重新搜索的搜索关键字,被赋予更高权重分数的关键字的预备信息的时候,当预备信息包含和用于重新搜索的搜索关键字相符的字词时,用户指定的权重分数被加入该字词的权重分数中。随后,在计算每个预备信息的权重分数之和之后,依据具有最高分数的预备信息的预备信息的内容,准备网页(搜索结果屏幕:图9),并将其返回给用户终端(s18-s20)。在图9中举例说明的例子中,就用户在详细关键字选择屏幕中指定的用于重新搜索的搜索关键字来说,存在指定的权重分数61,用于在预备信息中重新搜索的搜索关键字的分数62,分数之和63,获得对应于用于重新搜索的搜索关键字的描述页的按钮64等等。此外,还提供作为预备信息来源的搜索引擎2的URL 65。当然,如果信息来源的URL包括在预备信息中,则URL可包括在搜索结果中,使用户能够直接从信息源取回所需的信息。

    ===第二实施例===

    图11表示了因特网上的相应计算机和根据本发明第二实施例的支持系统之间的通信程序。支持系统1b具有作为搜索引擎2的功能,并附带有预备信息数据库3。另外,预备信息和由传统搜索站点呈现的包含网页内容及网页URL的预备信息相同。但是,除了预备信息数据库3之外,支持系统1b还具备在其存储资源中的要求基本字典4,所述字典包含分别与预定要求相联系的多个字词。图12是表示这种要求基本字典的结构的示意图。

    另外,在本实施例及第一实施例中,用户借助用户自己的用户终端的浏览器,从支持系统1b获得一个网页,所述网页是包含输入搜索关键字的输入表格的初始搜索屏幕,并把搜索关键字返回给支持系统1b。支持系统1b随后借助自己的搜索引擎功能,通过利用该搜索关键字查阅预备信息数据库3,获得预备信息。

    随后,相对于多个获得的预备信息项,支持系统1b分别把包含于其中的文档分成每个字词,关于各个字词搜索上面的要求基本字典,获得相应的字词被归入其中的要求(s106-s108)。未被归入任意要求的字词被归入“其它”。相对于多个预备信息,通过根据要求,把相应字词和作为字词来源的相关预备信息聚集在一起,准备详细关键字集合(s109)。图13-16是表示详细关键字集合的准备过程的示意图。这种情况下,假定“电视机”和“等离子体”作为搜索关键字被给予支持系统1b。表示了某一预备信息项的文档(图13),从该文档抽取的字词(图14),按照要求分类的这些字词的排列(图15),以及其中聚集这些字词和其它预备信息的详细关键字集合(图16)。

    支持系统1b把上述过程准备的详细关键字集合以网页的形式传送给用户终端20。图17和18表示了传递给用户终端20的详细关键字集合的网页(详细关键字屏幕)的示意图。在该屏幕的初始状态下,要求的表格和用户事先输入的搜索关键字一起被显示(图17)。当在用户终端20中指定特定要求时,以树形方式显示和下层要求分层相关的字词和URL,并且当指定特定字词时,其内容的信息源的URL将被显示成对应的预备信息(图18)。URL的描述具备与其相关的链接,从而当用户相要获得更详细的信息时,通过在浏览器中指定URL,能够获得信息源的网页(s111-s114)。

    ===第三实施例===

    图19表示了因特网上的相应计算机和根据本发明第三实施例的支持系统之间的通信程序。该支持系统1c被设计成第一实施例和第二实施例的组合。

    本例的支持系统1c具备搜索引擎2的功能,第二实施例的要求基本字典也被保存在其存储资源中。但是,和第一实施例中相同,本例中,类别被定义成要求的高级分类。伴随预备信息数据库3积累并管理形式上和传统搜索站点提供的预备信息相似的预备信息。

    这种情况下,从利用用户终端20的浏览器,自支持系统1b获得和图5中图解说明的相同的初始搜索屏幕的步骤,到支持系统1c通过使要求,相应的字词及作为这些字词的来源的预备信息相联系,准备详细关键字集合的步骤,采取基本和第二实施例一致的步骤(s201-s209)。但是,区别在于按照和第一实施例相同的方式,把详细关键字集合中的相应要求归入高级分类的类别中,而详细关键字集合的结构和如图10中所示的第一实施例的详细关键字集合的结构相同。

    此外,虽然根据详细关键字集合,网页被准备成详细关键字选择屏幕,并被传送给用户终端,但是除了预备信息由支持系统本身的搜索引擎功能取回之外,根据用户终端选择的用于重新搜索的搜索关键字,重新搜索预备信息的程序和第一实施例相同(s210-s217)。在上述程序之后,评估预备信息,并传送在搜索结果屏幕中产生的评估结果的程序也和第一实施例中相同(s218-s221)。但是,第三实施例和第一实施例的不同之处在于包括在搜索结果内的信息包括预备信息的来源信息和预备信息的内容。图20表示了根据第三实施例的搜索结果屏幕的示意图。作为信息来源的预备信息的URL和指定的权得分数一起被描述成依据用户在详细关键字选择屏幕中选择的要求分类的字词的评估结果。通过在浏览器中指定该URL,可直接从信息来源获得信息(s222-s224)。

    ===从预备信息项抽取字词===

    就上述第二实施例或第三实施例来说,根据字词基本要求字典,对从预备信息抽取的相应字词分类。并不局限于这些实施例,可具有使抽取的单词照原样与作为其来源的预备信息相关,并把字词和预备信息之间的对应性表格作为搜索结果返回给浏览器终端的结构。借助这种配置,能够向用户提供包含在预备信息中的原始字词,从而用户方具有选择到达目标信息的路径的更多选择余地。

    另一方面,当从预备信息抽取字词时,只能从预备信息抽取包含在字词基本要求字典中的字词。借助这种配置,不必要的字词被排除在预备信息之外,从而节省获得目标信息所需的访问时间和程序。

    另外,能够参考常规字典,从预备信息抽取字词,当详细关键字集合也包括和这些字词属于相同要求的其它字词的时候。

    ===搜索关键字的范围的指定(同义字字典选择)===

    在上述各个实施例中,当用户输入的搜索关键字是缩写或者不是通常使用的术语时,搜索预备信息的准确性下降。为此,在支持系统中提供同义字字典,使能够被搜索引擎无误解释的代表性搜索关键字与同义字和准同义字相联系,从而从用户终端传送的搜索关键字被正确的代表性搜索关键字代替,随后使用所述代表性关键字查阅预备信息数据库。当然,可以通过查阅预备信息数据库,无遗漏地搜索准同义字以及代表性关键字。

    此外,在详细关键字集合中,可以把代替分割字词的,与所述分割字词同义的代表性搜索关键字用作字词来描述。当然,可同时列举分割的字词和代表性搜索关键字。通过在详细关键字集合中包括代表性搜索关键字,当搜索关键字再次涉及到预备信息数据库时,恰当的字词被用作关键字,以便提高搜索的准确性。

    即使对于相同的搜索关键字,也存在许多含义或作为关键字对象的“物品”本身被用在许多领域的情况。例如,术语“CD”具有诸如“光盘”、“现金付款机”、“降低成本”之类各种含义。即使相同的术语“光盘”,根据用户想要的“物品”是CD-ROM还是音乐CD,可能混淆并取回完全不同领域的预备信息。这里,搜索关键字所属的领域可由用户方指定。支持系统具备相应领域的同义字字典,同时在用于输入将被传送给用户终端的搜索关键字的网页中,许多领域的同义字字典被表示成可选择的。当从用户终端收到搜索关键字和同义字字典的指定信息时,通过获得代表性搜索关键字,进行搜索,而所述代表性搜索关键字是通过查阅获得代表性搜索关键字的指定领域的同义字字典得到的。此外,搜索对象可被局限于该领域。另一方面,只使用从预备信息数据库获得的预备信息中,属于对应领域的信息。借助这种配置,从搜索对象中排除用户未将其作为目标的信息,减轻了支持系统的处理负载。

    可根据搜索关键字,规定在信息搜索支持系统一侧使用的同义字字典的领域。在唯一关键字或许多关键字的情况下,能够确定同义字字典。

    ===搜索关键字输入方法===

    不必说,许多搜索关键字是可接受的。另外,可利用诸如OR搜索、AND搜索之类搜索条件指定这许多搜索关键字。当然,就用于重新搜索的搜索关键字来说,也可指定相对于相同因素具有其搜索条件的许多重新搜索关键字。此外,如果用于重新搜索的搜索关键字被指定为数字值(电视机的屏幕尺寸或价格等等),则可利用诸如“不小于”、“不大于”、“小于”之类术语限制数字值的范围。例如,当识别数字值时,可用其中限制数字值的范围的字词与下层的数字数量(不小于,不大于,小于等等)相联系的分层结构准备详细关键字集合。

    输入用户终端的搜索关键字并不限于字词,也可是自然句。这种情况下,支持系统一方可通过使用已知的语形字分析从每部分言语的自然句中抽取字词,根据字词中的语义单元计算相关性(字词彼此依赖的关系)等,确定每个字词属于哪些要求。

    ===系统结构===

    包括支持系统、搜索引擎和用户终端的系统的结构并不局限于上面提及的实施例。如果支持系统从外部搜索引擎获得预备信息,则支持系统和搜索引擎被安排成通过因特网相互通信,或者可被构造成通过专用线路或LAN通信。

    用户终端也可被设计成代替支持系统的某些功能。诸如专用应用软件,可和浏览器协作的插件模块之类的浏览器集成型程序安装在用户终端中。另一方面,当需要时,支持系统用于把JAVA小程序传送给用户终端。支持系统把详细关键字集合作为不具备表格功能的简单字词表的形式传送给用户终端。用户终端可借助如上所述,具有根据详细关键字集合,指定字词和权重分数的功能,以及传送指定信息的功能的专用程序,向用户提供用户界面环境。

    除了配有浏览器的个人计算机之外,用户终端的模式可以是配有浏览器的移动电话机。当然,并不局限于诸如个人计算机之类的通用计算机,可以使用用于搜索信息的任意专用终端。另外,虽然信息通信网络并不局限于因特网,LAN可被用于连接构成系统的所有或部分相应计算机。总之,结构是使各个计算机能够按照预定程序通信,并且相互交换预定信息的结构。

    根据本发明的信息搜索支持系统,根据用户输入的搜索关键字,包含在预备信息中的字词被分类和系统化,并以详细关键字集合的形式被提供给用户。于是,用户能够获得与包含在关键字集合中的字词相关的预备信息项的内容和位置,并通过从详细关键字集合中选择更详细的搜索关键字,重新搜索信息。从而,用户能够确定地获得目标信息。

信息搜索支持系统,计算机程序和程序存储媒体.pdf_第1页
第1页 / 共37页
信息搜索支持系统,计算机程序和程序存储媒体.pdf_第2页
第2页 / 共37页
信息搜索支持系统,计算机程序和程序存储媒体.pdf_第3页
第3页 / 共37页
点击查看更多>>
资源描述

《信息搜索支持系统,计算机程序和程序存储媒体.pdf》由会员分享,可在线阅读,更多相关《信息搜索支持系统,计算机程序和程序存储媒体.pdf(37页珍藏版)》请在专利查询网上搜索。

提供与用户终端通信的部分,访问预备信息数据库的部分,从用户终端获得搜索关键字的部分,根据搜索关键字,从预备信息数据库获得预备信息的部分,把通过聚集预备信息准备的详细关键字集合传送给用户终端的部分,获得用户终端从详细关键字集合选择的字词的部分,以选择的字词作为搜索关键字,搜索预备信息数据库,以获得对应预备信息的部分,和把获得的预备信息作为搜索结果传送给用户终端。 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1