一种用于提供搜索结果的方法与设备.pdf

上传人:b*** 文档编号:1577075 上传时间:2018-06-26 格式:PDF 页数:34 大小:1.08MB
返回 下载 相关 举报
摘要
申请专利号:

CN201110255734.0

申请日:

2011.08.31

公开号:

CN102968413A

公开日:

2013.03.13

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20110831|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

北京百度网讯科技有限公司

发明人:

刘利刚

地址:

100085 北京市海淀区上地十街10号百度大厦2层

优先权:

专利代理机构:

北京汉昊知识产权代理事务所(普通合伙) 11370

代理人:

罗朋;周建华

PDF下载: PDF下载
内容摘要

本发明的目的是提供一种用于提供搜索结果的方法与设备,提供设备获取与用户的查询序列相对应的第一搜索结果;根据预置的结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;确定所述第一搜索结果的筛选值;根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果;将所述一个或多个第二搜索结果提供给所述用户。与现有技术相比,本发明通过对第一搜索结果进行分类,并基于筛选值从所述第一搜索结果中选取出第二搜索结果,以保证提供给用户的第二搜索结果的多样性,提高了用户获取信息的效率,从而提升了用户的搜索体验。

权利要求书

权利要求书一种用于提供搜索结果的方法,其中,该方法包括以下步骤:
a获取与用户的查询序列相对应的第一搜索结果;
b根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;
c将所述一个或多个第二搜索结果提供给所述用户;
其中,所述步骤b还包括:
‑根据所述结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;
x确定所述第一搜索结果的筛选值;
‑根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。
根据权利要求1所述的方法,其中,所述步骤x还包括:
‑根据所述第一搜索结果的结果特征信息,基于筛选特征模型,确定所述筛选值;
其中,所述结果特征信息包括以下至少任一项:
‑所述第一搜索结果与所述查询序列的相关度;
‑所述第一搜索结果的权威值;
‑所述第一搜索结果的质量度;
‑所述第一搜索结果的目录深度。
根据权利要求2所述的方法,其中,该方法还包括:
‑根据样本搜索结果的结果特征信息,进行机器学习,以获得所述筛选特征模型。
根据权利要求2或3所述的方法,其中,所述步骤x还包括:
‑根据所述第一搜索结果的结果特征信息与辅助特征信息,基于所述筛选特征模型,确定所述筛选值;
其中,所述辅助特征信息包括以下至少任一项:
‑所述第一搜索结果的查询需求匹配度;
‑所述第一搜索结果的资源有效性;
‑所述第一搜索结果的时间因子。
根据权利要求1至4中任一项所述的方法,其中,所述结果分类规则基于以下至少任一项以获取与所述第一搜索结果相对应的一个或多个第二搜索结果:
‑所述第一搜索结果的站点信息;
‑所述第一搜索结果的内容信息;
‑所述第一搜索结果的主域信息;
‑所述第一搜索结果的资源信息;
‑所述第一搜索结果的类型信息。
根据权利要求5所述的方法,其中,所述步骤b还包括:
‑根据多个所述结果分类规则,对所述第一搜索结果分别进行处理,以获得与所述多个所述结果分类规则相对应的多组候选第二搜索结果,其中,每组候选第二搜索结果与所述多个结果分类规则中的一个结果分类规则相对应;
其中,该方法还包括:
‑根据投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。
根据权利要求6所述的方法,其中,所述投票筛选规则基于以下至少任一项确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果:
‑所述候选第二搜索结果的筛选值加权和大于第一预定阈值;
‑所述候选第二搜索结果的筛选值的平均值大于第二预定阈值;
‑所述候选第二搜索结果的累计出现次数大于第三预定阈值;
‑所述候选第二搜索结果的累计出现比例大于第四预定阈值。
根据权利要求1至7中任一项所述的方法,其中,所述步骤c还包括:
‑根据所述筛选值,将所述一个或多个第二搜索结果提供给所述用户。
根据权利要求1至8中任一项所述的方法,其中,该方法还包括:
‑根据所述第二搜索结果的筛选值,确定所述第二搜索结果的展现模式;
其中,所述步骤c还包括:
‑根据所述展现模式,将所述第二搜索结果提供给所述用户。
根据权利要求9所述的方法,其中,所述展现模式包括以下至少任一项:
‑主结果展现模式;
‑从属结果展现模式。
一种用于提供搜索结果的提供设备,其中,该设备包括:
第一获取装置,用于获取与用户的查询序列相对应的第一搜索结果;
第二获取装置,用于根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;
提供装置,用于将所述一个或多个第二搜索结果提供给所述用户;
其中,所述第二获取装置还包括:
分类单元,用于根据所述结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;
确定单元,用于确定所述第一搜索结果的筛选值;
选取单元,用于根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。
根据权利要求11所述的提供设备,其中,所述确定单元还用于:
‑根据所述第一搜索结果的结果特征信息,基于筛选特征模型,确定所述筛选值;
其中,所述结果特征信息包括以下至少任一项:
‑所述第一搜索结果与所述查询序列的相关度;
‑所述第一搜索结果的权威值;
‑所述第一搜索结果的质量度;
‑所述第一搜索结果的目录深度。
根据权利要求12所述的提供设备,其中,该设备还包括:
学习装置,用于根据样本搜索结果的结果特征信息,进行机器学习,以获得所述筛选特征模型。
根据权利要求12或13所述的提供设备,其中,所述确定单元还用于:
‑根据所述第一搜索结果的结果特征信息与辅助特征信息,基于所述筛选特征模型,确定所述筛选值;
其中,所述辅助特征信息包括以下至少任一项:
‑所述第一搜索结果的查询需求匹配度;
‑所述第一搜索结果的资源有效性;
‑所述第一搜索结果的时间因子。
根据权利要求11至14中任一项所述的提供设备,其中,所述结果分类规则基于以下至少任一项以获取与所述第一搜索结果相对应的一个或多个第二搜索结果:
‑所述第一搜索结果的站点信息;
‑所述第一搜索结果的内容信息;
‑所述第一搜索结果的主域信息;
‑所述第一搜索结果的资源信息;
‑所述第一搜索结果的类型信息。
根据权利要求15所述的提供设备,其中,所述第二获取装置还用于:
‑根据多个所述结果分类规则,对所述第一搜索结果分别进行处理,以获得与所述多个所述结果分类规则相对应的多组候选第二搜索结果,其中,每组候选第二搜索结果与所述多个结果分类规则中的一个结果分类规则相对应;
其中,该设备还包括:
第一确定装置,用于根据投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。
根据权利要求16所述的提供设备,其中,所述投票筛选规则基于以下至少任一项确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果:
‑所述候选第二搜索结果的筛选值加权和大于第一预定阈值;
‑所述候选第二搜索结果的筛选值的平均值大于第二预定阈值;
‑所述候选第二搜索结果的累计出现次数大于第三预定阈值;
‑所述候选第二搜索结果的累计出现比例大于第四预定阈值。
根据权利要求11至17中任一项所述的提供设备,其中,所述提供装置还用于:
‑根据所述筛选值,将所述一个或多个第二搜索结果提供给所述用户。
根据权利要求11至18中任一项所述的提供设备,其中,该设备还包括:
第二确定装置,用于根据所述第二搜索结果的筛选值,确定所述第二搜索结果的展现模式;
其中,所述提供装置还用于:
‑根据所述展现模式,将所述第二搜索结果提供给所述用户。
根据权利要求19所述的提供设备,其中,所述展现模式包括以下至少任一项:
‑主结果展现模式;
‑从属结果展现模式。

说明书

说明书一种用于提供搜索结果的方法与设备
技术领域
本发明涉及互联网搜索领域,尤其涉及一种用于提供搜索结果的技术。
背景技术
随着搜索技术的突飞猛进,用户对搜索结果的要求也呈现出多样化的趋势,对于同一个查询序列,用户可能需要的是相关的视频信息,也可能是相关的图片信息,或者是相关的新闻信息。现有技术中,针对用户的查询序列,只是根据网页打分给出普通的查询结果,尤其在搜索引擎返回的第1页的搜索结果中,经常被同站点、同内容或者同类型的结果所充斥,用户需要多次翻页才能找到其想要的搜索结果。
因此,如何控制搜索结果中类别的重复,为用户提供更为多样化的搜索结果,提高用户获取信息的效率,从而提升用户的搜索体验,成为本领域技术人员亟需解决的问题之一。
发明内容
本发明的目的是提供一种用于提供搜索结果的方法与设备。
根据本发明的一个方面,提供了一种用于提供搜索结果的方法,其中,该方法包括以下步骤:
a获取与用户的查询序列相对应的第一搜索结果;
b根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;
c将所述一个或多个第二搜索结果提供给所述用户;
其中,所述步骤b还包括:
‑根据所述结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;
x确定所述第一搜索结果的筛选值;
‑根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。
根据本发明的另一方面,还提供了一种用于提供搜索结果的提供设备,其中,该设备包括:
第一获取装置,用于获取与用户的查询序列相对应的第一搜索结果;
第二获取装置,用于根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;
提供装置,用于将所述一个或多个第二搜索结果提供给所述用户;
其中,所述第二获取装置还包括:
分类单元,用于根据所述结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;
确定单元,用于确定所述第一搜索结果的筛选值;
选取单元,用于根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。
与现有技术相比,本发明通过对第一搜索结果进行分类,并基于筛选值从所述第一搜索结果中选取出第二搜索结果,以保证提供给用户的第二搜索结果的多样性,提高了用户获取信息的效率,从而提升了用户的搜索体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的用于提供搜索结果的系统拓扑图;
图2示出根据本发明一个方面的用于提供搜索结果的设备示意图;
图3示出根据本发明一个优选实施例的用于提供搜索结果的设备示意图;
图4示出根据本发明另一个方面的用于提供搜索结果的方法流程图;
图5示出根据本发明一个优选实施例的用于提供搜索结果的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的用于提供搜索结果的系统拓扑图;其中包括提供设备1、与提供设备1经由网络相连接的多个中间设备3以及多个与上述提供设备1或中间设备3经由网络相连接的用户设备2。其中,提供设备1获取与用户设备2或中间设备3提供的用户的查询序列相对应的第一搜索结果;根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;将所述一个或多个第二搜索结果提供给所述用户,从而保证了提供给用户的第二搜索结果的多样性,提高了用户获取信息的效率,并提升了用户的搜索体验。在此,网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。
另外,提供设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。中间设备3同样包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。而用户设备2包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、掌上电脑PPC或IPTV等。提供设备1与各中间设备3之间的通信相互独立,包括但不限于基于诸如TCP/IP协议、UDP协议等的分组数据传输。提供设备1与各用户设备2之间的通信相互独立,包括但不限于基于诸如TCP/IP协议、UDP协议等的分组数据传输。中间设备3与各用户设备2之间的通信相互独立,包括但不限于基于诸如TCP/IP协议、UDP协议等的分组数据传输。
本领域技术人员应能理解上述提供设备1、用户设备2、中间设备3以及连接其间的网络、通信方式仅为举例,其他现有的或今后可能出现的提供设备、用户设备、中间设备、网络或通信方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
本领域技术人员还应能理解,图1中仅为简明起见而示出的各类网络元素的数量可能小于一个实际网络中的数量,但这种省略无疑地是以不会影响对本发明进行清楚、充分的公开为前提的。
为简明起见,下面以一个用户设备2为例进行描述。本领域技术人员应能理解,提供设备1可以同时与多个用户设备2或中间设备3交互,并获取与不同的用户设备2或中间设备3提供的用户的查询序列相对应的第一搜索结果;根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;将所述一个或多个第二搜索结果提供给相应的用户设备2或中间设备3。
图2示出根据本发明一个方面的用于提供搜索结果的设备示意图,其中,提供设备1包括第一获取装置11、第二获取装置12和提供装置13,其中,第二获取装置12包括分类单元121、确定单元122和选取单元123。
第一获取装置11获取与用户的查询序列相对应的第一搜索结果。具体地,第一获取装置11例如通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取与用户通过用户设备2输入的查询序列相匹配的第一搜索结果;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取该用户通过用户设备2输入的查询序列,并通过搜索索引信息库匹配查询或实时在线搜索等方式,获取与该查询序列相对应的第一搜索结果;或者,通过页面技术,如ASP、JSP、PHP等页面技术,从用户设备2获取用户通过该用户设备2输入的查询序列,并通过搜索索引信息库匹配查询或实时在线搜索等方式,获取与该查询序列相对应的第一搜索结果。例如,用户通过与用户设备2的交互方式,如键盘、鼠标、遥控器、触摸板、手写设备或语音输入设备,在浏览器软件、应用程序或客户端软件等的输入框中输入查询序列;搜索引擎通过JSP等页面技术获取到用户输入的查询序列,基于用户输入的查询序列进行匹配查询,获得与所述查询序列相匹配的第一搜索结果;第一获取装置11通过调用该搜索引擎所提供的应用程序接口,从该搜索引擎中获取到所述第一搜索结果。例如,当用户通过与用户设备2的交互,输入查询序列“鲜花朵朵”时,搜索引擎基于所述查询序列进行匹配查询,获得多个关于“鲜花朵朵”的第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵视频豆单合集土豆网”等;第一获取装置11通过与该搜索引擎的交互,获取上述第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵视频豆单合集土豆网”等。本领域技术人员应能理解上述获取第一搜索结果的方式仅为举例,其他现有的或今后可能出现的获取第一搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
第二获取装置12根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果。具体地,第二获取装置12根据预置的结果分类规则,对第一获取装置11所获取的第一搜索结果进行分类,以得到一个或多个搜索结果类,再根据第一搜索结果的筛选值,例如通过选取筛选值满足阈值的第一搜索结果、从根据筛选值排序后的第一搜索结果中选取前K个第一搜索结果等方式,从该一个或多个搜索结果类中选取一个或多个第一搜索结果,以作为第二搜索结果。在此,K为预置的选取数量阈值。接上例,当用户通过与用户设备2的交互,输入查询序列“鲜花朵朵”时,搜索引擎基于所述查询序列进行匹配查询,获得多个关于“鲜花朵朵”的第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵1视频优酷视频在线观看”、“鲜花朵朵视频豆单合集土豆网”等;第一获取装置11通过与该搜索引擎的交互,获取上述第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵1视频优酷视频在线观看”、“鲜花朵朵视频豆单合集土豆网”等;第二获取装置12根据预置的分类规则,例如根据第一搜索结果的站点信息进行分类,将上述第一搜索结果进行分类,分为三个搜索结果类,第一个搜索结果类包括第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵1视频优酷视频在线观看”等具有相同或相似站点的第一搜索结果,第二个搜索结果类包括第一搜索结果“鲜花朵朵百度百科”等具有相同或相似站点的第一搜索结果,第三个搜索结果类包括“鲜花朵朵视频豆单合集土豆网”等第一搜索结果,随后,第二获取装置12再根据上述第一搜索结果的筛选值,从上述三个搜索结果类中选取出第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”和“鲜花朵朵视频豆单合集土豆网”,以作为与所述第一搜索结果相对应的一个或多个第二搜索结果。在此,第二获取装置12可以按照一种结果分类规则对所述第一搜索结果进行分类,也可以按照多种结果分类规则对所述第一搜索结果进行分类。结果分类规则包括但不限于基于第一搜索结果的站点信息进行分类、基于第一搜索结果的内容信息进行分类、基于第一搜索结果的主域信息进行分类、基于第一搜索结果的资源信息进行分类、基于第一搜索结果的类型信息进行分类等。本领域技术人员应能理解上述获取第二搜索结果的方式仅为举例,其他现有的或今后可能出现的获取第二搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解上述结果分类规则仅为举例,其他现有的或今后可能出现的结果分类规则如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
具体地,第二获取装置12包括分类单元121、确定单元122和选取单元123,其中,分类单元121根据所述结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;确定单元122确定所述第一搜索结果的筛选值;选取单元123根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。
其中,第二获取装置中的分类单元121根据结果分类规则,对第一获取装置11所获取的第一搜索结果进行分类,以获得一个或多个搜索结果类。具体地,分类单元121根据结果分类规则,如基于第一搜索结果的站点信息、内容信息、主域信息、资源信息、类型信息等的结果分类规则,将第一获取装置11所获取的一个或多个第一搜索结果进行分类,以获得一个或多个搜索结果类。例如,针对第一获取装置11所获取的第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵1视频优酷视频在线观看”、“鲜花朵朵视频豆单合集土豆网”等;分类单元121根据预置的分类规则,例如根据第一搜索结果的站点信息进行分类,将上述第一搜索结果进行分类,分为三个搜索结果类,第一个搜索结果类包括第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵1视频优酷视频在线观看”等具有相同或相似站点的第一搜索结果,第二个搜索结果类包括第一搜索结果“鲜花朵朵百度百科”等具有相同或相似站点的第一搜索结果,第三个搜索结果类包括“鲜花朵朵视频豆单合集土豆网”等第一搜索结果。本领域技术人员应能理解上述对第一搜索结果分类的方式仅为举例,其他现有的或今后可能出现的对第一搜索结果分类的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
确定单元122确定所述第一搜索结果的筛选值。具体地,确定单元122确定所述第一搜索结果的筛选值的方式包括但不限于:1)通过实时计算,确定所述第一搜索结果的筛选值;2)通过与搜索信息库的交互,获取所述第一搜索结果的筛选值;3)根据所述第一搜索结果的结果特征信息,如所述第一搜索结果的权威值或目录深度,基于筛选特征模型,确定所述筛选值;4)根据所述第一搜索结果的结果特征信息与辅助特征信息,基于所述筛选特征模型,确定所述筛选值。例如,确定单元122根据第一获取装置11所获取的第一搜索结果,通过与搜索信息库的交互,在所述搜索信息库中进行匹配查询,获得所述第一搜索结果的筛选值。在此,所述搜索信息库中存储有第一搜索结果的筛选值,该搜索信息库可以位于提供设备1中,也可以位于与提供设备1通过网络连接的第三方设备中。又如,假设所述第一搜索结果的结果特征信息为所述第一搜索结果的目录深度,确定单元122根据所述第一搜索结果的目录深度,基于筛选特征模型,如目录深度阈值,确定所述第一搜索结果的筛选值,如当所述第一搜索结果的目录深度小于该筛选特征模型中的目录深度阈值时,则确定所述第一搜索结果的筛选值为1;否则,所述第一搜索结果的筛选值为0。优选地,当包括多个结果特征信息时,确定单元122首先根据这多个结果特征信息,分别确定所述第一搜索结果与这多个结果特征信息所对应的多个候选筛选值,再根据这各个结果特征信息所对应的权值,对这多个候选筛选值进行加权计算,得出所述第一搜索结果的筛选值。本领域技术人员应能理解上述确定第一搜索结果的筛选值的方式仅为举例,其他现有的或今后可能出现的确定第一搜索结果的筛选值的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本领域技术人员应能理解,分类单元所执行的操作与确定单元所执行的操作并无严格的先后顺序关系,两者或并行或串行,当两者并行执行时,两者部分并行或全部并行;当两者串行执行时,前者先于后者执行,或前者后于后者执行。
选取单元123根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。在此,选取单元123从所述一个或多个搜索结果类中选取一个或多个第二搜索结果的方式包括但不限于:1)根据第一搜索结果的筛选值,分别从所述一个或多个搜索结果类中选取筛选值大于第五预定阈值的第一搜索结果,以作为第二搜索结果,其中,所述第五预定阈值为预置的筛选值阈值,用于根据第一搜索结果的筛选值判断是否应为第二搜索结果;2)对于所述一个或多个搜索结果类中的每一个搜索结果类,将该搜索结果类中的第一搜索结果按照筛选值的大小进行排序,如筛选值越大则排序位置越靠前,再从该排序后的第一搜索结果中选取前K个第一搜索结果,以作为第二搜索结果,其中,K为预置的选取数量阈值。以经分类单元121分类得到的其中一个搜索结果类为例,假设该搜索结果类包括第一搜索结果“鲜花朵朵百度百科”、“鲜花朵朵在线高清观看奇艺‑百度旗下视频网站”、“鲜花朵朵专辑百度视频”等具有相同或相似站点的第一搜索结果;确定单元122根据与搜索信息库的交互,获取到上述第一搜索结果的筛选值分别为8、8.5、7.5;选取单元123再根据上述筛选值,选取筛选值满足第五预定阈值的第一搜索结果,如当第五预定阈值为8,选取单元123选取出第一搜索结果“鲜花朵朵百度百科”、“鲜花朵朵在线高清观看奇艺‑百度旗下视频网站”,或者,选取单元123根据第一搜索结果的筛选值大小将所述第一搜索结果进行排序,如筛选值越大则排序优先级越高,则上述第一搜索结果按照“鲜花朵朵在线高清观看奇艺‑百度旗下视频网站”、“鲜花朵朵百度百科”、“鲜花朵朵专辑百度视频”的顺序进行排序,随后,选取单元123再从上述排序后的第一搜索结果中选取前两个第一搜索结果,以作为第二搜索结果。优选地,选取单元123还可以根据所述第二搜索结果的数量,调整上述第五预定阈值或K的取值,再根据所述第一搜索结果的筛选值,结合调整后的所述第五预定阈值或K的取值,选取所述一个或多个第二搜索结果。例如,当第二搜索结果的数量小于第六预定阈值时,降低所述第五预定阈值或提高所述K的取值,以提高提供给用户的第二搜索结果的数量;当第二搜索结果的数量大于第七预定阈值时,提高所述第五预定阈值或降低所述K的取值,以减少提供给用户的第二搜索结果的数量。在此,第六预定阈值、第七预定阈值为预置的数量阈值,用来判断是否调整提供给用户的第二搜索结果的数量,当该数量低于第六预定阈值时,降低所述第五预定阈值或提高所述K的取值,以提高提供给用户的第二搜索结果的数量;当该数量高于第七预定阈值时,提高所述第五预定阈值或降低所述K的取值,以减少提供给用户的第二搜索结果的数量。本领域技术人员应能理解上述选取第二搜索结果的方式仅为举例,其他现有的或今后可能出现的选取第二搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
提供装置13将所述一个或多个第二搜索结果提供给所述用户。具体地,提供装置13根据第二获取装置12所获取的一个或多个第二搜索结果,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述一个或多个第二搜索结果提供给所述用户。以屏幕显示为例,提供装置13将第二获取装置12所获取的一个或多个第二搜索结果,利用页面技术,如ASP、JSP或PHP等页面技术,随机或按一定顺序和格式,如URL+摘要的形式,提供给用户设备2,供用户进行浏览。接上例,假设第二获取装置12根据上述第一搜索结果的筛选值,选取出第二搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”和“鲜花朵朵视频豆单合集土豆网”;随后,提供装置13利用页面技术,如ASP、JSP或PHP等,将上述第二搜索结果提供给用户设备2,供用户进行浏览。优选地,提供装置13还可以根据第二搜索结果的筛选值,确定所述第二搜索结果的优先级,按照该优先级,将所述一个或多个第二搜索结果提供给所述用户。更优选地,提供装置13还可以根据由第二搜索结果的筛选值所确定的展现模式,如主结果展现模式、从属结果展现模式等,将所述第二搜索结果按照上述展现模式提供给所述用户。本领域技术人员应能理解上述提供第二搜索结果的方式仅为举例,其他现有的或今后可能出现的提供第二搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,提供设备1的各个装置之间是持续不断工作的。具体地,第一获取装置11获取与用户的查询序列相对应的第一搜索结果;第二获取装置12根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;提供装置13将所述一个或多个第二搜索结果提供给所述用户。在此,本领域技术人员应理解“持续”是指提供设备1的各装置分别按照设定的或实时调整的工作模式要求进行第一搜索结果的获取、第二搜索结果的获取与提供,直至第一获取装置11在较长时间内停止获取与用户的查询序列相对应的第一搜索结果。更优选地,第二获取装置12中的各个单元之间也是持续不断工作的。具体地,分类单元121根据所述结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;确定单元122确定所述第一搜索结果的筛选值;选取单元123根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。在此,本领域技术人员应理解“持续”是指第二获取装置12的各单元分别按照设定的或实时调整的工作模式要求进行第一搜索结果的分类、筛选值的确定和第二搜索结果的选取。
优选地,所述确定单元122根据所述第一搜索结果的结果特征信息,基于筛选特征模型,确定所述筛选值;其中,所述结果特征信息包括以下至少任一项:
‑所述第一搜索结果与所述查询序列的相关度;
‑所述第一搜索结果的权威值;
‑所述第一搜索结果的质量度;
‑所述第一搜索结果的目录深度。
具体地,确定单元122例如通过对该第一搜索结果进行语义分析或协议解析获取所述第一搜索结果的结果特征信息,或者通过与特征信息库的交互,从该特征信息库中直接匹配获得所述第一搜索结果的结果特征信息,或者从该特征信息库中匹配获得所述第一搜索结果的相关信息,再根据这些相关信息计算确定所述第一搜索结果的结果特征信息;根据该结果特征信息,基于筛选特征模型,确定所述第一搜索结果的筛选值,如根据基于筛选特征模型得到的特征函数,计算出所述第一搜索结果的筛选值。在此,所述特征信息库存储有所述第一搜索结果的结果特征信息,或用于计算确定该结果特征信息的所述第一搜索结果的相关信息,如所述第一搜索结果的pagerank值、站点权威性、用户点击量、完备性、资源丰富度、页面编辑质量等信息;可根据搜索索引库和/或对大量页面浏览访问记录的统计分析结果,建立或更新所述特征信息库;所述特征信息库可以位于提供设备1中,也可以位于与该提供设备1通过网络相连接的第三方设备中。当所述结果特征信息包括所述第一搜索结果与所述查询序列的相关度,确定单元122根据所述第一搜索结果与用户的查询序列的相关度,基于筛选特征模型,确定所述第一搜索结果的筛选值。例如,当所述第一搜索结果与用户的查询序列的相关度越高,则所述第一搜索结果的筛选值越大。当所述结果特征信息包括所述第一搜索结果的权威值,确定单元122根据所述第一搜索结果的权威值,基于筛选特征模型,确定所述第一搜索结果的筛选值。在此,所述第一搜索结果的权威值例如通过所述第一搜索结果的pagerank值、站点权威性、用户点击量等综合计算得出。当所述第一搜索结果的权威值越大,则所述第一搜索结果的筛选值越大。当所述结果特征信息包括所述第一搜索结果的质量度,确定单元122根据所述第一搜索结果的质量度,基于筛选特征模型,确定所述第一搜索结果的筛选值。在此,所述第一搜索结果的质量度例如通过所述第一搜索结果的完备性、资源丰富度、页面编辑质量等综合计算得出,如通过页面解析,统计第一搜索结果所对应的页面的文字内容、图片数、链接数等,进而得到所述第一搜索结果的资源丰富度,通过分析页面布局得到所述第一搜索结果的完备性、页面编辑质量等,进一步地,根据上述资源丰富度、完备性和页面编辑质量,确定所述第一搜索结果的质量度。当所述第一搜索结果的质量度越高,则所述第一搜索结果的筛选值越大。当所述结果特征信息包括所述第一搜索结果的目录深度,确定单元122根据所述第一搜索结果的目录深度,基于筛选特征模型,确定所述第一搜索结果的筛选值。在此,所述第一搜索结果的目录深度可以理解为所述第一搜索结果的url的目录级别,即,该第一搜索结果距与之相对应的首页的距离。当所述第一搜索结果的目录深度越小,则所述第一搜索结果的筛选值越大。优选地,当包括多个结果特征信息时,确定单元122首先根据这多个结果特征信息,基于筛选特征模型,分别确定所述第一搜索结果与这多个结果特征信息所对应的多个候选筛选值,再根据这各个结果特征信息所对应的权值,对这多个候选筛选值进行加权计算,得出所述第一搜索结果的筛选值。本领域技术人员应能理解上述结果特征信息仅为举例,其他现有的或今后可能出现的结果特征信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明根据第一搜索结果的一个或多个结果特征信息,基于筛选特征模型,确定所述第一搜索结果的筛选值,从而基于筛选值从所述第一搜索结果中选取出第二搜索结果,以保证提供给用户的第二搜索结果的多样性。
更优选地,提供设备1还包括学习装置(未示出),该学习装置根据样本搜索结果的结果特征信息,进行机器学习,以获得所述筛选特征模型。具体地,学习装置通过诸如与搜索引擎等第三方设备的交互,获得样本搜索结果,再根据所述样本搜索结果,通过与特征信息库的交互,获得所述样本搜索结果的结果特征信息,根据所述结果特征信息,通过分类决策树、贝叶斯模型、支持向量机等机器学习算法,对所述样本搜索结果进行训练,获得所述筛选特征模型。在此,该学习装置获取所述样本搜索结果的方式包括但不限于:1)通过诸如与搜索引擎等第三方设备的交互,从搜索结果访问日志中随机抽取或按访问时间或内容分类等筛选属性选取多个搜索结果访问记录,将这些搜索结果访问记录所对应的访问页面作为所述样本搜索结果,并将这些样本搜索结果的筛选值置为特定值,如0或1;2)通过与页面数据库等第三方设备进行交互,从页面数据库中获取多个页面及其对应的筛选值,并将这些页面作为所述样本搜索结果。本领域技术人员应能理解上述获得筛选特征模型的方式仅为举例,其他现有的或今后可能出现的获得筛选特征模型的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
更优选地,所述确定单元122根据所述第一搜索结果的结果特征信息与辅助特征信息,基于所述筛选特征模型,确定所述筛选值;其中,所述辅助特征信息包括以下至少任一项:
‑所述第一搜索结果的查询需求匹配度;
‑所述第一搜索结果的资源有效性;
‑所述第一搜索结果的时间因子。
具体地,确定单元122例如通过对该第一搜索结果进行语义分析或协议解析获取所述第一搜索结果的结果特征信息,或者通过与特征信息库的交互,从该特征信息库中直接匹配获得所述第一搜索结果的结果特征信息与辅助特征信息,或者,从该特征信息库中匹配获得所述第一搜索结果的相关信息,再根据这些相关信息计算确定所述第一搜索结果的结果特征信息与辅助特征信息;根据所述结果特征信息与辅助特征信息,基于筛选特征模型,确定所述第一搜索结果的筛选值,如根据基于筛选特征模型得到的特征函数,计算出所述第一搜索结果的筛选值。在此,所述特征信息库存储有所述第一搜索结果的结果特征信息与辅助特征信息,或用于计算确定该结果特征信息与辅助特征信息的所述第一搜索结果的相关信息,如所述第一搜索结果的pagerank值、站点权威性、用户点击量,所述第一搜索结果所对应的页面资源的有效程度、页面内容的更新时间等信息;可根据搜索索引库和/或对大量页面浏览访问记录的统计分析结果,建立或更新所述特征信息库;所述特征信息库可以位于提供设备1中,也可以位于与该提供设备1通过网络相连接的第三方设备中。当所述辅助特征信息包括所述第一搜索结果的查询需求匹配度,确定单元122根据所述第一搜索结果的结果特征信息与查询需求匹配度,基于筛选特征模型,确定所述第一搜索结果的筛选值。例如,第一搜索结果所对应的查询序列为“刘德华”,确定单元122根据该查询序列,获取该查询序列的查询需求,如知识、图片、视频、音乐等查询需求,再根据上述查询需求,确定该查询需求与第一搜索结果的匹配度,以作为该第一搜索结果的查询需求匹配度,根据该查询需求匹配度,与该第一搜索结果的结果特征信息一起,基于筛选特征模型,确定该第一搜索结果的筛选值,如根据不同的查询需求匹配度确定不同的结果特征信息所对应的权值,通过将基于多个结果特征信息所获得的多个候选筛选值进行加权计算,以得出所述第一搜索结果的筛选值。当所述辅助特征信息包括所述第一搜索结果的资源有效性,确定单元122根据所述第一搜索结果的的结果特征信息与资源有效性,基于筛选特征模型,确定所述第一搜索结果的筛选值。在此,所述第一搜索结果的资源有效性例如通过所述第一搜索结果的页面所提供的资源的有效程度来确定,如当所述第一搜索结果的页面为下载页时,根据该页面的页面资源是否能够下载、下载速度、资源的质量度等确定所述第一搜索结果的资源有效性,当所述第一搜索结果的页面为视频页时,根据该页面的视频资源是否能够观看、视频的清晰度等确定所述第一搜索结果的资源有效性。当所述第一搜索结果的资源有效性越大,则所述第一搜索结果的筛选值越大。当所述辅助特征信息包括所述第一搜索结果的时间因子,确定单元122根据所述第一搜索结果的结果特征信息与时间因子,基于筛选特征模型,确定所述第一搜索结果的筛选值。在此,所述第一搜索结果的时间因子例如通过所述第一搜索结果的页面内容的更新时间距离目前的时间得出,反映了该第一搜索结果所对应的页面的新旧程度。当所述第一搜索结果所对应的页面内容越新,则所述第一搜索结果的筛选值越大。在此,所述第一搜索结果的结果特征信息包括但不限于所述第一搜索结果与用户的查询序列的相关度,所述第一搜索结果的权威值、质量度、目录深度等。优选地,确定单元122根据所述第一搜索结果的结果特征信息,并结合上述多个辅助特征信息,基于筛选特征模型,确定所述第一搜索结果的筛选值,如根据各个结果特征信息与辅助特征信息所对应的权值,通过将基于上述多个结果特征信息与辅助特征信息所得到的多个候选筛选值进行加权计算,得出所述第一搜索结果的筛选值。本领域技术人员应能理解上述辅助特征信息仅为举例,其他现有的或今后可能出现的辅助特征信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明根据第一搜索结果的结果特征信息与辅助特征信息,基于筛选特征模型,确定所述第一搜索结果的筛选值,以使筛选值更精确,从而基于筛选值从所述第一搜索结果中选取出第二搜索结果,以保证提供给用户的第二搜索结果的多样性。
优选地,所述结果分类规则基于以下至少任一项以获取与所述第一搜索结果相对应的一个或多个第二搜索结果:
‑所述第一搜索结果的站点信息;
‑所述第一搜索结果的内容信息;
‑所述第一搜索结果的主域信息;
‑所述第一搜索结果的资源信息;
‑所述第一搜索结果的类型信息。
具体地,当所述结果分类规则为基于所述第一搜索结果的站点信息以获取与所述第一搜索结果相对应的一个或多个第二搜索结果,分类单元121根据该结果分类规则,将第一获取装置11所获取的第一搜索结果进行分类,以获得一个或多个搜索结果类,其中,每个搜索结果类中包括同站点的第一搜索结果。在此,分类单元121通过例如获取第一搜索结果的站点签名、站点别名、跳转、域名转换等方式,获取所述第一搜索结果的站点信息,根据该站点信息,对所述第一搜索结果进行分类。当所述结果分类规则为基于所述第一搜索结果的内容信息以获取与所述第一搜索结果相对应的一个或多个第二搜索结果,分类单元121根据该结果分类规则,将第一获取装置11所获取的第一搜索结果进行分类,以获得一个或多个搜索结果类,其中,每个搜索结果类中包括同内容的第一搜索结果。在此,分类单元121例如通过内容签名算法,如提取页面主题、提取页面关键字、提取页面最长句等方式,判断所述第一搜索结果的内容是否相同或相似,以对所述第一搜索结果进行分类。当所述结果分类规则为基于所述第一搜索结果的主域信息以获取与所述第一搜索结果相对应的一个或多个第二搜索结果,分类单元121根据该结果分类规则,将第一获取装置11所获取的第一搜索结果进行分类,以获得一个或多个搜索结果类,其中,每个搜索结果类中包括同主域的第一搜索结果。在此,分类单元121例如通过在主域词典中进行匹配查询,以确定所述第一搜索结果的主域信息,所述主域词典可以通过挖掘首页url的方式进行建立或更新。当所述结果分类规则为基于所述第一搜索结果的资源信息以获取与所述第一搜索结果相对应的一个或多个第二搜索结果,分类单元121根据该结果分类规则,将第一获取装置11所获取的第一搜索结果进行分类,以获得一个或多个搜索结果类,其中,每个搜索结果类中包括同资源的第一搜索结果。在此,所述第一搜索结果的资源分类包括但不限于视频、图片、软件等资源分类。当所述结果分类规则为基于所述第一搜索结果的类型信息以获取与所述第一搜索结果相对应的一个或多个第二搜索结果,分类单元121根据该结果分类规则,将第一获取装置11所获取的第一搜索结果进行分类,以获得一个或多个搜索结果类,其中,每个搜索结果类中包括同类型的第一搜索结果。在此,所述第一搜索结果的类型分类包括但不限于新闻、论坛、社区等类型分类。本领域技术人员应能理解上述结果分类规则仅为举例,其他现有的或今后可能出现的结果分类规则如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明包括多种结果分类规则,既可以根据一种结果分类规则对第一搜索结果进行分类,也可以结合多种结果分类规则对第一搜索结果进行分类,进一步地,基于筛选值从分类结果中选取出第二搜索结果,以保证提供给用户的第二搜索结果的多样性。
图3示出根据本发明一个优选实施例的用于提供搜索结果的设备示意图;提供设备1还可以包括第一确定装置14’。其中,第一获取装置11’、第二获取装置12’和提供装置13’分别与图2所示对应装置11、12和13相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
具体地,第二获取装置12’根据多个所述结果分类规则,对所述第一搜索结果分别进行处理,以获得与所述多个所述结果分类规则相对应的多组候选第二搜索结果,其中,每组候选第二搜索结果与所述多个结果分类规则中的一个结果分类规则相对应;其中,第一确定装置14’根据投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。具体地,第二获取装置12’根据多个结果分类规则,如基于所述第一搜索结果的站点信息、内容信息、主域信息、资源信息、类型信息等确定的结果分类规则中的多个结果分类规则,对第一获取装置11’所获取的第一搜索结果分别进行分类,以得到多组搜索结果类,每组搜结果类包括一个或多个搜索结果类,每组搜索结果类与一种结果分类规则相对应,根据第一搜索结果的筛选值,从每组搜索结果类中选取出候选第二搜索结果,以得到多组候选第二搜索结果,在此,同一个候选第二搜索结果可能同时存在于多组候选第二搜索结果中;随后,第一确定装置14’根据投票筛选规则,如根据该候选第二搜索结果的筛选值加权和、筛选值的平均值、累计出现次数、累计出现比例等投票筛选规则,基于所述每组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。例如,对于同一个搜索结果“鲜花朵朵百度百科”,其既在根据站点信息分类得到的搜索结果类中,也在根据类型信息分类得到的搜索结果类中,且第二获取装置12’在该两个搜索结果类中都将此搜索结果选取出来,作为候选第二搜索结果;随后,第一确定装置14’根据投票筛选规则,例如根据该搜索结果“鲜花朵朵百度百科”在该两个搜索结果类中的筛选值,并结合该两个搜索结果类对该搜索结果的权值,通过加权计算,得到该搜索结果“鲜花朵朵百度百科”的筛选值加权和,当该筛选值加权和大于第一预定阈值,则第一确定装置14’确定该搜索结果“鲜花朵朵百度百科”为第二搜索结果。在此,所述第一预定阈值为预置的筛选值阈值,用于根据所述候选第二搜索结果的筛选值加权和判断所述候选第二搜索结果是否应为第二搜索结果。本领域技术人员应能理解上述获取第二搜索结果的方式仅为举例,其他现有的或今后可能出现的获取第二搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明可以根据多种结果分类规则对第一搜索结果进行分类,基于筛选值从多个分类结果中选取出第二搜索结果,以保证提供给用户的第二搜索结果的多样性。
优选地,所述投票筛选规则基于以下至少任一项确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果:
‑所述候选第二搜索结果的筛选值加权和大于第一预定阈值;
‑所述候选第二搜索结果的筛选值的平均值大于第二预定阈值;
‑所述候选第二搜索结果的累计出现次数大于第三预定阈值;
‑所述候选第二搜索结果的累计出现比例大于第四预定阈值。
具体地,当所述投票筛选规则基于所述候选第二搜索结果的筛选值加权和大于第一预定阈值来确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果,第一确定装置14’根据该投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。在此,所述第一预定阈值为预置的筛选值阈值,用于根据所述候选第二搜索结果的筛选值加权和判断所述候选第二搜索结果是否应为第二搜索结果。例如,对于同时存在于多组候选第二搜索结果中不同组的候选第二搜索结果,该候选第二搜索结果在不同组中的筛选值可能不同,每个组对该候选第二搜索结果具有一定的权值,第一确定装置14’根据该候选第二搜索结果在不同组中的筛选值,并结合这不同组所对应的结果分类规则的权值,通过加权计算,得到该候选第二搜索结果筛选值加权和,当该筛选值加权和大于第一预定阈值,则第一确定装置14’确定所述候选第二搜索结果为与所述第一搜索结果相对应的第二搜索结果。当所述投票筛选规则基于所述候选第二搜索结果的筛选值的平均值大于第二预定阈值;第一确定装置14’根据该投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。在此,所述第二预定阈值为预置的筛选值阈值,用于根据所述候选第二搜索结果的筛选值的平均值判断所述候选第二搜索结果是否应为第二搜索结果。例如,对于同时存在于多组候选第二搜索结果中不同组的候选第二搜索结果,该候选第二搜索结果在不同组中的筛选值可能不同,第一确定装置14’根据该候选第二搜索结果在不同组中的筛选值,并结合包括该第二搜索结果的搜索结果类的数量,计算得到该候选第二搜索结果的筛选值的平均值,当该筛选值的平均值大于第二预定阈值,则第一确定装置14’确定所述候选第二搜索结果为与所述第一搜索结果相对应的第二搜索结果。当所述投票筛选规则基于所述候选第二搜索结果的累计出现次数大于第三预定阈值;第一确定装置14’根据该投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。在此,所述第三预定阈值为预置的数量阈值,用于根据所述候选第二搜索结果的累计出现次数判断所述候选第二搜索结果是否应为第二搜索结果。例如,第二获取装置12’根据多个所述结果分类规则,对所述第一搜索结果分别进行分类,以获得一个或多个搜索结果类,再根据第一搜索结果的筛选值,从该一个或多个搜索结果类中选取出候选第二搜索结果,由于所述候选第二搜索结果可能存在于不同组的搜索结果类中,因此,该候选第二搜索结果的累计出现次数大于等于1,当所述候选第二搜索结果累计出现次数大于第三预定阈值,第一确定装置14’确定所述候选第二搜索结果为与所述第一搜索结果相对应的第二搜索结果。当所述投票筛选规则基于所述候选第二搜索结果的累计出现比例大于第四预定阈值,第一确定装置14’根据该投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。对于某个候选第二搜索结果,其累计出现比例通过上述累计出现次数与候选第二搜索结果的数量总和得出。在此,所述第四预定阈值为预置的比例阈值,用于根据所述候选第二搜索结果的累计出现比例判断所述候选第二搜索结果是否应为第二搜索结果。优选地,第一确定装置14’根据上述多个投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。本领域技术人员应能理解上述投票筛选规则仅为举例,其他现有的或今后可能出现的投票筛选规则如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在一个优选实施例中(参见图2),提供装置13根据所述筛选值,将所述一个或多个第二搜索结果提供给所述用户。以下参照图2对该优选实施例进行描述,第一获取装置11获取与用户的查询序列相对应的第一搜索结果;第二获取装置12根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;提供装置13根据所述筛选值,将所述一个或多个第二搜索结果提供给所述用户。其具体过程与前述参照图2所描述的实施例中第一获取装置11和第二获取装置12所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,提供装置13根据第二获取装置12所获取的一个或多个第二搜索结果,按照该一个或多个第二搜索结果的筛选值,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述一个或多个第二搜索结果提供给所述用户。例如,提供装置13根据第二搜索结果的筛选值,将所述一个或多个第二搜索结果按照筛选值的大小进行排序,如筛选值越大则排序位置越靠前,随后,提供装置13利用页面技术,如ASP、JSP或PHP等页面技术,将上述排序后的第二搜索结果提供给用户设备2,供用户进行浏览。优选地,提供装置13根据第一确定装置14’(参见图3)所确定的一个或多个第二搜索结果,按照该一个或多个第二搜索结果的筛选值,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述一个或多个第二搜索结果提供给所述用户。本领域技术人员应能理解上述提供第二搜索结果的方式仅为举例,其他现有的或今后可能出现的提供第二搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明根据第二搜索结果的筛选值,将第二搜索结果排序后展现给用户,更符合用户的浏览习惯,提升用户的使用体验。
在另一个优选实施例中(参见图2),提供设备1还包括第二确定装置(未示出),该第二确定装置根据所述第二搜索结果的筛选值,确定所述第二搜索结果的展现模式;其中,所述提供装置13根据所述展现模式,将所述第二搜索结果提供给所述用户。以下参照图2对该优选实施例进行描述,第一获取装置11获取与用户的查询序列相对应的第一搜索结果;第二获取装置12根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;第二确定装置根据所述第二搜索结果的筛选值,确定所述第二搜索结果的展现模式;提供装置13根据所述展现模式,将所述第二搜索结果提供给所述用户。其具体过程与前述参照图2所描述的实施例中第一获取装置11和第二获取装置12所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,第二确定装置根据第二获取装置12所获取的第二搜索结果的筛选值,确定所述第二搜索结果的展现模式,如筛选值大于第八预定阈值的第二搜索结果以主结果展现模式展现、筛选值大于第九预定阈值小于第八预定阈值的第二搜索结果以从属结果展现模式展现;随后,提供装置13根据第二确定装置所确定的展现模式,利用页面技术,如ASP、JSP或PHP等页面技术,将所述第二搜索结果提供给用户设备2,以供用户进行浏览。在此,所述第八预定阈值、第九预定阈值为预置的筛选值阈值,用来根据第二搜索结果的筛选值判断第二搜索结果的展现模式,当第二搜索结果的筛选值大于第八预定阈值时,所述第二搜索结果以主结果展现模式展现;当第二搜索结果的筛选值大于第九预定阈值小于第八预定阈值时,所述第二搜索结果以从属结果展现模式展现。本领域技术人员应能理解上述确定第二搜索结果的展现模式的方式仅为举例,其他现有的或今后可能出现的确定第二搜索结果的展现模式的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明根据第二搜索结果的筛选值,确定第二搜索结果的展现模式,根据展现模式将第二搜索结果展现给用户,方便用户浏览。
优选地,所述展现模式包括以下至少任一项:
‑主结果展现模式;
‑从属结果展现模式。
具体地,第二搜索结果的展现模式包括但不限于以主结果展现模式进行展现、以从属结果展现模式进行展现。在此,主结果展现模式例如以结果链接+摘要+URL的形式展现;从属结果展现模式例如只将结果链接以缩进的方式展现。当所述第二搜索结果的展现模式包括以主结果展现模式进行展现,提供装置13利用页面技术,如ASP、JSP或PHP等页面技术,将所述第二搜索结果提供给用户设备2,以供用户进行浏览。当所述第二搜索结果的展现模式包括以从属结果展现模式进行展现,提供装置13利用页面技术,如ASP、JSP或PHP等页面技术,将所述第二搜索结果通过缩进的展现方式提供给用户设备2,以供用户进行浏览。优选地,提供装置13还可以将同一个搜索结果类中的满足不同展现模式的第二搜索结果,按照主结果展现模式与从属结果展现模式,提供给用户设备2,以供用户进行浏览。本领域技术人员应能理解上述展现模式仅为举例,其他现有的或今后可能出现的展现模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
图4示出根据本发明另一个方面的用于提供搜索结果的方法流程图。
在步骤S1中,提供设备1获取与用户的查询序列相对应的第一搜索结果。具体地,在步骤S1中,提供设备1例如通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取与用户通过用户设备2输入的查询序列相匹配的第一搜索结果;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取该用户通过用户设备2输入的查询序列,并通过搜索索引信息库匹配查询或实时在线搜索等方式,获取与该查询序列相对应的第一搜索结果;或者,通过页面技术,如ASP、JSP、PHP等页面技术,从用户设备2获取用户通过该用户设备2输入的查询序列,并通过搜索索引信息库匹配查询或实时在线搜索等方式,获取与该查询序列相对应的第一搜索结果。例如,用户通过与用户设备2的交互方式,如键盘、鼠标、遥控器、触摸板、手写设备或语音输入设备,在浏览器软件、应用程序或客户端软件等的输入框中输入查询序列;搜索引擎通过JSP等页面技术获取到用户输入的查询序列,基于用户输入的查询序列进行匹配查询,获得与所述查询序列相匹配的第一搜索结果;在步骤S1中,提供设备1通过调用该搜索引擎所提供的应用程序接口,从该搜索引擎中获取到所述第一搜索结果。例如,当用户通过与用户设备2的交互,输入查询序列“鲜花朵朵”时,搜索引擎基于所述查询序列进行匹配查询,获得多个关于“鲜花朵朵”的第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵视频豆单合集土豆网”等;在步骤S1中,提供设备1通过与该搜索引擎的交互,获取上述第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵视频豆单合集土豆网”等。本领域技术人员应能理解上述获取第一搜索结果的方式仅为举例,其他现有的或今后可能出现的获取第一搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S2中,提供设备1根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果。具体地,在步骤S2中,提供设备1根据预置的结果分类规则,对在步骤S1中所获取的第一搜索结果进行分类,以得到一个或多个搜索结果类,再根据第一搜索结果的筛选值,例如通过选取筛选值满足阈值的第一搜索结果、从根据筛选值排序后的第一搜索结果中选取前K个第一搜索结果等方式,从该一个或多个搜索结果类中选取一个或多个第一搜索结果,以作为第二搜索结果。在此,K为预置的选取数量阈值。接上例,当用户通过与用户设备2的交互,输入查询序列“鲜花朵朵”时,搜索引擎基于所述查询序列进行匹配查询,获得多个关于“鲜花朵朵”的第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵1视频优酷视频在线观看”、“鲜花朵朵视频豆单合集土豆网”等;在步骤S1中,提供设备1通过与该搜索引擎的交互,获取上述第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵1视频优酷视频在线观看”、“鲜花朵朵视频豆单合集土豆网”等;在步骤S2中,提供设备1根据预置的分类规则,例如根据第一搜索结果的站点信息进行分类,将上述第一搜索结果进行分类,分为三个搜索结果类,第一个搜索结果类包括第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵1视频优酷视频在线观看”等具有相同或相似站点的第一搜索结果,第二个搜索结果类包括第一搜索结果“鲜花朵朵百度百科”等具有相同或相似站点的第一搜索结果,第三个搜索结果类包括“鲜花朵朵视频豆单合集土豆网”等第一搜索结果,随后,在步骤S2中,提供设备1再根据上述第一搜索结果的筛选值,从上述三个搜索结果类中选取出第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”和“鲜花朵朵视频豆单合集土豆网”,以作为与所述第一搜索结果相对应的一个或多个第二搜索结果。在此,在步骤S2中,提供设备1可以按照一种结果分类规则对所述第一搜索结果进行分类,也可以按照多种结果分类规则对所述第一搜索结果进行分类。结果分类规则包括但不限于基于第一搜索结果的站点信息进行分类、基于第一搜索结果的内容信息进行分类、基于第一搜索结果的主域信息进行分类、基于第一搜索结果的资源信息进行分类、基于第一搜索结果的类型信息进行分类等。本领域技术人员应能理解上述获取第二搜索结果的方式仅为举例,其他现有的或今后可能出现的获取第二搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解上述结果分类规则仅为举例,其他现有的或今后可能出现的结果分类规则如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
具体地,步骤S2包括步骤S21、S22和S23,其中,在步骤S21中,提供设备1根据所述结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;在步骤S22中,提供设备1确定所述第一搜索结果的筛选值;在步骤S23中,提供设备1根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。
其中,在步骤S21中,提供设备1根据结果分类规则,对在步骤S1中所获取的第一搜索结果进行分类,以获得一个或多个搜索结果类。具体地,在步骤S21中,提供设备1根据结果分类规则,如基于第一搜索结果的站点信息、内容信息、主域信息、资源信息、类型信息等的结果分类规则,将在步骤S1中所获取的一个或多个第一搜索结果进行分类,以获得一个或多个搜索结果类。例如,针对在步骤S1中所获取的第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵1视频优酷视频在线观看”、“鲜花朵朵视频豆单合集土豆网”等;在步骤S21中,提供设备1根据预置的分类规则,例如根据第一搜索结果的站点信息进行分类,将上述第一搜索结果进行分类,分为三个搜索结果类,第一个搜索结果类包括第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵1视频优酷视频在线观看”等具有相同或相似站点的第一搜索结果,第二个搜索结果类包括第一搜索结果“鲜花朵朵百度百科”等具有相同或相似站点的第一搜索结果,第三个搜索结果类包括“鲜花朵朵视频豆单合集土豆网”等第一搜索结果。本领域技术人员应能理解上述对第一搜索结果分类的方式仅为举例,其他现有的或今后可能出现的对第一搜索结果分类的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S22中,提供设备1确定所述第一搜索结果的筛选值。具体地,在步骤S22中,提供设备1确定所述第一搜索结果的筛选值的方式包括但不限于:1)通过实时计算,确定所述第一搜索结果的筛选值;2)通过与搜索信息库的交互,获取所述第一搜索结果的筛选值;3)根据所述第一搜索结果的结果特征信息,如所述第一搜索结果的权威值或目录深度,基于筛选特征模型,确定所述筛选值;4)根据所述第一搜索结果的结果特征信息与辅助特征信息,基于所述筛选特征模型,确定所述筛选值。例如,在步骤S22中,提供设备1根据在步骤S1中所获取的第一搜索结果,通过与搜索信息库的交互,在所述搜索信息库中进行匹配查询,获得所述第一搜索结果的筛选值。在此,所述搜索信息库中存储有第一搜索结果的筛选值,该搜索信息库可以位于提供设备1中,也可以位于与提供设备1通过网络连接的第三方设备中。又如,假设所述第一搜索结果的结果特征信息为所述第一搜索结果的目录深度,在步骤S22中,提供设备1根据所述第一搜索结果的目录深度,基于筛选特征模型,如目录深度阈值,确定所述第一搜索结果的筛选值,如当所述第一搜索结果的目录深度小于该筛选特征模型中的目录深度阈值时,则确定所述第一搜索结果的筛选值为1;否则,所述第一搜索结果的筛选值为0。优选地,当包括多个结果特征信息时,在步骤S22中,提供设备1首先根据这多个结果特征信息,分别确定所述第一搜索结果与这多个结果特征信息所对应的多个候选筛选值,再根据这各个结果特征信息所对应的权值,对这多个候选筛选值进行加权计算,得出所述第一搜索结果的筛选值。本领域技术人员应能理解上述确定第一搜索结果的筛选值的方式仅为举例,其他现有的或今后可能出现的确定第一搜索结果的筛选值的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本领域技术人员应能理解,在步骤S21中所执行的操作与在步骤S22中所执行的操作并无严格的先后顺序关系,两者或并行或串行,当两者并行执行时,两者部分并行或全部并行;当两者串行执行时,前者先于后者执行,或前者后于后者执行。
在步骤S23中,提供设备1根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。在此,在步骤S23中,提供设备1从所述一个或多个搜索结果类中选取一个或多个第二搜索结果的方式包括但不限于:1)根据第一搜索结果的筛选值,分别从所述一个或多个搜索结果类中选取筛选值大于第五预定阈值的第一搜索结果,以作为第二搜索结果,其中,所述第五预定阈值为预置的筛选值阈值,用于根据第一搜索结果的筛选值判断是否应为第二搜索结果;2)对于所述一个或多个搜索结果类中的每一个搜索结果类,将该搜索结果类中的第一搜索结果按照筛选值的大小进行排序,如筛选值越大则排序位置越靠前,再从该排序后的第一搜索结果中选取前K个第一搜索结果,以作为第二搜索结果,其中,K为预置的选取数量阈值。以经在步骤S21分类得到的其中一个搜索结果类为例,假设该搜索结果类包括第一搜索结果“鲜花朵朵百度百科”、“鲜花朵朵在线高清观看奇艺‑百度旗下视频网站”、“鲜花朵朵专辑百度视频”等具有相同或相似站点的第一搜索结果;在步骤S22中,提供设备1根据与搜索信息库的交互,获取到上述第一搜索结果的筛选值分别为8、8.5、7.5;在步骤S23中,提供设备1再根据上述筛选值,选取筛选值满足第五预定阈值的第一搜索结果,如当第五预定阈值为8,在步骤S23中,提供设备1选取出第一搜索结果“鲜花朵朵百度百科”、“鲜花朵朵在线高清观看奇艺‑百度旗下视频网站”,或者,在步骤S23中,提供设备1根据第一搜索结果的筛选值大小将所述第一搜索结果进行排序,如筛选值越大则排序优先级越高,则上述第一搜索结果按照“鲜花朵朵在线高清观看奇艺‑百度旗下视频网站”、“鲜花朵朵百度百科”、“鲜花朵朵专辑百度视频”的顺序进行排序,随后,提供设备1再从上述排序后的第一搜索结果中选取前两个第一搜索结果,以作为第二搜索结果。优选地,在步骤S23中,提供设备1还可以根据所述第二搜索结果的数量,调整上述第五预定阈值或K的取值,再根据所述第一搜索结果的筛选值,结合调整后的所述第五预定阈值或K的取值,选取所述一个或多个第二搜索结果。例如,当第二搜索结果的数量小于第六预定阈值时,降低所述第五预定阈值或提高所述K的取值,以提高提供给用户的第二搜索结果的数量;当第二搜索结果的数量大于第七预定阈值时,提高所述第五预定阈值或降低所述K的取值,以减少提供给用户的第二搜索结果的数量。在此,第六预定阈值、第七预定阈值为预置的数量阈值,用来判断是否调整提供给用户的第二搜索结果的数量,当该数量低于第六预定阈值时,降低所述第五预定阈值或提高所述K的取值,以提高提供给用户的第二搜索结果的数量;当该数量高于第七预定阈值时,提高所述第五预定阈值或降低所述K的取值,以减少提供给用户的第二搜索结果的数量。本领域技术人员应能理解上述选取第二搜索结果的方式仅为举例,其他现有的或今后可能出现的选取第二搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S3中,提供设备1将所述一个或多个第二搜索结果提供给所述用户。具体地,在步骤S3中,提供设备1根据在步骤S2中所获取的一个或多个第二搜索结果,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述一个或多个第二搜索结果提供给所述用户。以屏幕显示为例,在步骤S3中,提供设备1将在步骤S2中所获取的一个或多个第二搜索结果,利用页面技术,如ASP、JSP或PHP等页面技术,随机或按一定顺序和格式,如URL+摘要的形式,提供给用户设备2,供用户进行浏览。接上例,假设提供设备1在步骤S2中根据上述第一搜索结果的筛选值,选取出第二搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”和“鲜花朵朵视频豆单合集土豆网”;随后,在步骤S3中,提供设备1利用页面技术,如ASP、JSP或PHP等,将上述第二搜索结果提供给用户设备2,供用户进行浏览。优选地,在步骤S3中,提供设备1还可以根据第二搜索结果的筛选值,确定所述第二搜索结果的优先级,按照该优先级,将所述一个或多个第二搜索结果提供给所述用户。更优选地,在步骤S3中,提供设备1还可以根据由第二搜索结果的筛选值所确定的展现模式,如主结果展现模式、从属结果展现模式等,将所述第二搜索结果按照上述展现模式提供给所述用户。本领域技术人员应能理解上述提供第二搜索结果的方式仅为举例,其他现有的或今后可能出现的提供第二搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,提供设备1的各个步骤之间是持续不断工作的。具体地,在步骤S 1中,提供设备1获取与用户的查询序列相对应的第一搜索结果;在步骤S2中,提供设备1根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;在步骤S3中,提供设备1将所述一个或多个第二搜索结果提供给所述用户。在此,本领域技术人员应理解“持续”是指提供设备1的各步骤分别按照设定的或实时调整的工作模式要求进行第一搜索结果的获取、第二搜索结果的获取与提供,直至提供设备1在较长时间内停止获取与用户的查询序列相对应的第一搜索结果。更优选地,步骤S2中的各个子步骤之间也是持续不断工作的。具体地,在步骤S21中,提供设备1根据所述结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;在步骤S22中,提供设备1确定所述第一搜索结果的筛选值;在步骤S23中,提供设备1根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。在此,本领域技术人员应理解“持续”是指步骤S2中的各子步骤分别按照设定的或实时调整的工作模式要求进行第一搜索结果的分类、筛选值的确定和第二搜索结果的选取。
优选地,在步骤S22中,提供设备1根据所述第一搜索结果的结果特征信息,基于筛选特征模型,确定所述筛选值;其中,所述结果特征信息包括以下至少任一项:
‑所述第一搜索结果与所述查询序列的相关度;
‑所述第一搜索结果的权威值;
‑所述第一搜索结果的质量度;
‑所述第一搜索结果的目录深度。
具体地,在步骤S22中,提供设备1例如通过对该第一搜索结果进行语义分析或协议解析获取所述第一搜索结果的结果特征信息,或者通过与特征信息库的交互,从该特征信息库中直接匹配获得所述第一搜索结果的结果特征信息,或者从该特征信息库中匹配获得所述第一搜索结果的相关信息,再根据这些相关信息计算确定所述第一搜索结果的结果特征信息;根据该结果特征信息,基于筛选特征模型,确定所述第一搜索结果的筛选值,如根据基于筛选特征模型得到的特征函数,计算出所述第一搜索结果的筛选值。在此,所述特征信息库存储有所述第一搜索结果的结果特征信息,或用于计算确定该结果特征信息的所述第一搜索结果的相关信息,如所述第一搜索结果的pagerank值、站点权威性、用户点击量、完备性、资源丰富度、页面编辑质量等信息;可根据搜索索引库和/或对大量页面浏览访问记录的统计分析结果,建立或更新所述特征信息库;所述特征信息库可以位于提供设备1中,也可以位于与该提供设备1通过网络相连接的第三方设备中。当所述结果特征信息包括所述第一搜索结果与所述查询序列的相关度,在步骤S22中,提供设备1根据所述第一搜索结果与用户的查询序列的相关度,基于筛选特征模型,确定所述第一搜索结果的筛选值。例如,当所述第一搜索结果与用户的查询序列的相关度越高,则所述第一搜索结果的筛选值越大。当所述结果特征信息包括所述第一搜索结果的权威值,在步骤S22中,提供设备1根据所述第一搜索结果的权威值,基于筛选特征模型,确定所述第一搜索结果的筛选值。在此,所述第一搜索结果的权威值例如通过所述第一搜索结果的pagerank值、站点权威性、用户点击量等综合计算得出。当所述第一搜索结果的权威值越大,则所述第一搜索结果的筛选值越大。当所述结果特征信息包括所述第一搜索结果的质量度,在步骤S22中,提供设备1根据所述第一搜索结果的质量度,基于筛选特征模型,确定所述第一搜索结果的筛选值。在此,所述第一搜索结果的质量度例如通过所述第一搜索结果的完备性、资源丰富度、页面编辑质量等综合计算得出,如通过页面解析,统计第一搜索结果所对应的页面的文字内容、图片数、链接数等,进而得到所述第一搜索结果的资源丰富度,通过分析页面布局得到所述第一搜索结果的完备性、页面编辑质量等,进一步地,根据上述资源丰富度、完备性和页面编辑质量,确定所述第一搜索结果的质量度。当所述第一搜索结果的质量度越高,则所述第一搜索结果的筛选值越大。当所述结果特征信息包括所述第一搜索结果的目录深度,在步骤S22中,提供设备1根据所述第一搜索结果的目录深度,基于筛选特征模型,确定所述第一搜索结果的筛选值。在此,所述第一搜索结果的目录深度可以理解为所述第一搜索结果的url的目录级别,即,该第一搜索结果距与之相对应的首页的距离。当所述第一搜索结果的目录深度越小,则所述第一搜索结果的筛选值越大。优选地,当包括多个结果特征信息时,在步骤S22中,提供设备1首先根据这多个结果特征信息,基于筛选特征模型,分别确定所述第一搜索结果与这多个结果特征信息所对应的多个候选筛选值,再根据这各个结果特征信息所对应的权值,对这多个候选筛选值进行加权计算,得出所述第一搜索结果的筛选值。本领域技术人员应能理解上述结果特征信息仅为举例,其他现有的或今后可能出现的结果特征信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明根据第一搜索结果的一个或多个结果特征信息,基于筛选特征模型,确定所述第一搜索结果的筛选值,从而基于筛选值从所述第一搜索结果中选取出第二搜索结果,以保证提供给用户的第二搜索结果的多样性。
更优选地,在步骤S5(未示出)中,提供设备1根据样本搜索结果的结果特征信息,进行机器学习,以获得所述筛选特征模型。具体地,在步骤S5中,提供设备1通过诸如与搜索引擎等第三方设备的交互,获得样本搜索结果,再根据所述样本搜索结果,通过与特征信息库的交互,获得所述样本搜索结果的结果特征信息,根据所述结果特征信息,通过分类决策树、贝叶斯模型、支持向量机等机器学习算法,对所述样本搜索结果进行训练,获得所述筛选特征模型。在此,在步骤S5中,提供设备1获取所述样本搜索结果的方式包括但不限于:1)通过诸如与搜索引擎等第三方设备的交互,从搜索结果访问日志中随机抽取或按访问时间或内容分类等筛选属性选取多个搜索结果访问记录,将这些搜索结果访问记录所对应的访问页面作为所述样本搜索结果,并将这些样本搜索结果的筛选值置为特定值,如0或1;2)通过与页面数据库等第三方设备进行交互,从页面数据库中获取多个页面及其对应的筛选值,并将这些页面作为所述样本搜索结果。本领域技术人员应能理解上述获得筛选特征模型的方式仅为举例,其他现有的或今后可能出现的获得筛选特征模型的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
更优选地,在步骤S22中,提供设备1根据所述第一搜索结果的结果特征信息与辅助特征信息,基于所述筛选特征模型,确定所述筛选值;其中,所述辅助特征信息包括以下至少任一项:
‑所述第一搜索结果的查询需求匹配度;
‑所述第一搜索结果的资源有效性;
‑所述第一搜索结果的时间因子。
具体地,在步骤S22中,提供设备1例如通过对该第一搜索结果进行语义分析或协议解析获取所述第一搜索结果的结果特征信息,或者通过与特征信息库的交互,从该特征信息库中直接匹配获得所述第一搜索结果的结果特征信息与辅助特征信息,或者,从该特征信息库中匹配获得所述第一搜索结果的相关信息,再根据这些相关信息计算确定所述第一搜索结果的结果特征信息与辅助特征信息;根据所述结果特征信息与辅助特征信息,基于筛选特征模型,确定所述第一搜索结果的筛选值,如根据基于筛选特征模型得到的特征函数,计算出所述第一搜索结果的筛选值。在此,所述特征信息库存储有所述第一搜索结果的结果特征信息与辅助特征信息,或用于计算确定该结果特征信息与辅助特征信息的所述第一搜索结果的相关信息,如所述第一搜索结果的pagerank值、站点权威性、用户点击量,所述第一搜索结果所对应的页面资源的有效程度、页面内容的更新时间等信息;可根据搜索索引库和/或对大量页面浏览访问记录的统计分析结果,建立或更新所述特征信息库;所述特征信息库可以位于提供设备1中,也可以位于与该提供设备1通过网络相连接的第三方设备中。当所述辅助特征信息包括所述第一搜索结果的查询需求匹配度,在步骤S22中,提供设备1根据所述第一搜索结果的结果特征信息与查询需求匹配度,基于筛选特征模型,确定所述第一搜索结果的筛选值。例如,第一搜索结果所对应的查询序列为“刘德华”,在步骤S22中,提供设备1根据该查询序列,获取该查询序列的查询需求,如知识、图片、视频、音乐等查询需求,再根据上述查询需求,确定该查询需求与第一搜索结果的匹配度,以作为该第一搜索结果的查询需求匹配度,根据该查询需求匹配度,与该第一搜索结果的结果特征信息一起,基于筛选特征模型,确定该第一搜索结果的筛选值,如根据不同的查询需求匹配度确定不同的结果特征信息所对应的权值,通过将基于多个结果特征信息所获得的多个候选筛选值进行加权计算,以得出所述第一搜索结果的筛选值。当所述辅助特征信息包括所述第一搜索结果的资源有效性,在步骤S22中,提供设备1根据所述第一搜索结果的的结果特征信息与资源有效性,基于筛选特征模型,确定所述第一搜索结果的筛选值。在此,所述第一搜索结果的资源有效性例如通过所述第一搜索结果的页面所提供的资源的有效程度来确定,如当所述第一搜索结果的页面为下载页时,根据该页面的页面资源是否能够下载、下载速度、资源的质量度等确定所述第一搜索结果的资源有效性,当所述第一搜索结果的页面为视频页时,根据该页面的视频资源是否能够观看、视频的清晰度等确定所述第一搜索结果的资源有效性。当所述第一搜索结果的资源有效性越大,则所述第一搜索结果的筛选值越大。当所述辅助特征信息包括所述第一搜索结果的时间因子,在步骤S22中,提供设备1根据所述第一搜索结果的结果特征信息与时间因子,基于筛选特征模型,确定所述第一搜索结果的筛选值。在此,所述第一搜索结果的时间因子例如通过所述第一搜索结果的页面内容的更新时间距离目前的时间得出,反映了该第一搜索结果所对应的页面的新旧程度。当所述第一搜索结果所对应的页面内容越新,则所述第一搜索结果的筛选值越大。在此,所述第一搜索结果的结果特征信息包括但不限于所述第一搜索结果与用户的查询序列的相关度,所述第一搜索结果的权威值、质量度、目录深度等。优选地,在步骤S22中,提供设备1根据所述第一搜索结果的结果特征信息,并结合上述多个辅助特征信息,基于筛选特征模型,确定所述第一搜索结果的筛选值,如根据各个结果特征信息与辅助特征信息所对应的权值,通过将基于上述多个结果特征信息与辅助特征信息所得到的多个候选筛选值进行加权计算,得出所述第一搜索结果的筛选值。本领域技术人员应能理解上述辅助特征信息仅为举例,其他现有的或今后可能出现的辅助特征信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明根据第一搜索结果的结果特征信息与辅助特征信息,基于筛选特征模型,确定所述第一搜索结果的筛选值,以使筛选值更精确,从而基于筛选值从所述第一搜索结果中选取出第二搜索结果,以保证提供给用户的第二搜索结果的多样性。
优选地,所述结果分类规则基于以下至少任一项以获取与所述第一搜索结果相对应的一个或多个第二搜索结果:
‑所述第一搜索结果的站点信息;
‑所述第一搜索结果的内容信息;
‑所述第一搜索结果的主域信息;
‑所述第一搜索结果的资源信息;
‑所述第一搜索结果的类型信息。
具体地,当所述结果分类规则为基于所述第一搜索结果的站点信息以获取与所述第一搜索结果相对应的一个或多个第二搜索结果,在步骤S21中,提供设备1根据该结果分类规则,将在步骤S1中所获取的第一搜索结果进行分类,以获得一个或多个搜索结果类,其中,每个搜索结果类中包括同站点的第一搜索结果。在此,在步骤S21中,提供设备1通过例如获取第一搜索结果的站点签名、站点别名、跳转、域名转换等方式,获取所述第一搜索结果的站点信息,根据该站点信息,对所述第一搜索结果进行分类。当所述结果分类规则为基于所述第一搜索结果的内容信息以获取与所述第一搜索结果相对应的一个或多个第二搜索结果,在步骤S21中,提供设备1根据该结果分类规则,将在步骤S1中所获取的第一搜索结果进行分类,以获得一个或多个搜索结果类,其中,每个搜索结果类中包括同内容的第一搜索结果。在此,在步骤S21中,提供设备1例如通过内容签名算法,如提取页面主题、提取页面关键字、提取页面最长句等方式,判断所述第一搜索结果的内容是否相同或相似,以对所述第一搜索结果进行分类。当所述结果分类规则为基于所述第一搜索结果的主域信息以获取与所述第一搜索结果相对应的一个或多个第二搜索结果,在步骤S21中,提供设备1根据该结果分类规则,将在步骤S1中所获取的第一搜索结果进行分类,以获得一个或多个搜索结果类,其中,每个搜索结果类中包括同主域的第一搜索结果。在此,在步骤S21中,提供设备1例如通过在主域词典中进行匹配查询,以确定所述第一搜索结果的主域信息,所述主域词典可以通过挖掘首页url的方式进行建立或更新。当所述结果分类规则为基于所述第一搜索结果的资源信息以获取与所述第一搜索结果相对应的一个或多个第二搜索结果,在步骤S21中,提供设备1根据该结果分类规则,将在步骤S1中所获取的第一搜索结果进行分类,以获得一个或多个搜索结果类,其中,每个搜索结果类中包括同资源的第一搜索结果。在此,所述第一搜索结果的资源分类包括但不限于视频、图片、软件等资源分类。当所述结果分类规则为基于所述第一搜索结果的类型信息以获取与所述第一搜索结果相对应的一个或多个第二搜索结果,在步骤S21中,提供设备1根据该结果分类规则,将在步骤S1中所获取的第一搜索结果进行分类,以获得一个或多个搜索结果类,其中,每个搜索结果类中包括同类型的第一搜索结果。在此,所述第一搜索结果的类型分类包括但不限于新闻、论坛、社区等类型分类。本领域技术人员应能理解上述结果分类规则仅为举例,其他现有的或今后可能出现的结果分类规则如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明包括多种结果分类规则,既可以根据一种结果分类规则对第一搜索结果进行分类,也可以结合多种结果分类规则对第一搜索结果进行分类,进一步地,基于筛选值从分类结果中选取出第二搜索结果,以保证提供给用户的第二搜索结果的多样性。
图5示出根据本发明一个优选实施例的用于提供搜索结果的方法流程图,其中,步骤S1’、S3’与图4所示对应步骤S1、S3相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
具体地,在步骤S2’中,提供设备1根据多个所述结果分类规则,对所述第一搜索结果分别进行处理,以获得与所述多个所述结果分类规则相对应的多组候选第二搜索结果,其中,每组候选第二搜索结果与所述多个结果分类规则中的一个结果分类规则相对应;其中,在步骤S4’中,提供设备1根据投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。具体地,在步骤S2’中,提供设备1根据多个结果分类规则,如基于所述第一搜索结果的站点信息、内容信息、主域信息、资源信息、类型信息等确定的结果分类规则中的多个结果分类规则,对在步骤S1’中所获取的第一搜索结果分别进行分类,以得到多组搜索结果类,每组搜结果类包括一个或多个搜索结果类,每组搜索结果类与一种结果分类规则相对应,根据第一搜索结果的筛选值,从每组搜索结果类中选取出候选第二搜索结果,以得到多组候选第二搜索结果,在此,同一个候选第二搜索结果可能同时存在于多组候选第二搜索结果中;随后,在步骤S4’中,提供设备1根据投票筛选规则,如根据该候选第二搜索结果的筛选值加权和、筛选值的平均值、累计出现次数、累计出现比例等投票筛选规则,基于所述每组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。例如,对于同一个搜索结果“鲜花朵朵百度百科”,其既在根据站点信息分类得到的搜索结果类中,也在根据类型信息分类得到的搜索结果类中,且在步骤S2’中,提供设备1在该两个搜索结果类中都将此搜索结果选取出来,作为候选第二搜索结果;随后,在步骤S4’中,提供设备1根据投票筛选规则,例如根据该搜索结果“鲜花朵朵百度百科”在该两个搜索结果类中的筛选值,并结合该两个搜索结果类对该搜索结果的权值,通过加权计算,得到该搜索结果“鲜花朵朵百度百科”的筛选值加权和,当该筛选值加权和大于第一预定阈值,则在步骤S4’中,提供设备1确定该搜索结果“鲜花朵朵百度百科”为第二搜索结果。在此,所述第一预定阈值为预置的筛选值阈值,用于根据所述候选第二搜索结果的筛选值加权和判断所述候选第二搜索结果是否应为第二搜索结果。本领域技术人员应能理解上述获取第二搜索结果的方式仅为举例,其他现有的或今后可能出现的获取第二搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明可以根据多种结果分类规则对第一搜索结果进行分类,基于筛选值从多个分类结果中选取出第二搜索结果,以保证提供给用户的第二搜索结果的多样性。
优选地,所述投票筛选规则基于以下至少任一项确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果:
‑所述候选第二搜索结果的筛选值加权和大于第一预定阈值;
‑所述候选第二搜索结果的筛选值的平均值大于第二预定阈值;
‑所述候选第二搜索结果的累计出现次数大于第三预定阈值;
‑所述候选第二搜索结果的累计出现比例大于第四预定阈值。具体地,当所述投票筛选规则基于所述候选第二搜索结果的筛选值加权和大于第一预定阈值来确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果,在步骤S4’中,提供设备1根据该投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。在此,所述第一预定阈值为预置的筛选值阈值,用于根据所述候选第二搜索结果的筛选值加权和判断所述候选第二搜索结果是否应为第二搜索结果。例如,对于同时存在于多组候选第二搜索结果中不同组的候选第二搜索结果,该候选第二搜索结果在不同组中的筛选值可能不同,每个组对该候选第二搜索结果具有一定的权值,在步骤S4’中,提供设备1根据该候选第二搜索结果在不同组中的筛选值,并结合这不同组所对应的结果分类规则的权值,通过加权计算,得到该候选第二搜索结果筛选值加权和,当该筛选值加权和大于第一预定阈值,则在步骤S4’中,提供设备1确定所述候选第二搜索结果为与所述第一搜索结果相对应的第二搜索结果。当所述投票筛选规则基于所述候选第二搜索结果的筛选值的平均值大于第二预定阈值;在步骤S4’中,提供设备1根据该投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。在此,所述第二预定阈值为预置的筛选值阈值,用于根据所述候选第二搜索结果的筛选值的平均值判断所述候选第二搜索结果是否应为第二搜索结果。例如,对于同时存在于多组候选第二搜索结果中不同组的候选第二搜索结果,该候选第二搜索结果在不同组中的筛选值可能不同,在步骤S4’中,提供设备1根据该候选第二搜索结果在不同组中的筛选值,并结合包括该第二搜索结果的搜索结果类的数量,计算得到该候选第二搜索结果的筛选值的平均值,当该筛选值的平均值大于第二预定阈值,则在步骤S4’中,提供设备1确定所述候选第二搜索结果为与所述第一搜索结果相对应的第二搜索结果。当所述投票筛选规则基于所述候选第二搜索结果的累计出现次数大于第三预定阈值;在步骤S4’中,提供设备1根据该投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。在此,所述第三预定阈值为预置的数量阈值,用于根据所述候选第二搜索结果的累计出现次数判断所述候选第二搜索结果是否应为第二搜索结果。例如,在步骤S2’中,提供设备1根据多个所述结果分类规则,对所述第一搜索结果分别进行分类,以获得一个或多个搜索结果类,再根据第一搜索结果的筛选值,从该一个或多个搜索结果类中选取出候选第二搜索结果,由于所述候选第二搜索结果可能存在于不同组的搜索结果类中,因此,该候选第二搜索结果的累计出现次数大于等于1,当所述候选第二搜索结果累计出现次数大于第三预定阈值,在步骤S4’中,提供设备1确定所述候选第二搜索结果为与所述第一搜索结果相对应的第二搜索结果。当所述投票筛选规则基于所述候选第二搜索结果的累计出现比例大于第四预定阈值,在步骤S4’中,提供设备1根据该投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。对于某个候选第二搜索结果,其累计出现比例通过上述累计出现次数与候选第二搜索结果的数量总和得出。在此,所述第四预定阈值为预置的比例阈值,用于根据所述候选第二搜索结果的累计出现比例判断所述候选第二搜索结果是否应为第二搜索结果。优选地,在步骤S4’中,提供设备1根据上述多个投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。本领域技术人员应能理解上述投票筛选规则仅为举例,其他现有的或今后可能出现的投票筛选规则如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在一个优选实施例中(参见图4),在步骤S3中,提供设备1根据所述筛选值,将所述一个或多个第二搜索结果提供给所述用户。以下参照图4对该优选实施例进行描述,在步骤S1中,提供设备1获取与用户的查询序列相对应的第一搜索结果;在步骤S2中,提供设备1根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;在步骤S3中,提供设备1根据所述筛选值,将所述一个或多个第二搜索结果提供给所述用户。其具体过程与前述参照图4所描述的实施例中提供设备1在步骤S1和步骤S2中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,在步骤S3中,提供设备1根据在步骤S2中所获取的一个或多个第二搜索结果,按照该一个或多个第二搜索结果的筛选值,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述一个或多个第二搜索结果提供给所述用户。例如,在步骤S3中,提供设备1根据第二搜索结果的筛选值,将所述一个或多个第二搜索结果按照筛选值的大小进行排序,如筛选值越大则排序位置越靠前,随后,在步骤S3中,提供设备1利用页面技术,如ASP、JSP或PHP等页面技术,将上述排序后的第二搜索结果提供给用户设备2,供用户进行浏览。优选地,在步骤S3中,提供设备1根据在步骤S4’中(参见图5)所确定的一个或多个第二搜索结果,按照该一个或多个第二搜索结果的筛选值,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述一个或多个第二搜索结果提供给所述用户。本领域技术人员应能理解上述提供第二搜索结果的方式仅为举例,其他现有的或今后可能出现的提供第二搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明根据第二搜索结果的筛选值,将第二搜索结果排序后展现给用户,更符合用户的浏览习惯,提升用户的使用体验。
在另一个优选实施例中(参见图4),在步骤S6(未示出)中,提供设备1根据所述第二搜索结果的筛选值,确定所述第二搜索结果的展现模式;随后,在步骤S3中,提供设备1根据所述展现模式,将所述第二搜索结果提供给所述用户。以下参照图4对该优选实施例进行描述,在步骤S1中,提供设备1获取与用户的查询序列相对应的第一搜索结果;在步骤S2中,提供设备1根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;在步骤S6中,提供设备1根据所述第二搜索结果的筛选值,确定所述第二搜索结果的展现模式;在步骤S3中,提供设备1根据所述展现模式,将所述第二搜索结果提供给所述用户。其具体过程与前述参照图4所描述的实施例中提供设备1在步骤S 1和步骤S2中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,在步骤S6中,提供设备1根据在步骤S2中所获取的第二搜索结果的筛选值,确定所述第二搜索结果的展现模式,如筛选值大于第八预定阈值的第二搜索结果以主结果展现模式展现、筛选值大于第九预定阈值小于第八预定阈值的第二搜索结果以从属结果展现模式展现;随后,在步骤S3中,提供设备1根据在步骤S6中所确定的展现模式,利用页面技术,如ASP、JSP或PHP等页面技术,将所述第二搜索结果提供给用户设备2,以供用户进行浏览。在此,所述第八预定阈值、第九预定阈值为预置的筛选值阈值,用来根据第二搜索结果的筛选值判断第二搜索结果的展现模式,当第二搜索结果的筛选值大于第八预定阈值时,所述第二搜索结果以主结果展现模式展现;当第二搜索结果的筛选值大于第九预定阈值小于第八预定阈值时,所述第二搜索结果以从属结果展现模式展现。本领域技术人员应能理解上述确定第二搜索结果的展现模式的方式仅为举例,其他现有的或今后可能出现的确定第二搜索结果的展现模式的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本发明根据第二搜索结果的筛选值,确定第二搜索结果的展现模式,根据展现模式将第二搜索结果展现给用户,方便用户浏览。
优选地,所述展现模式包括以下至少任一项:
‑主结果展现模式;
‑从属结果展现模式。
具体地,第二搜索结果的展现模式包括但不限于以主结果展现模式进行展现、以从属结果展现模式进行展现。在此,主结果展现模式例如以结果链接+摘要+URL的形式展现;从属结果展现模式例如只将结果链接以缩进的方式展现。当所述第二搜索结果的展现模式包括以主结果展现模式进行展现,在步骤S3中,提供设备1利用页面技术,如ASP、JSP或PHP等页面技术,将所述第二搜索结果提供给用户设备2,以供用户进行浏览。当所述第二搜索结果的展现模式包括以从属结果展现模式进行展现,在步骤S3中,提供设备1利用页面技术,如ASP、JSP或PHP等页面技术,将所述第二搜索结果通过缩进的展现方式提供给用户设备2,以供用户进行浏览。优选地,在步骤S3中,提供设备1还可以将同一个搜索结果类中的满足不同展现模式的第二搜索结果,按照主结果展现模式与从属结果展现模式,提供给用户设备2,以供用户进行浏览。本领域技术人员应能理解上述展现模式仅为举例,其他现有的或今后可能出现的展现模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

一种用于提供搜索结果的方法与设备.pdf_第1页
第1页 / 共34页
一种用于提供搜索结果的方法与设备.pdf_第2页
第2页 / 共34页
一种用于提供搜索结果的方法与设备.pdf_第3页
第3页 / 共34页
点击查看更多>>
资源描述

《一种用于提供搜索结果的方法与设备.pdf》由会员分享,可在线阅读,更多相关《一种用于提供搜索结果的方法与设备.pdf(34页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102968413 A(43)申请公布日 2013.03.13CN102968413A*CN102968413A*(21)申请号 201110255734.0(22)申请日 2011.08.31G06F 17/30(2006.01)(71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦2层(72)发明人刘利刚(74)专利代理机构北京汉昊知识产权代理事务所(普通合伙) 11370代理人罗朋 周建华(54) 发明名称一种用于提供搜索结果的方法与设备(57) 摘要本发明的目的是提供一种用于提供搜索结果的方法与设备,提供设备获取与用户的查。

2、询序列相对应的第一搜索结果;根据预置的结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;确定所述第一搜索结果的筛选值;根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果;将所述一个或多个第二搜索结果提供给所述用户。与现有技术相比,本发明通过对第一搜索结果进行分类,并基于筛选值从所述第一搜索结果中选取出第二搜索结果,以保证提供给用户的第二搜索结果的多样性,提高了用户获取信息的效率,从而提升了用户的搜索体验。(51)Int.Cl.权利要求书3页 说明书25页 附图5页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书 3 页。

3、 说明书 25 页 附图 5 页1/3页21.一种用于提供搜索结果的方法,其中,该方法包括以下步骤:a获取与用户的查询序列相对应的第一搜索结果;b根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;c将所述一个或多个第二搜索结果提供给所述用户;其中,所述步骤b还包括:-根据所述结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;x确定所述第一搜索结果的筛选值;-根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。2.根据权利要求1所述的方法,其中,所述步骤x还包括:-根据所述第一搜索结果的结果特征信息,基于筛选特。

4、征模型,确定所述筛选值;其中,所述结果特征信息包括以下至少任一项:-所述第一搜索结果与所述查询序列的相关度;-所述第一搜索结果的权威值;-所述第一搜索结果的质量度;-所述第一搜索结果的目录深度。3.根据权利要求2所述的方法,其中,该方法还包括:-根据样本搜索结果的结果特征信息,进行机器学习,以获得所述筛选特征模型。4.根据权利要求2或3所述的方法,其中,所述步骤x还包括:-根据所述第一搜索结果的结果特征信息与辅助特征信息,基于所述筛选特征模型,确定所述筛选值;其中,所述辅助特征信息包括以下至少任一项:-所述第一搜索结果的查询需求匹配度;-所述第一搜索结果的资源有效性;-所述第一搜索结果的时间因。

5、子。5.根据权利要求1至4中任一项所述的方法,其中,所述结果分类规则基于以下至少任一项以获取与所述第一搜索结果相对应的一个或多个第二搜索结果:-所述第一搜索结果的站点信息;-所述第一搜索结果的内容信息;-所述第一搜索结果的主域信息;-所述第一搜索结果的资源信息;-所述第一搜索结果的类型信息。6.根据权利要求5所述的方法,其中,所述步骤b还包括:-根据多个所述结果分类规则,对所述第一搜索结果分别进行处理,以获得与所述多个所述结果分类规则相对应的多组候选第二搜索结果,其中,每组候选第二搜索结果与所述多个结果分类规则中的一个结果分类规则相对应;其中,该方法还包括:权 利 要 求 书CN 102968。

6、413 A2/3页3-根据投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。7.根据权利要求6所述的方法,其中,所述投票筛选规则基于以下至少任一项确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果:-所述候选第二搜索结果的筛选值加权和大于第一预定阈值;-所述候选第二搜索结果的筛选值的平均值大于第二预定阈值;-所述候选第二搜索结果的累计出现次数大于第三预定阈值;-所述候选第二搜索结果的累计出现比例大于第四预定阈值。8.根据权利要求1至7中任一项所述的方法,其中,所述步骤c还包括:-根据所述筛选值,将所述一个或多个第二搜索结果提供给所述用户。

7、。9.根据权利要求1至8中任一项所述的方法,其中,该方法还包括:-根据所述第二搜索结果的筛选值,确定所述第二搜索结果的展现模式;其中,所述步骤c还包括:-根据所述展现模式,将所述第二搜索结果提供给所述用户。10.根据权利要求9所述的方法,其中,所述展现模式包括以下至少任一项:-主结果展现模式;-从属结果展现模式。11.一种用于提供搜索结果的提供设备,其中,该设备包括:第一获取装置,用于获取与用户的查询序列相对应的第一搜索结果;第二获取装置,用于根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;提供装置,用于将所述一个或多个第二搜索结果提供给所述用户;其中,所述第二获。

8、取装置还包括:分类单元,用于根据所述结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;确定单元,用于确定所述第一搜索结果的筛选值;选取单元,用于根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。12.根据权利要求11所述的提供设备,其中,所述确定单元还用于:-根据所述第一搜索结果的结果特征信息,基于筛选特征模型,确定所述筛选值;其中,所述结果特征信息包括以下至少任一项:-所述第一搜索结果与所述查询序列的相关度;-所述第一搜索结果的权威值;-所述第一搜索结果的质量度;-所述第一搜索结果的目录深度。13.根据权利要求12所述的提供设备,其。

9、中,该设备还包括:学习装置,用于根据样本搜索结果的结果特征信息,进行机器学习,以获得所述筛选特征模型。14.根据权利要求12或13所述的提供设备,其中,所述确定单元还用于:权 利 要 求 书CN 102968413 A3/3页4-根据所述第一搜索结果的结果特征信息与辅助特征信息,基于所述筛选特征模型,确定所述筛选值;其中,所述辅助特征信息包括以下至少任一项:-所述第一搜索结果的查询需求匹配度;-所述第一搜索结果的资源有效性;-所述第一搜索结果的时间因子。15.根据权利要求11至14中任一项所述的提供设备,其中,所述结果分类规则基于以下至少任一项以获取与所述第一搜索结果相对应的一个或多个第二搜索。

10、结果:-所述第一搜索结果的站点信息;-所述第一搜索结果的内容信息;-所述第一搜索结果的主域信息;-所述第一搜索结果的资源信息;-所述第一搜索结果的类型信息。16.根据权利要求15所述的提供设备,其中,所述第二获取装置还用于:-根据多个所述结果分类规则,对所述第一搜索结果分别进行处理,以获得与所述多个所述结果分类规则相对应的多组候选第二搜索结果,其中,每组候选第二搜索结果与所述多个结果分类规则中的一个结果分类规则相对应;其中,该设备还包括:第一确定装置,用于根据投票筛选规则,基于所述多组候选第二搜索结果,确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果。17.根据权利要求16所述的提供设。

11、备,其中,所述投票筛选规则基于以下至少任一项确定与所述第一搜索结果相对应的所述一个或多个第二搜索结果:-所述候选第二搜索结果的筛选值加权和大于第一预定阈值;-所述候选第二搜索结果的筛选值的平均值大于第二预定阈值;-所述候选第二搜索结果的累计出现次数大于第三预定阈值;-所述候选第二搜索结果的累计出现比例大于第四预定阈值。18.根据权利要求11至17中任一项所述的提供设备,其中,所述提供装置还用于:-根据所述筛选值,将所述一个或多个第二搜索结果提供给所述用户。19.根据权利要求11至18中任一项所述的提供设备,其中,该设备还包括:第二确定装置,用于根据所述第二搜索结果的筛选值,确定所述第二搜索结果。

12、的展现模式;其中,所述提供装置还用于:-根据所述展现模式,将所述第二搜索结果提供给所述用户。20.根据权利要求19所述的提供设备,其中,所述展现模式包括以下至少任一项:-主结果展现模式;-从属结果展现模式。权 利 要 求 书CN 102968413 A1/25页5一种用于提供搜索结果的方法与设备技术领域0001 本发明涉及互联网搜索领域,尤其涉及一种用于提供搜索结果的技术。背景技术0002 随着搜索技术的突飞猛进,用户对搜索结果的要求也呈现出多样化的趋势,对于同一个查询序列,用户可能需要的是相关的视频信息,也可能是相关的图片信息,或者是相关的新闻信息。现有技术中,针对用户的查询序列,只是根据网。

13、页打分给出普通的查询结果,尤其在搜索引擎返回的第1页的搜索结果中,经常被同站点、同内容或者同类型的结果所充斥,用户需要多次翻页才能找到其想要的搜索结果。0003 因此,如何控制搜索结果中类别的重复,为用户提供更为多样化的搜索结果,提高用户获取信息的效率,从而提升用户的搜索体验,成为本领域技术人员亟需解决的问题之一。发明内容0004 本发明的目的是提供一种用于提供搜索结果的方法与设备。0005 根据本发明的一个方面,提供了一种用于提供搜索结果的方法,其中,该方法包括以下步骤:0006 a获取与用户的查询序列相对应的第一搜索结果;0007 b根据预置的结果分类规则,获取与所述第一搜索结果相对应的一。

14、个或多个第二搜索结果;0008 c将所述一个或多个第二搜索结果提供给所述用户;0009 其中,所述步骤b还包括:0010 -根据所述结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;0011 x确定所述第一搜索结果的筛选值;0012 -根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。0013 根据本发明的另一方面,还提供了一种用于提供搜索结果的提供设备,其中,该设备包括:0014 第一获取装置,用于获取与用户的查询序列相对应的第一搜索结果;0015 第二获取装置,用于根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第。

15、二搜索结果;0016 提供装置,用于将所述一个或多个第二搜索结果提供给所述用户;0017 其中,所述第二获取装置还包括:0018 分类单元,用于根据所述结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索结果类;说 明 书CN 102968413 A2/25页60019 确定单元,用于确定所述第一搜索结果的筛选值;0020 选取单元,用于根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。0021 与现有技术相比,本发明通过对第一搜索结果进行分类,并基于筛选值从所述第一搜索结果中选取出第二搜索结果,以保证提供给用户的第二搜索结果的多样性,提高了用。

16、户获取信息的效率,从而提升了用户的搜索体验。附图说明0022 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:0023 图1示出根据本发明一个方面的用于提供搜索结果的系统拓扑图;0024 图2示出根据本发明一个方面的用于提供搜索结果的设备示意图;0025 图3示出根据本发明一个优选实施例的用于提供搜索结果的设备示意图;0026 图4示出根据本发明另一个方面的用于提供搜索结果的方法流程图;0027 图5示出根据本发明一个优选实施例的用于提供搜索结果的方法流程图。0028 附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式0029 下。

17、面结合附图对本发明作进一步详细描述。0030 图1示出根据本发明一个方面的用于提供搜索结果的系统拓扑图;其中包括提供设备1、与提供设备1经由网络相连接的多个中间设备3以及多个与上述提供设备1或中间设备3经由网络相连接的用户设备2。其中,提供设备1获取与用户设备2或中间设备3提供的用户的查询序列相对应的第一搜索结果;根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;将所述一个或多个第二搜索结果提供给所述用户,从而保证了提供给用户的第二搜索结果的多样性,提高了用户获取信息的效率,并提升了用户的搜索体验。在此,网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无。

18、线自组织网络(Ad Hoc网络)等。0031 另外,提供设备1包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。中间设备3同样包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。而用户设备2包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、掌上电脑PPC或IPTV等。提供设备1与各中间设备3之间的通信相互独。

19、立,包括但不限于基于诸如TCP/IP协议、UDP协议等的分组数据传输。提供设备1与各用户设备2之间的通信相互独立,包括但不限于基于诸如TCP/IP协议、UDP协议等的分组数据传输。中间设备3与各用户设备2之间的通信相互独立,包括但不限于基于诸如TCP/IP协议、UDP协议等的分组数据传输。0032 本领域技术人员应能理解上述提供设备1、用户设备2、中间设备3以及连接其间说 明 书CN 102968413 A3/25页7的网络、通信方式仅为举例,其他现有的或今后可能出现的提供设备、用户设备、中间设备、网络或通信方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0033。

20、 本领域技术人员还应能理解,图1中仅为简明起见而示出的各类网络元素的数量可能小于一个实际网络中的数量,但这种省略无疑地是以不会影响对本发明进行清楚、充分的公开为前提的。0034 为简明起见,下面以一个用户设备2为例进行描述。本领域技术人员应能理解,提供设备1可以同时与多个用户设备2或中间设备3交互,并获取与不同的用户设备2或中间设备3提供的用户的查询序列相对应的第一搜索结果;根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;将所述一个或多个第二搜索结果提供给相应的用户设备2或中间设备3。0035 图2示出根据本发明一个方面的用于提供搜索结果的设备示意图,其中,提供设。

21、备1包括第一获取装置11、第二获取装置12和提供装置13,其中,第二获取装置12包括分类单元121、确定单元122和选取单元123。0036 第一获取装置11获取与用户的查询序列相对应的第一搜索结果。具体地,第一获取装置11例如通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取与用户通过用户设备2输入的查询序列相匹配的第一搜索结果;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取该用户通过用户设备2输入的查询序列,并通过搜索索引信息库匹配查询或实时在线搜索等方式,获取与该查询序列相对应的第一搜索结果;或者,。

22、通过页面技术,如ASP、JSP、PHP等页面技术,从用户设备2获取用户通过该用户设备2输入的查询序列,并通过搜索索引信息库匹配查询或实时在线搜索等方式,获取与该查询序列相对应的第一搜索结果。例如,用户通过与用户设备2的交互方式,如键盘、鼠标、遥控器、触摸板、手写设备或语音输入设备,在浏览器软件、应用程序或客户端软件等的输入框中输入查询序列;搜索引擎通过JSP等页面技术获取到用户输入的查询序列,基于用户输入的查询序列进行匹配查询,获得与所述查询序列相匹配的第一搜索结果;第一获取装置11通过调用该搜索引擎所提供的应用程序接口,从该搜索引擎中获取到所述第一搜索结果。例如,当用户通过与用户设备2的交互。

23、,输入查询序列“鲜花朵朵”时,搜索引擎基于所述查询序列进行匹配查询,获得多个关于“鲜花朵朵”的第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵视频豆单合集土豆网”等;第一获取装置11通过与该搜索引擎的交互,获取上述第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵视频豆单合集土豆网”等。本领域技术人员应能理解上述获取第一搜索结果的方式仅为举例,其他现有的或今后可能出现的获取第一搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0037 第二获取装置12根据预置的结果分类规则,获取与所述第一搜索结果相。

24、对应的一个或多个第二搜索结果。具体地,第二获取装置12根据预置的结果分类规则,对第一获取装置11所获取的第一搜索结果进行分类,以得到一个或多个搜索结果类,再根据第一搜索结果的筛选值,例如通过选取筛选值满足阈值的第一搜索结果、从根据筛选值排序后的第一搜索结果中选取前K个第一搜索结果等方式,从该一个或多个搜索结果类中选取一个说 明 书CN 102968413 A4/25页8或多个第一搜索结果,以作为第二搜索结果。在此,K为预置的选取数量阈值。接上例,当用户通过与用户设备2的交互,输入查询序列“鲜花朵朵”时,搜索引擎基于所述查询序列进行匹配查询,获得多个关于“鲜花朵朵”的第一搜索结果“鲜花朵朵在线高。

25、清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵1视频优酷视频在线观看”、“鲜花朵朵视频豆单合集土豆网”等;第一获取装置11通过与该搜索引擎的交互,获取上述第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”、“鲜花朵朵1视频优酷视频在线观看”、“鲜花朵朵视频豆单合集土豆网”等;第二获取装置12根据预置的分类规则,例如根据第一搜索结果的站点信息进行分类,将上述第一搜索结果进行分类,分为三个搜索结果类,第一个搜索结果类包括第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵1视频优酷视频在线观看”等具有相同或相似站点的第一搜索结果,第二个搜索结果类包括第一搜索结果“鲜花朵朵百。

26、度百科”等具有相同或相似站点的第一搜索结果,第三个搜索结果类包括“鲜花朵朵视频豆单合集土豆网”等第一搜索结果,随后,第二获取装置12再根据上述第一搜索结果的筛选值,从上述三个搜索结果类中选取出第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”和“鲜花朵朵视频豆单合集土豆网”,以作为与所述第一搜索结果相对应的一个或多个第二搜索结果。在此,第二获取装置12可以按照一种结果分类规则对所述第一搜索结果进行分类,也可以按照多种结果分类规则对所述第一搜索结果进行分类。结果分类规则包括但不限于基于第一搜索结果的站点信息进行分类、基于第一搜索结果的内容信息进行分类、基于第一搜索结果的主域信息进。

27、行分类、基于第一搜索结果的资源信息进行分类、基于第一搜索结果的类型信息进行分类等。本领域技术人员应能理解上述获取第二搜索结果的方式仅为举例,其他现有的或今后可能出现的获取第二搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员还应能理解上述结果分类规则仅为举例,其他现有的或今后可能出现的结果分类规则如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0038 具体地,第二获取装置12包括分类单元121、确定单元122和选取单元123,其中,分类单元121根据所述结果分类规则,对所述第一搜索结果进行分类,以获得一个或多个搜索。

28、结果类;确定单元122确定所述第一搜索结果的筛选值;选取单元123根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。0039 其中,第二获取装置中的分类单元121根据结果分类规则,对第一获取装置11所获取的第一搜索结果进行分类,以获得一个或多个搜索结果类。具体地,分类单元121根据结果分类规则,如基于第一搜索结果的站点信息、内容信息、主域信息、资源信息、类型信息等的结果分类规则,将第一获取装置11所获取的一个或多个第一搜索结果进行分类,以获得一个或多个搜索结果类。例如,针对第一获取装置11所获取的第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百。

29、度百科”、“鲜花朵朵1视频优酷视频在线观看”、“鲜花朵朵视频豆单合集土豆网”等;分类单元121根据预置的分类规则,例如根据第一搜索结果的站点信息进行分类,将上述第一搜索结果进行分类,分为三个搜索结果类,第一个搜索结果类包括第一搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵1视频优酷视频在线观看”等具有相同或相似站点的第一搜索结果,第二个搜索结果类包括第一搜索结果“鲜花朵朵百度百科”等具有相同或相似站点的第一搜索结果,第三个搜索结果类包括“鲜花朵说 明 书CN 102968413 A5/25页9朵视频豆单合集土豆网”等第一搜索结果。本领域技术人员应能理解上述对第一搜索结果分类的方式仅为举例。

30、,其他现有的或今后可能出现的对第一搜索结果分类的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0040 确定单元122确定所述第一搜索结果的筛选值。具体地,确定单元122确定所述第一搜索结果的筛选值的方式包括但不限于:1)通过实时计算,确定所述第一搜索结果的筛选值;2)通过与搜索信息库的交互,获取所述第一搜索结果的筛选值;3)根据所述第一搜索结果的结果特征信息,如所述第一搜索结果的权威值或目录深度,基于筛选特征模型,确定所述筛选值;4)根据所述第一搜索结果的结果特征信息与辅助特征信息,基于所述筛选特征模型,确定所述筛选值。例如,确定单元122根据第一获取装置11。

31、所获取的第一搜索结果,通过与搜索信息库的交互,在所述搜索信息库中进行匹配查询,获得所述第一搜索结果的筛选值。在此,所述搜索信息库中存储有第一搜索结果的筛选值,该搜索信息库可以位于提供设备1中,也可以位于与提供设备1通过网络连接的第三方设备中。又如,假设所述第一搜索结果的结果特征信息为所述第一搜索结果的目录深度,确定单元122根据所述第一搜索结果的目录深度,基于筛选特征模型,如目录深度阈值,确定所述第一搜索结果的筛选值,如当所述第一搜索结果的目录深度小于该筛选特征模型中的目录深度阈值时,则确定所述第一搜索结果的筛选值为1;否则,所述第一搜索结果的筛选值为0。优选地,当包括多个结果特征信息时,确定。

32、单元122首先根据这多个结果特征信息,分别确定所述第一搜索结果与这多个结果特征信息所对应的多个候选筛选值,再根据这各个结果特征信息所对应的权值,对这多个候选筛选值进行加权计算,得出所述第一搜索结果的筛选值。本领域技术人员应能理解上述确定第一搜索结果的筛选值的方式仅为举例,其他现有的或今后可能出现的确定第一搜索结果的筛选值的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,本领域技术人员应能理解,分类单元所执行的操作与确定单元所执行的操作并无严格的先后顺序关系,两者或并行或串行,当两者并行执行时,两者部分并行或全部并行;当两者串行执行时,前者先于后者执行,或前者。

33、后于后者执行。0041 选取单元123根据所述第一搜索结果的筛选值,从所述一个或多个搜索结果类中选取所述一个或多个第二搜索结果。在此,选取单元123从所述一个或多个搜索结果类中选取一个或多个第二搜索结果的方式包括但不限于:1)根据第一搜索结果的筛选值,分别从所述一个或多个搜索结果类中选取筛选值大于第五预定阈值的第一搜索结果,以作为第二搜索结果,其中,所述第五预定阈值为预置的筛选值阈值,用于根据第一搜索结果的筛选值判断是否应为第二搜索结果;2)对于所述一个或多个搜索结果类中的每一个搜索结果类,将该搜索结果类中的第一搜索结果按照筛选值的大小进行排序,如筛选值越大则排序位置越靠前,再从该排序后的第一。

34、搜索结果中选取前K个第一搜索结果,以作为第二搜索结果,其中,K为预置的选取数量阈值。以经分类单元121分类得到的其中一个搜索结果类为例,假设该搜索结果类包括第一搜索结果“鲜花朵朵百度百科”、“鲜花朵朵在线高清观看奇艺-百度旗下视频网站”、“鲜花朵朵专辑百度视频”等具有相同或相似站点的第一搜索结果;确定单元122根据与搜索信息库的交互,获取到上述第一搜索结果的筛选值分别为8、8.5、7.5;选取单元123再根据上述筛选值,选取筛选值满足第五预定阈值的第一搜索结果,如当第五预定阈值为8,选取单元123选取出第一搜索结果“鲜花朵朵百度百科”、“鲜花说 明 书CN 102968413 A6/25页10。

35、朵朵在线高清观看奇艺-百度旗下视频网站”,或者,选取单元123根据第一搜索结果的筛选值大小将所述第一搜索结果进行排序,如筛选值越大则排序优先级越高,则上述第一搜索结果按照“鲜花朵朵在线高清观看奇艺-百度旗下视频网站”、“鲜花朵朵百度百科”、“鲜花朵朵专辑百度视频”的顺序进行排序,随后,选取单元123再从上述排序后的第一搜索结果中选取前两个第一搜索结果,以作为第二搜索结果。优选地,选取单元123还可以根据所述第二搜索结果的数量,调整上述第五预定阈值或K的取值,再根据所述第一搜索结果的筛选值,结合调整后的所述第五预定阈值或K的取值,选取所述一个或多个第二搜索结果。例如,当第二搜索结果的数量小于第六。

36、预定阈值时,降低所述第五预定阈值或提高所述K的取值,以提高提供给用户的第二搜索结果的数量;当第二搜索结果的数量大于第七预定阈值时,提高所述第五预定阈值或降低所述K的取值,以减少提供给用户的第二搜索结果的数量。在此,第六预定阈值、第七预定阈值为预置的数量阈值,用来判断是否调整提供给用户的第二搜索结果的数量,当该数量低于第六预定阈值时,降低所述第五预定阈值或提高所述K的取值,以提高提供给用户的第二搜索结果的数量;当该数量高于第七预定阈值时,提高所述第五预定阈值或降低所述K的取值,以减少提供给用户的第二搜索结果的数量。本领域技术人员应能理解上述选取第二搜索结果的方式仅为举例,其他现有的或今后可能出现。

37、的选取第二搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0042 提供装置13将所述一个或多个第二搜索结果提供给所述用户。具体地,提供装置13根据第二获取装置12所获取的一个或多个第二搜索结果,采用任何已知的计算机提供人可读信息的技术手段,例如屏幕显示、扬声器播放等,将所述一个或多个第二搜索结果提供给所述用户。以屏幕显示为例,提供装置13将第二获取装置12所获取的一个或多个第二搜索结果,利用页面技术,如ASP、JSP或PHP等页面技术,随机或按一定顺序和格式,如URL+摘要的形式,提供给用户设备2,供用户进行浏览。接上例,假设第二获取装置12根据上述第。

38、一搜索结果的筛选值,选取出第二搜索结果“鲜花朵朵在线高清观看优酷视频”、“鲜花朵朵百度百科”和“鲜花朵朵视频豆单合集土豆网”;随后,提供装置13利用页面技术,如ASP、JSP或PHP等,将上述第二搜索结果提供给用户设备2,供用户进行浏览。优选地,提供装置13还可以根据第二搜索结果的筛选值,确定所述第二搜索结果的优先级,按照该优先级,将所述一个或多个第二搜索结果提供给所述用户。更优选地,提供装置13还可以根据由第二搜索结果的筛选值所确定的展现模式,如主结果展现模式、从属结果展现模式等,将所述第二搜索结果按照上述展现模式提供给所述用户。本领域技术人员应能理解上述提供第二搜索结果的方式仅为举例,其他。

39、现有的或今后可能出现的提供第二搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。0043 优选地,提供设备1的各个装置之间是持续不断工作的。具体地,第一获取装置11获取与用户的查询序列相对应的第一搜索结果;第二获取装置12根据预置的结果分类规则,获取与所述第一搜索结果相对应的一个或多个第二搜索结果;提供装置13将所述一个或多个第二搜索结果提供给所述用户。在此,本领域技术人员应理解“持续”是指提供设备1的各装置分别按照设定的或实时调整的工作模式要求进行第一搜索结果的获取、第二搜索结果的获取与提供,直至第一获取装置11在较长时间内停止获取与用户的查询序列相对应的第一搜索结果。更优选地,第二获取装置12中的各个单元之间也是持续不断工作说 明 书CN 102968413 A10。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1