一种基于长尾关键词的搜索推荐方法及装置.pdf

上传人:1** 文档编号:4443701 上传时间:2018-10-02 格式:PDF 页数:17 大小:1.30MB
返回 下载 相关 举报
一种基于长尾关键词的搜索推荐方法及装置.pdf_第1页
第1页 / 共17页
一种基于长尾关键词的搜索推荐方法及装置.pdf_第2页
第2页 / 共17页
一种基于长尾关键词的搜索推荐方法及装置.pdf_第3页
第3页 / 共17页
点击查看更多>>
资源描述

《一种基于长尾关键词的搜索推荐方法及装置.pdf》由会员分享,可在线阅读,更多相关《一种基于长尾关键词的搜索推荐方法及装置.pdf(17页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 104021214 A (43)申请公布日 2014.09.03 C N 1 0 4 0 2 1 2 1 4 A (21)申请号 201410281334.0 (22)申请日 2014.06.20 G06F 17/30(2006.01) (71)申请人北京奇虎科技有限公司 地址 100088 北京市西城区新街口外大街 28号D座112室(德胜园区) 申请人奇智软件(北京)有限公司 (72)发明人崔代超 (74)专利代理机构北京华沛德权律师事务所 11302 代理人刘杰 (54) 发明名称 一种基于长尾关键词的搜索推荐方法及装置 (57) 摘要 本发明公开了一种基于长尾。

2、关键词的搜索推 荐方法及装置。该方法包括:接收用户搜索查询 词,判断查询词的类型是否为长尾关键词;当查 询词的类型为长尾关键词时,查找与其相匹配的 有互动性质的网站作为可解决长尾关键词问题的 网站优先向用户推荐。本发明当接收到用户搜索 的查询词的类型为长尾关键词时,查找与其相匹 配的有互动性质的网站作为可解决长尾关键词问 题的网站优先向用户推荐,从而将用户引导到最 有可能解决用户问题的网站,解决了当搜索词为 长尾关键词时,无法获取与该长尾关键词相匹配 的网站的问题,取得了提高用户搜索效率,满足用 户的搜索需求的有益效果。 (51)Int.Cl. 权利要求书2页 说明书11页 附图3页 (19)。

3、中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书11页 附图3页 (10)申请公布号 CN 104021214 A CN 104021214 A 1/2页 2 1.一种基于长尾关键词的搜索推荐方法,包括: 接收用户搜索查询词,判断所述查询词的类型是否为长尾关键词; 当所述查询词的类型为长尾关键词时,查找与其相匹配的有互动性质的网站作为可解 决长尾关键词问题的网站优先向用户推荐。 2.如权利要求1所述的方法,所述判断所述查询词的类型是否为长尾关键词包括:对 所述查询词进行分词处理,在判断出所述查询词由至少2个单词组成,且所述查询词在一 段时间阈值内的搜索次数低于设定次数。

4、阈值的情况下,确定所述查询词为长尾关键词; 或者,如果搜索查询词索引的通用搜索结果匹配程度低于匹配阈值,则确定所述查询 词为长尾关键词。 3.如权利要求1-2中任一项所述的方法,所述查找与其相匹配的有互动性质的网站作 为可解决长尾关键词问题的网站优先向用户推荐,包括:根据分词后各个分词的搜索热度 判断所述各个分词的权重,将权重最高的分词作为核心分词,其他分词作为支持词;查找与 所述核心分词相匹配的有互动性质的网站作为可解决所述长尾关键词问题的网站优先向 用户推荐。 4.如权利要求1-3中任一项所述的方法,所述查找与所述核心分词相匹配的有互动性 质的网站作为可解决所述长尾关键词问题的网站优先向用。

5、户推荐,包括:在综合性问答知 识类网站、垂直领域的网站和综合性经验分享类网站中,分别查找与所述核心分词相匹配 的有互动性质的网站,并将查找到的网站作为可解决所述长尾关键词问题的网站优先向用 户推荐。 5.如权利要求1-4中任一项所述的方法,所述相匹配包括下述中的至少一个: 所述关键词在所述有互动性质的网站和/或所述有互动性质的网站的网页中出现的 次数等于或者大于设定次数阈值; 包含有解决过有关关键词和/或其同义词、相关词问题的网页的所述有互动性质的网 站的搜索热度等于或者大于设定搜索热度阈值; 解决过有关关键词和/或其同义词、相关词问题的所述有互动性质的网站的网页的搜 索热度等于或者大于设定搜。

6、索热度阈值; 单个有互动性质的网站中的解决过有关关键词和/或其同义词、相关词问题的网页的 个数等于或者大于设定个数阈值。 6.如权利要求1-5中任一项所述的方法,所述有互动性质的网站,包括:社交网站、互 动社区、论坛、攻略/经验分享网站或贴吧。 7.一种基于长尾关键词的搜索推荐方法,包括: 接收用户输入的搜索查询词, 当所述查询词为长尾关键词时,推荐与其相关的互动性质的网站。 8.一种基于长尾关键词的搜索推荐装置,包括: 判断模块,用于接收用户搜索查询词,判断所述查询词的类型是否为长尾关键词; 网站推荐模块,用于当所述判断模块的判断结果为是时,查找与其相匹配的有互动性 质的网站作为可解决长尾关。

7、键词问题的网站优先向用户推荐。 9.如权利要求8所述的装置,所述判断模块,包括: 分词单元,用于接收用户搜索查询词,对所述查询词进行分词处理; 权 利 要 求 书CN 104021214 A 2/2页 3 第一判断执行单元,用于判断所述查询词是否由至少2个单词组成,且所述查询词是 否在一段时间阈值内的搜索次数低于设定次数阈值;若是,确定所述查询词为长尾关键 词; 或,所述判断模块,包括: 分词单元,用于接收用户搜索查询词,对所述查询词进行分词处理; 第二判断执行单元,用于判断根据搜索查询词索引的通用搜索结果匹配程度是否低于 匹配阈值;若是,确定所述查询词为长尾关键词。 10.一种基于长尾关键词。

8、的搜索推荐装置,包括: 搜索输入框,用于用户输入搜索查询词; 显示模块,用于当所述查询词为长尾关键词时,显示推荐的与其相关的互动性质的网 站。 权 利 要 求 书CN 104021214 A 1/11页 4 一种基于长尾关键词的搜索推荐方法及装置 技术领域 0001 本发明涉及索引,具体涉及一种基于长尾关键词的搜索推荐方法及装置。 背景技术 0002 搜索引擎是当前互联网领域中的一项极其重要的应用,而基于分词索引的检索技 术是目前主流搜索引擎的基本支柱。目前,搜索引擎主要是根据网页和搜索查询词的匹配 程度给出匹配度最高的网页。但是,通过对海量用户的查询词统计分析,发现用户经常通过 长尾关键词作。

9、为搜索查询词进行索引查询,但是现有技术中搜索引擎往往只是对长尾关键 词做一般的分词处理做索引,但分词处理后在搜索数据库中都没有索引到与查询的长尾关 键词匹配度很高的网页,同时用户输入的长尾关键词本身通常包含很明确的搜索需求,因 此这时搜索引擎给出的搜索结果无法较好的满足用户的搜索需求;进一步地,用户可能需 要花费更多的时间和精力在搜索结果网页中查找,亦或是重新调整查询词再次检索,导致 搜索效率低下。 发明内容 0003 鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上 述问题的。 0004 本发明提供的基于长尾关键词的搜索推荐方法,包括: 0005 接收用户搜索查询词,判。

10、断所述查询词的类型是否为长尾关键词; 0006 当所述查询词的类型为长尾关键词时,查找与其相匹配的有互动性质的网站作为 可解决长尾关键词问题的网站优先向用户推荐。 0007 所述判断所述查询词的类型是否为长尾关键词包括:对所述查询词进行分词处 理,在判断出所述查询词由至少2个单词组成,且所述查询词在一段时间阈值内的搜索次 数低于设定次数阈值的情况下,确定所述查询词为长尾关键词; 0008 或者,如果搜索查询词索引的通用搜索结果匹配程度低于匹配阈值,则确定所述 查询词为长尾关键词。 0009 所述查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优 先向用户推荐,包括:根据分词后各个。

11、分词的搜索热度判断所述各个分词的权重,将权重最 高的分词作为核心分词,其他分词作为支持词;查找与所述核心分词相匹配的有互动性质 的网站作为可解决所述长尾关键词问题的网站优先向用户推荐。 0010 所述查找与所述核心分词相匹配的有互动性质的网站作为可解决所述长尾关键 词问题的网站优先向用户推荐,包括:在综合性问答知识类网站、垂直领域的网站和综合性 经验分享类网站中,分别查找与所述核心分词相匹配的有互动性质的网站,并将查找到的 网站作为可解决所述长尾关键词问题的网站优先向用户推荐。 0011 所述相匹配包括下述中的至少一个: 0012 所述关键词在所述有互动性质的网站和/或所述有互动性质的网站的网。

12、页中出 说 明 书CN 104021214 A 2/11页 5 现的次数等于或者大于设定次数阈值; 0013 包含有解决过有关关键词和/或其同义词、相关词问题的网页的所述有互动性质 的网站的搜索热度等于或者大于设定搜索热度阈值; 0014 解决过有关关键词和/或其同义词、相关词问题的所述有互动性质的网站的网页 的搜索热度等于或者大于设定搜索热度阈值; 0015 单个有互动性质的网站中的解决过有关关键词和/或其同义词、相关词问题的网 页的个数等于或者大于设定个数阈值。 0016 所述有互动性质的网站,包括:社交网站、互动社区、论坛、攻略/经验分享网站或 贴吧。 0017 本发明提供的基于长尾关键。

13、词的搜索推荐方法,包括: 0018 接收用户输入的搜索查询词, 0019 当所述查询词为长尾关键词时,推荐与其相关的互动性质的网站。 0020 本发明提供的基于长尾关键词的搜索推荐装置,包括: 0021 判断模块,用于接收用户搜索查询词,判断所述查询词的类型是否为长尾关键 词; 0022 网站推荐模块,用于当所述判断模块的判断结果为是时,查找与其相匹配的有互 动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。 0023 所述判断模块,包括: 0024 分词单元,用于接收用户搜索查询词,对所述查询词进行分词处理; 0025 第一判断执行单元,用于判断所述查询词是否由至少2个单词组成,且所。

14、述查询 词是否在一段时间阈值内的搜索次数低于设定次数阈值;若是,确定所述查询词为长尾关 键词; 0026 或,所述判断模块,包括: 0027 分词单元,用于接收用户搜索查询词,对所述查询词进行分词处理; 0028 第二判断执行单元,用于判断根据搜索查询词索引的通用搜索结果匹配程度是否 低于匹配阈值;若是,确定所述查询词为长尾关键词。 0029 所述网站推荐模块,包括: 0030 判断分析单元,用于当所述判断执行单元的判断结果为是时,根据分词后各个分 词的搜索热度判断所述各个分词的权重,将权重最高的分词作为核心分词,其他分词作为 支持词; 0031 网站推荐执行单元,用于查找与所述核心分词相匹配。

15、的有互动性质的网站作为可 解决所述长尾关键词问题的网站优先向用户推荐。 0032 所述网站推荐执行单元,具体用于在综合性问答知识类网站、垂直领域的网站和 综合性经验分享类网站中,分别查找与所述核心分词相匹配的有互动性质的网站作为可解 决所述长尾关键词问题的网站优先向用户推荐。 0033 所述相匹配包括下述中的至少一个: 0034 所述关键词在所述有互动性质的网站和/或所述有互动性质的网站的网页中出 现的次数等于或者大于设定次数阈值; 0035 包含有解决过有关关键词和/或其同义词、相关词问题的网页的所述有互动性质 说 明 书CN 104021214 A 3/11页 6 的网站的搜索热度等于或者。

16、大于设定搜索热度阈值; 0036 解决过有关关键词和/或其同义词、相关词问题的所述有互动性质的网站的网页 的搜索热度等于或者大于设定搜索热度阈值; 0037 单个有互动性质的网站中的解决过有关关键词和/或其同义词、相关词问题的网 页的个数等于或者大于设定个数阈值。 0038 所述有互动性质的网站,包括:社交网站、互动社区、论坛、攻略/经验分享网站或 贴吧。 0039 本发明提供的基于长尾关键词的搜索推荐装置,包括: 0040 搜索输入框,用于用户输入搜索查询词; 0041 显示模块,用于当所述查询词为长尾关键词时,显示推荐的与其相关的互动性质 的网站。 0042 本发明的基于长尾关键词的搜索推。

17、荐方法及装置,当接收到用户搜索的查询词的 类型为长尾关键词时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的 网站优先向用户推荐,从而将用户引导到最有可能解决用户问题的网站,解决了当搜索词 为长尾关键词时,无法获取与该长尾关键词相匹配的网站的问题,取得了满足用户的搜索 需求的有益效果。 0043 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段, 而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够 更明显易懂,以下特举本发明的具体实施方式。 附图说明 0044 通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通 技。

18、术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明 的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中: 0045 图1示出了本发明实施例提供的一种基于长尾关键词的搜索推荐方法的流程图; 0046 图2示出了本发明实施例提供的另一种基于长尾关键词的搜索推荐方法的流程 图; 0047 图3示出了本发明实施例提供的一种基于长尾关键词的搜索推荐装置的结构框 图; 0048 图4示出了通过本发明实施例提供的一种基于长尾关键词的搜索推荐装置进行 基于长尾关键词的搜索推荐的网页截图; 0049 图5示出了本发明实施例提供的另一种基于长尾关键词的搜索推荐装置的结构 。

19、框图。 具体实施方式 0050 下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开 的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例 所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围 完整的传达给本领域的技术人员。 说 明 书CN 104021214 A 4/11页 7 0051 参见图1,本发明实施例提供了基于长尾关键词的搜索推荐方法,包括: 0052 步骤S110:接收用户搜索查询词,判断查询词的类型是否为长尾关键词; 0053 本实施例可以在接收到用户搜索查询词之后,先根据查询词在网站库中进行索 引,若无与。

20、查询词相匹配的网站,再判断查询词的类型是否为长尾关键词。 0054 本发明实施例提供两种判断查询词的类型是否为长尾关键词的方法: 0055 第一种方法为:对用户输入的查询词进行分词处理,在判断出查询词由至少2个 单词组成,且查询词在一段时间阈值内的搜索次数低于设定次数阈值的情况下,确定查询 词为长尾关键词;否则,确定查询词不是长尾关键词。其中,时间阈值和设定次数阈值由具 体需求而定,本发明实施例对此不进行具体的限制。 0056 第二种方法为:如果搜索查询词索引的通用搜索结果匹配程度低于匹配阈值,则 确定查询词为长尾关键词;否则,确定查询词不是长尾关键词。其中,匹配阈值由具体需求 而定,本发明实。

21、施例对此不进行具体的限制。 0057 步骤S210:当查询词的类型为长尾关键词时,查找与其相匹配的有互动性质的网 站作为可解决长尾关键词问题的网站优先向用户推荐。 0058 其中,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优 先向用户推荐,具体包括:根据分词后各个分词的搜索热度判断各个分词的权重,将权重 最高的分词作为核心分词,其他分词作为支持词;查找与核心分词相匹配的有互动性质的 网站作为可解决长尾关键词问题的网站优先向用户推荐。其中,查找与核心分词相匹配的 有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐,包括:在综合性问 答知识类网站、垂直领域的网站和综合。

22、性经验分享类网站中,分别查找与核心分词相匹配 的有互动性质的网站,并将查找到的网站作为可解决长尾关键词问题的网站优先向用户推 荐,因此本发明实施例能够向用户优先推荐上述三类网站中的至少一类,用户可以从有互 动性质的网站中查找到其所需的内容。若在被推荐出的网站中,仍然没有用户所需的内容, 用户还可以在被推荐的有互动性质的网站中以提问的方式,将自己感兴趣的问题向公众提 出,等待其他用户解答,从而在有互动性质的网站中,得到自己所需的与长尾关键词有关的 答案。其中,综合性问答知识类网站可以包括:360问答、百度知道、搜狗知识、或SOSO问问 等;垂直领域的网站可以包括:游侠网、游戏官网论坛、或大众点评。

23、网等;综合性经验分享 类网站可以包括豆瓣网、或百度贴吧等。 0059 需要说明的是,在本发明实施例中,查询词、关键词与网站相匹配包括下述中的至 少一个: 0060 若查询词、关键词在有互动性质的网站和/或有互动性质的网站的网页中出现的 次数等于或者大于设定次数阈值,则说明查询词、关键词与网站相匹配;其中,设定次数阈 值由具体需求而定,本发明实施例对此不进行具体的限制。 0061 若包含有解决过有关查询词、关键词和/或其同义词、相关词问题的网页的有互 动性质的网站的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站 相匹配;其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进。

24、行具体的限制。 0062 若解决过有关查询词、关键词和/或其同义词、相关词问题的有互动性质的网站 的网页的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站相匹配; 其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。 说 明 书CN 104021214 A 5/11页 8 0063 若单个有互动性质的网站中的解决过有关查询词、关键词和/或其同义词、相关 词问题的网页的个数等于或者大于设定个数阈值,则说明查询词、关键词与网站相匹配;其 中,设定个数阈值由具体需求而定,本发明实施例对此不进行具体的限制。 0064 在本发明实施例中,有互动性质的网站,包括:社交网。

25、站、互动社区、论坛、攻略/ 经验分享网站或贴吧等。 0065 参见图2,本发明实施例还提供了另一种基于长尾关键词的搜索推荐方法,包括: 0066 步骤S101:接收用户输入的搜索查询词; 0067 步骤S201:当查询词为长尾关键词时,优先推荐与其相关的互动性质的网站。 0068 其中,当查询词为长尾关键词时,优先推荐与其相关的互动性质的网站,包括: 0069 当查询词为长尾关键词时,由于长尾关键词通常表达出用户非常明确具体的搜索 需求,比如具体的问题,这样的问题通常在互动性质的网站中会有最相近的答案或相关内 容,比如论坛某个帖子中有提到。这样的话,互动性质的网站包括:综合性问答知识类网站、 。

26、垂直领域的网站,和/或综合性经验分享类网站。本实施例中,从而在综合性问答知识类 网站、垂直领域的网站和综合性经验分享类网站中,分别查找与长尾关键词的核心分词相 匹配的有互动性质的网站,并将查找到的网站作为可解决长尾关键词问题的网站优先向用 户推荐,因此本发明实施例优先向用户推荐的互动性质网站包括上述三类网站中的至少一 类,用户可以从有互动性质的网站中查找到其所需的内容。若在被推荐出的网站中,仍然没 有用户所需的内容,用户还可以在被推荐的有互动性质的网站中以提问的方式,将自己感 兴趣的问题向公众提出,等待其他用户解答,从而在有互动性质的网站中,得到自己所需的 与长尾关键词有关的答案。其中,综合性。

27、问答知识类网站可以包括:360问答、百度知道、搜 狗知识、或SOSO问问等;垂直领域的网站可以包括:游侠网、游戏官网论坛、或大众点评网 等;综合性经验分享类网站可以包括豆瓣网、或百度贴吧等。 0070 需要说明的是,在本发明实施例中,查询词、关键词与网站相匹配包括下述中的至 少一个: 0071 若查询词、关键词在有互动性质的网站和/或有互动性质的网站的网页中出现的 次数等于或者大于设定次数阈值,则说明查询词、关键词与网站相匹配;其中,设定次数阈 值由具体需求而定,本发明实施例对此不进行具体的限制。 0072 若包含有解决过有关查询词、关键词和/或其同义词、相关词问题的网页的有互 动性质的网站的。

28、搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站 相匹配;其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。 0073 若解决过有关查询词、关键词和/或其同义词、相关词问题的有互动性质的网站 的网页的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站相匹配; 其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。 0074 若单个有互动性质的网站中的解决过有关查询词、关键词和/或其同义词、相关 词问题的网页的个数等于或者大于设定个数阈值,则说明查询词、关键词与网站相匹配;其 中,设定个数阈值由具体需求而定,本发明实施例对此不。

29、进行具体的限制。 0075 在本发明实施例中,有互动性质的网站,包括:社交网站、互动社区、论坛、攻略/ 经验分享网站或贴吧等。 0076 参见图3,本发明实施例还提供了一种基于长尾关键词的搜索推荐装置,包括: 说 明 书CN 104021214 A 6/11页 9 0077 判断模块100,用于接收用户搜索查询词,判断查询词的类型是否为长尾关键词; 0078 在本发明实施例中,判断模块100,包括: 0079 分词单元110,用于接收用户搜索查询词,对查询词进行分词处理; 0080 第一判断执行单元120,用于判断查询词是否由至少2个单词组成,且查询词是否 在一段时间阈值内的搜索次数低于设定次。

30、数阈值;若是,确定查询词为长尾关键词;否则, 确定查询词不是长尾关键词。时间阈值和设定次数阈值由具体需求而定,本发明实施例对 此不进行具体的限制。 0081 或,判断模块100,包括: 0082 分词单元110,用于接收用户搜索查询词,对查询词进行分词处理; 0083 第二判断执行单元130,用于判断根据搜索查询词索引的通用搜索结果匹配程度 是否低于匹配阈值;若是,确定查询词为长尾关键词。否则,确定查询词不是长尾关键词。 其中,匹配阈值由具体需求而定,本发明实施例对此不进行具体的限制。 0084 这里需要说明的是,第一判断执行单元120和第二判断执行单元130不仅仅是或 的关系,它们也可以是和。

31、的关系,即在判断模块100中,先通过分词单元110对用户输入的 查询词进行分词处理,接下来既通过第一判断执行单元120对查询词进行判断,又通过第 二判断执行单元130对查询词进行判断。 0085 网站推荐模块200,用于当判断模块100的判断结果为查询词是长尾关键词时,查 找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。 0086 具体地,网站推荐模块200,包括: 0087 判断分析单元210,用于当判断执行单元的判断结果为查询词是长尾关键词时,根 据分词后各个分词的搜索热度判断各个分词的权重,将权重最高的分词作为核心分词,其 他分词作为支持词; 0088 网站推。

32、荐执行单元220,用于查找与核心分词相匹配的有互动性质的网站作为可 解决长尾关键词问题的网站优先向用户推荐; 0089 其中,网站推荐执行单元220,具体用于在综合性问答知识类网站、垂直领域的网 站和综合性经验分享类网站中,分别查找与核心分词相匹配的有互动性质的网站作为可解 决长尾关键词问题的网站优先向用户推荐。 0090 因此本发明实施例能够向用户优先推荐上述三类网站中的至少一类,用户可以从 有互动性质的网站中查找到其所需的内容。若在被推荐出的网站中,仍然没有用户所需的 内容,用户还可以在被推荐的有互动性质的网站中以提问的方式,将自己感兴趣的问题向 公众提出,等待其他用户解答,从而在有互动性。

33、质的网站中,得到自己所需的与长尾关键 词有关的答案。其中,综合性问答知识类网站可以包括:360问答、百度知道、搜狗知识、或 SOSO问问等;垂直领域的网站可以包括:游侠网、游戏官网论坛、或大众点评网等;综合性 经验分享类网站可以包括豆瓣网、或百度贴吧等。 0091 这里需要说明的是,在本发明实施例中,还包括:第一搜索引擎、第二搜索引擎、第 一网站库和第二网站库;第一搜索引擎用于第一网站库的索引,第二搜索引擎用于第二网 站库的索引;其中,第一网站库为所有网站的集合;第二网站库为有互动性质的网站的集 合。当分词单元110对查询词进行分词处理后,由判断执行单元对查询词进行长尾关键词 的判断;再由第一。

34、搜索引擎在第一网站库中进行索引,将索引到的网站推荐给用户,但该网 说 明 书CN 104021214 A 7/11页 10 站与查询的长尾关键词的匹配程度并不高,往往并不是用户想得到的内容,此时用户往往 需要重新调整查询词再次检索,无法满足用户的索引需求;因此,与此同时,由判断分析单 元210确定核心分词,由网站推荐执行单元220利用第二搜索引擎在第二网站库中进行索 引,将索引到的互动性质的网站推荐给用户,用户可以在被推荐出的有互动性质的网站中 查找自己感兴趣的内容,从而更容易得到自己想要的内容。 0092 由此可见,在本发明实施例中,网站推荐执行单元220,具体用于通过第二搜索引 擎在第二网。

35、站库中,查找与核心分词相匹配的有互动性质的网站作为可解决长尾关键词问 题的网站优先向用户推荐。其中,第二网站库可以包括综合性问答知识类网站、垂直领域的 网站和综合性经验分享类网站这3类有互动性质的网站,但不仅限于这3类有互动性质的 网站,本发明实施例对此不进行具体地限制。 0093 需要说明的是,在本发明实施例中,查询词、关键词与网站相匹配包括下述中的至 少一个: 0094 若查询词、关键词在有互动性质的网站和/或有互动性质的网站的网页中出现的 次数等于或者大于设定次数阈值,则说明查询词、关键词与网站相匹配;其中,设定次数阈 值由具体需求而定,本发明实施例对此不进行具体的限制。 0095 若包。

36、含有解决过有关查询词、关键词和/或其同义词、相关词问题的网页的有互 动性质的网站的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站 相匹配;其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。 0096 若解决过有关查询词、关键词和/或其同义词、相关词问题的有互动性质的网站 的网页的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站相匹配; 其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。 0097 若单个有互动性质的网站中的解决过有关查询词、关键词和/或其同义词、相关 词问题的网页的个数等于或者大于设定个数阈值,则说明。

37、查询词、关键词与网站相匹配;其 中,设定个数阈值由具体需求而定,本发明实施例对此不进行具体的限制。 0098 在本发明实施例中,有互动性质的网站,包括:社交网站、互动社区、论坛、攻略/ 经验分享网站或贴吧等。 0099 通过本发明实施例提供的装置基于长尾关键词进行搜索推荐的实施例如图4所 示,当用户搜索的查询词是“太阁5战国绘卷628秘籍怎么收归蝶”时,先由分词单元110 对“太阁5战国绘卷628秘籍怎么收归蝶”进行分词处理,再由判断执行单元判断查询词的 类型是否为长尾关键词;通过分析,查询词至少由“太阁”、“战国”、“绘卷”和“秘籍”这4个 单词组成,且在一段时间阈值内的搜索次数低于设定次数。

38、阈值,则判断该查询词为长尾关 键词。利用第一搜索引擎在第一网址库中查找是否有与这个查询词相匹配的网站;而只有 “太阁立志传5战国绘卷怎么娶女武将我去她家什么都不发生送什么。”的网址,即没有与 查询词相匹配的网站;再由判断分析单元210根据各分词的权重,将“太阁”作为核心分词, 其他分词作为支持词;接着通过第二搜索引擎在综合性问答知识类网站、垂直领域的网站 和综合性经验分享类网站中,分别查找与“太阁”相匹配的有互动性质的网站作为可解决长 尾关键词问题的网站优先向用户推荐,即将查找到的百度贴吧中的太阁立志传5吧、太阁5 官方论坛、游侠网的太阁5游戏专题和360问答优先向用户推荐,用户可以从上述百度。

39、贴吧 中的太阁立志传5吧、太阁5官方论坛、游侠网的太阁5游戏专题中查找到“太阁5战国绘 说 明 书CN 104021214 A 10 8/11页 11 卷628秘籍怎么收归蝶”有关的内容。若在上述网站中,仍然没有用户所需的内容,用户还 可以在被推荐出的360问答中以提问的方式,将“太阁5战国绘卷628秘籍怎么收归蝶”的 问题向公众提出,等待其他用户解答,从而通过被推荐出的互动性质的网站得到自己所需 的与长尾关键词有关的答案。 0100 参见图5,本发明实施例还提供了一种基于长尾关键词的搜索推荐装置,包括: 0101 搜索输入框300,用于用户输入搜索查询词; 0102 显示模块400,用于当查。

40、询词为长尾关键词时,显示优先推荐的与其相关的互动性 质的网站。 0103 其中,显示模块400,具体用于当查询词为长尾关键词时,在综合性问答知识类网 站、垂直领域的网站和综合性经验分享类网站中,分别查找与长尾关键词的核心分词相匹 配的有互动性质的网站,并将查找到的网站作为可解决长尾关键词问题的网站优先向用户 显示,因此本发明实施例优先向用户推荐的互动性质网站包括上述三类网站中的至少一 类,用户可以从有互动性质的网站中查找到其所需的内容。若在被推荐出的网站中,仍然没 有用户所需的内容,用户还可以在被推荐的有互动性质的网站中以提问的方式,将自己感 兴趣的问题向公众提出,等待其他用户解答,从而在有互。

41、动性质的网站中,得到自己所需的 与长尾关键词有关的答案。其中,综合性问答知识类网站可以包括:360问答、百度知道、搜 狗知识、或SOSO问问等;垂直领域的网站可以包括:游侠网、游戏官网论坛、或大众点评网 等;综合性经验分享类网站可以包括豆瓣网、或百度贴吧等。 0104 需要说明的是,在本发明实施例中,查询词、关键词与网站相匹配包括下述中的至 少一个: 0105 若查询词、关键词在有互动性质的网站和/或有互动性质的网站的网页中出现的 次数等于或者大于设定次数阈值,则说明查询词、关键词与网站相匹配;其中,设定次数阈 值由具体需求而定,本发明实施例对此不进行具体的限制。 0106 若包含有解决过有关。

42、查询词、关键词和/或其同义词、相关词问题的网页的有互 动性质的网站的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站 相匹配;其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。 0107 若解决过有关查询词、关键词和/或其同义词、相关词问题的有互动性质的网站 的网页的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站相匹配; 其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。 0108 若单个有互动性质的网站中的解决过有关查询词、关键词和/或其同义词、相关 词问题的网页的个数等于或者大于设定个数阈值,则说明查询词、关键词。

43、与网站相匹配;其 中,设定个数阈值由具体需求而定,本发明实施例对此不进行具体的限制。 0109 在本发明实施例中,有互动性质的网站,包括:社交网站、互动社区、论坛、攻略/ 经验分享网站或贴吧等。 0110 本发明实施例的基于长尾关键词的搜索推荐方法及装置,当接收到用户搜索的查 询词的类型为长尾关键词时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词 问题的网站优先向用户推荐,从而将用户引导到最有可能解决用户问题的网站,解决了当 搜索词为长尾关键词时,无法获取与该长尾关键词相匹配的网站的问题,取得了满足用户 的搜索需求的有益效果。 说 明 书CN 104021214 A 11 9/11页 。

44、12 0111 在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。 各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求 的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种 编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发 明的最佳实施方式。 0112 在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施 例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构 和技术,以便不模糊对本说明书的理解。 0113 类似地,应当理解,为了精简本公开并帮。

45、助理解各个发明方面中的一个或多个,在 上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施 例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保 护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面 的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此, 遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身 都作为本发明的单独实施例。 0114 本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地 改变并且把它们设置在与该实施例不同的一个或多个设。

46、备中。可以把实施例中的模块或单 元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或 子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任 何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开 的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴 随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代 特征来代替。 0115 此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例 中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本。

47、发明的 范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任 意之一都可以以任意的组合方式来使用。 0116 本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行 的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用 微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的基于长尾关键词的搜索 推荐装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里 所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产 品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具。

48、有一个或者多个 信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任 何其他形式提供。 0117 应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领 域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中, 不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在 未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这 说 明 书CN 104021214 A 12 10/11页 13 样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来 实现。在列举了。

49、若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件 项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为 名称。 0118 本发明还提供了A1、一种基于长尾关键词的搜索推荐方法,包括: 0119 接收用户搜索查询词,判断所述查询词的类型是否为长尾关键词; 0120 当所述查询词的类型为长尾关键词时,查找与其相匹配的有互动性质的网站作为 可解决长尾关键词问题的网站优先向用户推荐。 0121 A2、如A1所述的方法,所述判断所述查询词的类型是否为长尾关键词包括:对所 述查询词进行分词处理,在判断出所述查询词由至少2个单词组成,且所述查询词在一段 时间阈值内的搜索次数低于设定次数阈值的情况下,确定所述查询词为长尾关键词; 0122 或者,如果搜索查询词索引的通用搜。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1