《一种为搜索结果添加标签的搜索结果分类方法.pdf》由会员分享,可在线阅读,更多相关《一种为搜索结果添加标签的搜索结果分类方法.pdf(11页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN101963966A43申请公布日20110202CN101963966ACN101963966A21申请号200910158283122申请日20090724G06F17/30200601G06F3/04820060171申请人李占胜地址100102北京市朝阳区利泽中二路望京科技园C座4049申请人李艳平72发明人李占胜李艳平54发明名称一种为搜索结果添加标签的搜索结果分类方法57摘要本发明提出了一种对搜索结果进行改进的方法,提出了为综合搜索引擎的海量搜索结果添加分类标签,根据各种标签对搜索结果进行分类,按照标签对搜索结果进行过滤的方法。本发明引入了搜索结果改进的用户参与,。
2、有助于改进搜索引擎的用户体验,提高用户使用搜索引擎的效率。51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书5页附图4页CN101963967A1/1页21一种为搜索结果添加标签的搜索结果分类方法涉及搜索引擎的用户参与,搜索结果的显示、分类、标签、过滤、优化、排序等。其特征在于为每条搜索结果添加一个或多个标签。标签用以标识搜索结果文档的属性、类别、来源等。不同的标签表示不同的文档属性和类别。2权利要求1中的方法,其中标签不同于关键词,标签是为了标注文档内容以外的属性,与内容本身无关。标签的名称可以是新闻、博客、广告、官方、灌水、生活、专业、作品、知识、其他等;以。
3、及其他一些表明网络文档的属性的名称。每个标签可以有子标签。3权利要求1中的方法,其特征包括搜索引擎在抓取网页的过程中对每个网页或一个网站的所有网页添加一个或多个标签,标签与该网页文档关联起来一起保存于搜索引擎的数据库中。4权利要求1中的方法,其特征包括当搜索引擎呈现搜索结果的时候,标签显示在搜索结果的适当的位置,可以在搜索结果标题的前面、后面,或搜索结果摘要的后面等。每个搜索结果可以有一个或多个标签,最常用的标签放到最前面。不同的标签标以不同的颜色。5权利要求1中的方法,其特征包括通过标签能够对搜索结果进行过滤,用户可以选中某个或某些标签,使得搜索结果页面中只显示标注这些标签的结果文档,也可以。
4、使得结果文档中不显示标注这些标签的文档等。6权利要求1中的方法,其特征包括允许授权用户对结果文档添加标签,或修改标签的名称,或删除某些标签,或修改标签的说明信息等。允许用户对标签与文档的匹配程度的做出反馈。7权利要求1中的方法,其特征包括为标签的点击或通过标签的过滤添加快捷键。8权利要求1中的方法,其特征包括为搜索结果的翻页或页面定位添加快捷键。9权利要求1中的方法,其特征包括为某些关键词的命中情况设置用户调查;设置关键词与网络文档之间匹配程度的统计,并以此作为搜索结果显示次序的重要参考。权利要求书CN101963966ACN101963967A1/5页3一种为搜索结果添加标签的搜索结果分类方。
5、法技术领域0001本发明提出了一种对搜索结果进行改进的方法,涉及搜索引擎的用户体验及用户参与,涉及搜索结果的显示、分类、标签、过滤、优化、排序等。背景技术0002搜索已经成为人类使用互联网获取信息的最主要方式之一,谷歌GOOGLETM、百度、雅虎YAHOOTM、有道、搜狗、搜搜等搜索引擎成了人们使用互联网必需的工具。随着搜索技术的发展,搜索引擎速度越来越快,但是由于互联网信息量的剧增,使得用户很难从海量数据中找到最需要的信息,搜索引擎的使用效率提高不大;此外搜索提供商更多地专注于搜索引擎的速度和搜索算法,而对用户体验却关注较少。0003为了改进用户体验,提高用户使用搜索引擎的效率,可以首先考察。
6、人类手工搜索的方式。人们逛超市时一般会大致了解超市商品的分类,然后确定自己的选购路线。试想如果大型超市的商品没有分类,人们去购物将会是怎样一种情形。然而现在的许多搜索引擎却是将用户搜索的“商品”无类别地摆放出来,将数以万亿的搜索结果一股脑地呈献给用户。也许这种简单地摆放正是简单搜索的最初思想,如果对简单搜索进行改进无疑可以提高使用效率,改进用户体验,提高用户热情。0004下面考察一下人们使用互联网的其他方式。在门户网站或新闻网站,如果想看体育新闻会到体育版块,需要财经新闻会去财经版块,而不需要对网站中的所有新闻逐条地查找,看哪条新闻是自己感兴趣的。分类信息网站或生活信息网站如赶集网,58同城等。
7、很好地了解了人们使用互联网的这种需求,将信息进行了详细地分类,用户只需不断地细化自己的搜索分类,就可以很快地找到自己最需要的信息。比如用户需要求租房屋,需要首先选择版块类别房产,选择房产类别求租房,然后选择区域、房屋类型、价钱等的类别,就会得到最符合自己需要的一些信息,而不需要对所有房产信息逐条查找。正是由于分类信息网站对信息进行详细分类,使得其更为方便高效,并挑战了传统搜索网站的地位,所以如果对综合搜索的结果进行分类,定能提高用户的使用效率。0005搜索引擎在提高用户体验上也做了一些努力。许多搜索引擎提供了高级搜索功能,但是其使用繁琐,需要较多的手工输入。有的搜索引擎在用户输入界面提供了一些。
8、简单的分类选项,也提供了一些分类搜索的功能如GOOGLETM的生活搜索,但是分类搜索毕竟无法代替综合搜索,其在搜索范围上有很大的局限性。综合搜索凭着自身较高的知名度和较广的用户群,完全可以将信息分类的功能集成进来,以增强对分类信息网站的竞争优势。0006微软最新推出的必应BING搜索引擎引入了分类的机制,首先将搜索结果分类,例如通过英文版BING搜索HYBRIDELECTRICCARS混合动力汽车,搜索结果被分类进行显示,包括HYBRIDELECTRICCARMANUFACTURERS、HYBRIDELECTRICCARMODELS和HYBRIDELECTRICCARPRICES等几类。其次使。
9、用了QUICKTABS快速标签,QUICKTABS是根据搜索关键词生成的WEBGROUP类别。例如搜索DIABETES糖尿病,会出现ARTICLES文章、DIET饮食、DIAGNOSIS诊断等若干QUICKTABS,用户点击不同QUICKTABS类别说明书CN101963966ACN101963967A2/5页4即可细分搜索结果。这种分类方法能在一定程度上帮助用户查看搜索信息,但是这种分类对每个搜索结果的属性的解释不够精准,而且内容的分类往往应该是交叉的,有些内容不能单纯地划分为某一类。0007参考用户反馈以提高用户满意度的方法经常被使用,而搜索网站一般不提供这样的功能。如果让用户参与搜索结果。
10、的分类及命中情况的调查,则能够提高搜索结果的有效性、命中率和用户的使用效率,能够很好地改进用户体验。发明内容0008为了改进综合搜索引擎的用户体验,提高用户使用搜索引擎的效率,本发明提出了为海量搜索结果添加分类标签,根据各种标签对搜索结果分类,按照标签对搜索结果进行过滤的方法,本发明还提出用户参与搜索结果改进的方法。包括以下几部分内容0009标签说明0010搜索引擎在抓取网页的过程中对每个网页或一个网站所有网页添加一个或多个标签,标签与该网页文档一起保存于搜索引擎的数据库中。标签用以标注该网页的属性、类别、来源、位置等信息。标签不同于关键词,标签是为了标注文档内容以外的属性,与内容本身无关,而。
11、且标签所显示的词语可能根本不出现在内容中。标签可以包括新闻、博客、广告、官方、灌水、生活、专业、作品、知识、其他由用户添加标签等。每个标签可以有子标签,相当于子类别。下面将分别介绍这些标签。0011新闻也可以叫做资讯,主要包括各个门户网站、新闻网站、媒体网站等发布的资讯文档。新闻子标签包括报道、访谈、调查、评论等,而新闻的一些分类如时事新闻、体育新闻、军事新闻等不予区别,不作为子标签。0012博客指各种博客文章,包括个人博客和机构博客等。官方指各个企业、机关、机构等的门户网站中的文档。广告是指带广告性质的文档。0013灌水指各种社区网站和BBS中的观赏性的帖子,而社区网站中的一些生活信息的帖子。
12、则不属于这类标签。生活标签标注分类信息网站中的文档和社区网站中的一些生活信息的文档。0014专业包括各类学术文档、论文、专利等。作品包括各类古今优秀文化作品。知识也可以叫做百科,指类似于维基WIKI百科的各类文档。0015有些暂时不能给予明确标签的文档可标以“其他”标签。这种标签相当于未命名的标签,授权用户可以为这类文档分配明确的标签,然后由搜索引擎服务器端决定用户建议是否采纳。0016这里所述的标签种类主要是为了介绍这种分类方法和分类思想,实际标签种类会与此有些不同。标签代表了搜索引擎或用户对网络中文档的分类,所以实际分类的类别和名称不限于上面所述的几个。0017标签显示及使用0018搜索引。
13、擎的现有用户输入界面不需要修改,用户在输入搜索关键词时不需要考虑分类。搜索结果按照现有的格局进行排列,如说明书附图中图1所示,每个搜索结果包括搜索结果标题、搜索结果摘要、文档地址及其他几部分。对于图1中的第一条搜索结果可以标以“官方”,“专业”的标签。在每条结果文档的前面或后面,或其他合适的位置将标签呈现说明书CN101963966ACN101963967A3/5页5出来。如说明书附图中图2、图3所示。0019所有标签可以都放到一个统一的位置,在每条搜索结果对应的位置不再显示标签,如图4所示,使得标签直接用来对搜索结果分类。0020每条搜索结果都有一个或多个标签,最常用的标签居前,可以有多种算。
14、法排列这些标签。当搜索结果的标签过多时,可以只显示最常用的几个标签。限制每个网络文档的标签个数,以免标签过多反而影响了使用。0021为了使标签的分类比较醒目,将不同的标签标以不同的颜色,可以是文字背景颜色不同或字体颜色不同。0022为了增加用户友好性,为每个标签添加说明信息,用户能够通过说明信息清楚地了解该标签的意义。0023通过标签能够对搜索结果进行过滤,用户可以选中某个标签,使得搜索结果页面中只显示标注了该标签的结果文档,也可以使得结果文档中不显示标注该标签的文档。可以通过不同的点击方式或快捷键选出标注该标签的文档或过滤掉标注该标签的文档。0024用户参与方法0025授权用户能够对结果文档。
15、进行添加标签,或修改标签的名称,或删除某些标签,或修改标签的说明信息等操作。用户对标签的操作经过搜索引擎服务器端的审核后才加入到数据库中。搜索引擎提供方需要控制对用户的授权,以保证用户对标签的调整是友好的。这样能够使标签信息不断完善、逐步精确。具体实施方式将在“具体实施方式”部分介绍。0026设置标签与某个文档的匹配度,让用户不一定是授权用户参与这种匹配度的调查能够为网络文档设置更为合理的标签。0027允许用户添加修改标签使得用户参与到了搜索结果分类中来,同样也可以让用户参与结果文档与关键词的匹配命中率的调查,这样可以通过用户的使用经验来提高搜索的命中率和使用效率。为某个结果文档针对某个关键词。
16、或根据语义分析技术将语义相近的一类关键词设置命中率,由用户对命中率进行评价。由于存在海量的网络文档以及几乎无穷多个的搜索关键词,这种命中率的设置看起来是不可能的,而只针对部分文档以及部分关键词设置命中率却是可行的比如用户参与了调查就记录,否则不记录。如果某个页面对某个关键词的命中率很高,而且被大量使用,则可以根据这个关键词对标签做出调整。0028除了记录用户对搜索命中情况的主动反馈信息以外,记录用户搜索某个关键词或根据语义分析技术将相近的一类搜索词对一些文档的使用历史,将使用频度较高和用户评价较高的搜索结果优先呈现给用户,这样也能够优化搜索结果。0029用户界面优化0030由于每个显示页面都较。
17、长,下一页的点击按钮一般会被安排到页面的顶部或底部,使得用户在浏览过一页之后不得不再去定位到下一页的点击按钮,这样显得有些笨重。可以为下一页或前一页的点击按钮添加快捷键,如ALTN为下一页的快捷键,ALTB为前一页的快捷键。也可以为某一页添加快捷键,如CTRL1为第一页的快捷键,CTRL2为第二页的快捷键等。0031本发明的这些方法把分类机制引入到了简单搜索的搜索结果显示中,引入了人为干预机制,并且减少了用户过多的手工输入,减少了人为机制对用户的干扰,使用户能够更方便、快捷地使用搜索引擎。对于用户界面较小的手机搜索,使用标签将用户不关心的搜索说明书CN101963966ACN101963967。
18、A4/5页6结果过滤掉可以使用户更方便快捷地找到需要的信息。附图说明0032图1是使用GOOGLETM搜索出来的搜索结果布局风格。0033图2标明了本发明所提出的带标签的搜索结果布局风格。0034图3标明了本发明所提出的带标签的搜索结果的另一种布局风格。0035图4是标签布局的另一种风格。0036图5说明了用户参与标签改进和使用反馈的方法。0037图6说明了用户为网络文档添加或修改标签的方法。0038图7说明了用户删除一个网络文档的标签的方法。具体实施方式0039用户使用标签对搜索结果进行过滤的具体实施如下用户点击一个标签时,在搜索结果页面显示出以下类似的菜单项“显示该类别ALTD”、“不显示。
19、该类别ALTN”、“隐藏标签ALTH”、“在该类别中重新搜索ALTS”、“显示标签说明ALTT”等。每个菜单项可以带有快捷键,这里的快捷键如果与系统的快捷键冲突则由用户进行选择或自定义。每个菜单项用一个超链接HYPERLINK实现,根据菜单项功能显示出新页面。点击“显示该类别”菜单项以后会在新页面将标注该标签的搜索结果显示出来,而不显示没有标注该标签的搜索结果,同时高亮HIGHLIGHT显示该标签,且搜索结果的布局风格不变。“不显示该类别”表示在新的页面不显示标注相应标签的搜索结果。“隐藏标签”菜单项表示将所有标签都隐藏起来,不再显示。“在该类别中重新搜索”表示新的页面会显示对应关键词在标注该。
20、标签的搜索结果中重新搜索的结果。用户点击“显示标签说明”会显示出对该标签的提示说明信息。0040用户修改标签和参与调查具体实施如下在每条搜索结果的所有标签后面添加一个“改进IMPROVING”超链接,超链接的名称也可以是“评价”或“参与”等,如图3所示。用户点击该链接以后,显示出一个新的页面,该页面类似于图5所示。在这个页面用户能够通过点击“添加”按钮为该网络文档添加一个新的标签,点击“添加”按钮以后会显示如图6所示的两个文本编辑框,用户可以输入新的标签的名称和说明信息。用户可以点击“删除”按钮删除一个已有的标签,点击“删除”按钮以后,出现图7所示的标签列表以及单选框,用户选中一个标签以后,可。
21、以点击“提交”按钮以提交删除信息。用户点击“修改”按钮,出现图6所示的两个文本编辑框,同时将现有的标签名称和说明信息分别显示到两个文本框里,用户可以修改文本框里的内容,点击“提交”按钮以后将修改结果提交到搜索引擎服务器。用户可以参与标签与文档的匹配程度的调查,在图5的页面中,显示“标签是否匹配了该文档”等字样,同时出现“匹配”、“不匹配”、“难以确定”等字样和相应的单选框,用户选中了相应的单选框以后点击“提交”按钮将结果发送到服务器,服务器保存这些结果,由服务器决定是否将该改进添加到数据库中。在服务器端,将用户参与改进较多根据情况设置一个用户参与次数的阈值,以判断是否用户参与较多的网络文档的标。
22、签进行相应的修改。0041对搜索结果根据用户反馈进行排序具体实施如下用户可以在图5的页面中参与说明书CN101963966ACN101963967A5/5页7关键词命中情况的调查,如图5中的“该文档匹配了关键词”字样,同时出现“匹配”、“不匹配”、“难以确定”等字样和相应的单选框,用户选中相应的单选框以后点击“提交”按钮将结果发送到服务器,服务器保存这些结果。在服务器端,将用户参与调查较多设置一个用户参与次数阈值,用以判断是否用户参与调查较多且评价较高的网络文档,以及用户使用较多的文档在搜索结果中优先显示。将用户评价和使用频度标以不同的权重或者采用相关算法进行统计,然后综合成一个统一的分值,将分值较高的搜索结果优先呈现。说明书CN101963966ACN101963967A1/4页8图1图2说明书附图CN101963966ACN101963967A2/4页9图3图4说明书附图CN101963966ACN101963967A3/4页10图5说明书附图CN101963966ACN101963967A4/4页11图6图7说明书附图CN101963966A。