搜索引导方法和搜索引擎.pdf

上传人:54 文档编号:1285280 上传时间:2018-04-12 格式:PDF 页数:11 大小:546.65KB
返回 下载 相关 举报
摘要
申请专利号:

CN201611028513.9

申请日:

2016.11.18

公开号:

CN106503259A

公开日:

2017.03.15

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20161118|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

政和科技股份有限公司

发明人:

史高升; 朱涛; 赵西法; 陈美丽

地址:

250101 山东省济南市高新区经十东路7000号汉峪金谷A3-5号楼17层

优先权:

专利代理机构:

北京智桥联合知识产权代理事务所(普通合伙) 11560

代理人:

商晓莉

PDF下载: PDF下载
内容摘要

本发明公开了一种搜索引导方法和搜索引擎,所述方法包括:获取用户输入的搜索词;在索引库中按照索引目录搜索与所述搜索词对应的信息,并显示;其中,所述索引目录包括按照行业划分的行业索引目录和按照地域划分的地域索引目录。本发明实施例的技术方案通过在索引库中按照行业划分的行业索引目录和按照地域划分的地域索引目录对搜索词进行检索,能够避免不必要的系统开支,从而提高检索速度。

权利要求书

1.一种搜索引导方法,其特征在于,包括:
获取用户输入的搜索词;
在索引库中按照索引目录搜索与所述搜索词对应的信息,并显示;
其中,所述索引目录包括按照行业划分的行业索引目录和按照地域划分的地域索引目
录。
2.根据权利要求1所述的方法,其特征在于,获取用户输入的搜索词之前,所述方法还
包括:
利用网络爬虫技术获取海量数据;
根据所述海量数据建立搜索词的索引库。
3.根据权利要求2所述的方法,其特征在于,根据所述海量数据建立搜索词的索引库,
包括:
将所述搜索词按照行业和地域进行分类,并建立所述行业索引目录和所述地域索引目
录;
根据所述海量数据构建索引数据;
为所述索引数据建立索引数据编号。
4.根据权利要求1所述的方法,其特征在于,在索引库中搜索与所述搜索词对应的信
息,并显示,包括:
将所述搜索词转换成所述索引库对应的数据格式;
在所述索引库中检索所述搜索词对应的信息;
将所述搜索词对应的信息转换成可以终端上显示的格式。
5.根据权利要求4所述的方法,其特征在于,所述索引库对应的数据格式为二进制格
式,所述终端上显示的格式为html格式。
6.根据权利要求1所述的方法,其特征在于,在索引库中搜索与所述搜索词对应的信
息,并显示之后,所述方法还包括:
保存所述搜索结果。
7.根据权利要求6所述的方法,其特征在于,所述搜索结果以二进制格式保存。
8.一种搜索引擎,其特征在于,包括:
第一获取模块,配置为获取用户输入的搜索词;
搜索模块,配置为在索引库中按照索引目录搜索与所述搜索词对应的信息,并显示;
其中,所述索引目录包括按照行业划分的行业索引目录和按照地域划分的地域索引目
录。
9.根据权利要求8所述的搜索引擎,其特征在于,所述装置还包括:
第二获取模块,配置为在获取用户输入的搜索词之前,利用网络爬虫技术获取海量数
据;
构建模块,配置为根据所述海量数据建立搜索词的索引库。
10.根据权利要求9所述的搜索引擎,其特征在于,所述构建模块,包括:
分类子模块,配置为将所述搜索词按照行业和地域进行分类,并建立所述行业索引目
录和所述地域索引目录;
第一构建子模块,配置为根据所述海量数据构建索引数据;
第二构建子模块,配置为为所述索引数据建立索引数据编号。

说明书

搜索引导方法和搜索引擎

技术领域

本发明涉及搜索技术领域,特别涉及一种搜索引导方法和搜索引擎。

背景技术

随着信息化水平的逐步提高,以网络为首的传统新闻媒体业,以及电子信息科技
咨询服务业成为重要的市场增长点。但是,对于一些信息化欠发达的地区,由于其技术支撑
力欠佳,不能及时掌握瞬息万变的市场信息。在企业获得市场信息时,市场信息已经发生变
化,造成了企业的发展与市场化之间的矛盾。

现在,企业已经意识到这一问题,他们为适应市场的变化,也在逐步地利用互联网
搜索技术来向互联网信息时代转型。但现有技术中的搜索技术,仅基于关键字本身在海量
数据中进行搜索,效率较低。

发明内容

有鉴于此,本发明实施例的目的是提供一种能够基于内容与地理区域的搜索引导
方法和搜索引擎。

为了实现上述目的,本发明实施例提供了一种搜索引导方法,包括:

获取用户输入的搜索词;

在索引库中按照索引目录搜索与所述搜索词对应的信息,并显示;

其中,所述索引目录包括按照行业划分的行业索引目录和按照地域划分的地域索
引目录。

作为优选,获取用户输入的搜索词之前,所述方法还包括:

利用网络爬虫技术获取海量数据;

根据所述海量数据建立搜索词的索引库。

作为优选,根据所述海量数据建立搜索词的索引库,包括:

将所述搜索词按照行业和地域进行分类,并建立所述行业索引目录和所述地域索
引目录;

根据所述海量数据构建索引数据;

为所述索引数据建立索引数据编号。

作为优选,在索引库中搜索与所述搜索词对应的信息,并显示,包括:

将所述搜索词转换成所述索引库对应的数据格式;

在所述索引库中检索所述搜索词对应的信息;

将所述搜索词对应的信息转换成可以终端上显示的格式。

作为优选,所述索引库对应的数据格式为二进制格式,所述终端上显示的格式为
html格式。

作为优选,在索引库中搜索与所述搜索词对应的信息,并显示之后,所述方法还包
括:

保存所述搜索结果。

作为优选,所述搜索结果以二进制格式保存。

本发明实施例提供一种搜索引擎,包括:

第一获取模块,配置为获取用户输入的搜索词;

搜索模块,配置为在索引库中按照索引目录搜索与所述搜索词对应的信息,并显
示;

其中,所述索引目录包括按照行业划分的行业索引目录和按照地域划分的地域索
引目录。

作为优选,所述装置还包括:

第二获取模块,配置为在获取用户输入的搜索词之前,利用网络爬虫技术获取海
量数据;

构建模块,配置为根据所述海量数据建立搜索词的索引库。

作为优选,所述构建模块,包括:

分类子模块,配置为将所述搜索词按照行业和地域进行分类,并建立所述行业索
引目录和所述地域索引目录;

第一构建子模块,配置为根据所述海量数据构建索引数据;

第二构建子模块,配置为为所述索引数据建立索引数据编号。与现有技术相比,本
发明实施例具有以下有益效果:本发明实施例的技术方案通过在索引库中按照行业划分的
行业索引目录和按照地域划分的地域索引目录对搜索词进行检索,能够避免不必要的系统
开支,从而提高检索速度。

附图说明

图1为本发明的搜索引导方法的实施例一的流程图;

图2为本发明的搜索引导方法的实施例二的流程图;

图3为本发明的搜索引导方法的实施例二检索过程示意图;

图4为本发明的搜索引擎的实施例一的示意图;

图5为本发明的搜索引擎的实施例二的示意图。

具体实施方式

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施
例用于说明本发明,但不用来限制本发明的范围。

图1为本发明的搜索引导方法的实施例一的流程图,如图1所示,本实施例的搜索
引导方法,具体可以包括如下步骤:

S101,获取用户输入的搜索词。

具体地,用户在搜索一信息时,需要输入搜索词,网络服务器才可以根据搜索词,
在索引库中查找与搜索词相关的信息。

S102,在索引库中按照索引目录搜索与搜索词对应的信息,并显示;

其中,索引目录包括按照行业划分的行业索引目录和按照地域划分的地域索引目
录。

具体地,在索引库中包括索引目录,索引目录包括行业索引目录和地域索引目录,
也就是说,用户在输入搜索词后,网络服务器首先按照行业索引目录查找与搜索词相关的
行业数据,再在这些行业数据中搜索与搜索词的地域相关的地域索引目录中查找相关的数
据,当然也可以首先在地域索引目录中查找与搜索词的地域相关的数据,再在行业索引目
录中查找与搜索词的行业相关的数据,也可以在两者中择其一来查找。这样可以先过滤掉
大量的数据,仅在可能相关的数据中查找,从而提高搜索速茺。这有点类似于查汉语字典,
汉语字典会提供拼音的目录或部首的目录,再根据拼音或部首来查询汉字。

例如,查询汽车配件,首先按行业查询,属于汽车行业,服务器首先过滤掉无关的
信息,仅保留汽车行业的数据;再在这些数据中查找,根据用户的所属地域和数据链接地址
所属的地域,优先显示离用户的所属地域较近的与汽车配件相关的汽车配件商店数据,以
及汽车配件的解释数据,以及网页中包含了汽车配件的网页数据等。

本发明实施例的技术方案通过在索引库中按照行业划分的行业索引目录和按照
地域划分的地域索引目录对搜索词进行检索,能够避免不必要的系统开支,从而提高检索
速度。

图2为本发明的搜索引导方法的实施例二的流程图,本实施例的搜索引导方法在
上述实施例一的基础上,进一步更加详细地介绍本发明的技术方案。如图2所示,本实施例
的搜索引导方法,具体可以包括如下步骤:

S201,利用网络爬虫技术获取海量数据。

爬虫技术是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,也可
以叫做蚂蚁技术、自动索引技术、模拟程序或者蠕虫技术。传统的爬虫技术从一个或若干个
初始网页链接开始,获得初始网页上的链接,在抓取网页的过程中,不断从当前页面上抽取
新的链接放入队列直到满足系统的停止条件,所有被爬虫技术抓取的网页将会被系统存
贮,进行一定的分析、过滤,并建立索引,以供之后的查询和检索。这一步骤的目的是为建立
索引库搜集素材。

S202,根据海量数据建立搜索词的索引库。

具体地,将海量数据存储为索引库中的索引数据。

进一步地,步骤S202包括:A,将搜索词按照行业和地域进行分类,并建立行业索引
目录和地域索引目录;B,根据海量数据构建索引数据;C,为索引数据建立索引数据编号。

具体地,在构建索引库时就需要将索引库中的索引数据分类存储,此处的分类存
储并非以分块形式存储,而是将每条索引数据加以索引编号,根据其编号来对其进行分类
存储,举个最简单的例子,例如,索引数据共包括两类:与人名相关的数据和与地理相关的
数据,则索引编号可以将与人名相关的数据以偶数作为其索引编号,将与地理相关的数据
以奇数作为其索引编号,这样在查找人名时,仅在索引编号为偶数的索引数据中查找,在查
找地地理数据时,仅在索引编号为奇数的索引数据中查找。当然实际中的索引数据不仅是
分为两类,而是分为很多类,在查找时,仅在一类中查找,就过滤掉了很多的数据。这样将索
引数据分块存储,查找时分块查找,从而提高搜索速度。

本实施例就以行业对海量数据进行分类,对每个行业类加以索引编号,同时根据
海量数据中的每条数据的链接地址,提取该链接地址的域名,并分析该域名所属的地域,例
如属于北京、深圳或珠海等地区,根据地域对这些海量数据进行分类存储。

S203,获取用户输入的搜索词。

具体地,用户在搜索一信息时,需要输入搜索词,网络服务器才可以根据搜索词,
在索引库中查找与搜索词相关的信息。

S204,将搜索词转换成索引库对应的数据格式。

具体地,索引库中存储的所有数据,包括索引目录、索引编号、索引数据和索引数
据编号(参见图3),均为二进制的格式。也就是说,用户在输入搜索词进行搜索时,网络服务
器将搜索词的格式转换成二进行制的形式。采用二进制的格式,可以兼容不同的系统或不
同的平台。

S205,在索引库中检索搜索词对应的信息。

S206,将搜索词对应的信息转换成可以终端上显示的格式。

用户在搜索信息时,通常是在终端的浏览器中进行搜索,并最终以网页的形式进
行显示。因此在索引库检索到与搜索引词相关的信息后,由上述可知索引库存储的所有数
据均为二进制格式,因此还需要将相关的信息转换成终端上的浏览器能兼容的html格式。
由于数据在索引库中是以索引数据的形式存在的,因此在具体实施例时,可以设置显示模
板,将索引数据转换成HTML格式后套用到显示模板中,以方便用户查看。

S207,保存搜索结果。

具体地,用户有时可能会重复搜索同一搜索词,因此可以将用户检索到相关的信
息,即搜索结果后,保存该搜索结果,具体可以以数据的形式存储在缓存中,那么在下一次
需要查找与该搜索词相关的数据时,可以直接在缓存中直接提取这些搜索结果。搜索结果
仍以二进制格式保存。

本发明实施例的技术方案通过利用海量数据构建索引库,并且索引库中的索引数
据以行业和地域进行分类存储,使用户在搜索时速度大大提高,另一方面,索引数据以二进
行格式进行存储,从而能够兼容不同的平台和系统。

图4为本发明的搜索引擎的实施例一的示意图,如图4所示,本实施例的搜索引擎,
具体可以包括获取模块41和搜索模块42。

第一获取模块41,配置为获取用户输入的搜索词;

搜索模块42,配置为在索引库中按照索引目录搜索与搜索词对应的信息,并显示;

其中,索引目录包括按照行业划分的行业索引目录和按照地域划分的地域索引目
录。

本实施例的搜索引擎,通过采用上述模块对搜索词进行检索的实现机制与上述图
1所示实施例的搜索引导方法的实现机制相同,详细可以参考上述图1所示实施例的记载,
在此不再赘述。

图5为本发明的搜索引擎的实施例二的示意图,本实施例的搜索引擎在如图4所示
的实施例一的基础上,进一步更加详细地介绍本发明的技术方案。如图5所示,本实施例的
搜索引擎,进一步可以包括:

第二获取模块51,配置为在获取用户输入的搜索词之前,利用网络爬虫技术获取
海量数据;

构建模块52,配置为根据海量数据建立搜索词的索引库。

进一步地,该构建模块52,包括:

分类子模块521,配置为将搜索词按照行业和地域进行分类,并建立行业索引目录
和地域索引目录;

第一构建子模块522,配置为根据海量数据构建索引数据;

第二构建子模块523,配置为为索引数据建立索引数据编号。

本实施例的搜索引擎,通过采用上述模块对搜索词进行搜索的实现机制与上述图
2所示实施例的搜索引导方法的实现机制相同,详细可以参考上述图2所示实施例的记载,
在此不再赘述。

以上实施例仅为本发明的示例性实施例,不用于限制本发明,本发明的保护范围
由权利要求书限定。本领域技术人员可以在本发明的实质和保护范围内,对本发明做出各
种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。

搜索引导方法和搜索引擎.pdf_第1页
第1页 / 共11页
搜索引导方法和搜索引擎.pdf_第2页
第2页 / 共11页
搜索引导方法和搜索引擎.pdf_第3页
第3页 / 共11页
点击查看更多>>
资源描述

《搜索引导方法和搜索引擎.pdf》由会员分享,可在线阅读,更多相关《搜索引导方法和搜索引擎.pdf(11页珍藏版)》请在专利查询网上搜索。

本发明公开了一种搜索引导方法和搜索引擎,所述方法包括:获取用户输入的搜索词;在索引库中按照索引目录搜索与所述搜索词对应的信息,并显示;其中,所述索引目录包括按照行业划分的行业索引目录和按照地域划分的地域索引目录。本发明实施例的技术方案通过在索引库中按照行业划分的行业索引目录和按照地域划分的地域索引目录对搜索词进行检索,能够避免不必要的系统开支,从而提高检索速度。 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1