一种搜索引擎系统和信息搜索方法 【技术领域】
本发明涉及互联网领域,尤其涉及一种搜索引擎系统和信息搜索方法。
背景技术
目前的搜索引擎系统通常仅包括搜索模块、排序模块和显示模块。其中:
搜索模块用于接收信息搜索请求,从互联网上的开放数据中搜索与所述信息搜索请求具有一定相关度的数据信息,将搜索出的数据信息发给排序模块。
排序模块用于将搜索模块发来的数据信息进行排序后将排序结果和所述数据信息发给显示模块。
所述显示模块,直接显示排序模块发来的数据信息或者数据信息的链接。
其中,互联网上的开放数据是指,对所有公众开放的网页等数据信息,换言之,任何人都具有查看所述开放数据的权限。
互联网上的数据信息,除了开放数据外,实际上还包括大量的暗网数据。所述暗网数据是指,目前的搜索引擎系统无法抓取的网页或者检索不到的信息,即“看不见”的网站上的数据信息。这种“看不见”的网站可以分为两种:其一是网站本身不规范、或者说互联网本身缺少统一规则,导致了搜索引擎的爬虫无法识别这些网站的内容并抓取该内容;其二是网站本身出于版权保护以及个人隐私保护等考虑,通过特定技术避免搜索引擎搜索到该网站上的数据信息,例如专业数据提供商的网站。
其中,专业数据提供商的网站是指,拥有特定领域或特定类型的数据资源,并对外提供数据服务的网站,例如万方数据库、ACM论文库等信息门户网站。用户要获得这些网站上的详细数据信息,需要在相应的网站上分别注册并一次性缴纳一定的费用从而获得一定的权限,之后通过登录该网站获取相应的详细数据信息。
目前,互联网上这种专业数据提供商的网站数量很大,其所蕴含的数据信息非常丰富,对很多搜索引擎用户来讲也极具价值。然而,一方面,目前的搜索引擎系统无法抓取这些专业数据提供商的网站上的详细数据信息,能够为用户提供的数据信息不全面;另一方面,即便通过搜索引擎搜索到数据信息的摘要,用户根据摘要确定要获得相应的详细数据信息,也要登录相应的网站并且进行注册缴费等一系列操作后,才能获得所述详细数据信息,这对广大网络用户来讲是极不方便的,同时,频繁的登录、注册、缴费等操作也耗费了大量的网络资源。
【发明内容】
有鉴于此,本发明实施例的目的在于提供一种搜索引擎系统和信息搜索方法,以在节省网络资源的同时为网络用户搜索到更加全面的数据信息。
为达到上述目的,本发明实施例的技术方案具体是这样实现的:
一种搜索引擎系统,该系统包括搜索模块、供应商数据提交入口、资源库和支付模块;
所述搜索模块,接收信息搜索请求,根据该信息搜索请求从资源库中查询出相应的数据信息,接收到查看所述数据信息的请求后,向支付模块发送支付请求,接收到支付模块发来的支付成功指示后,显示或输出请求查看的信息;
所述供应商数据提交入口与资源库相连,用于专业数据供应商向资源库提交数据信息;
所述资源库,接收并存储专业数据供应商提交的数据信息;
所述支付模块,接收搜索模块发来的支付请求,根据该支付请求中携带的账户信息,查询相应的账户并扣除与请求查看的数据信息相应的费用,并在扣除成功后,向搜索模块发送支付成功指示。
一种信息搜索方法,所述方法包括:
开设用于供应商提交数据资源的第一入口;
从第一入口接收供应商提交的数据资源并存储;
接收信息搜索请求,根据该信息搜索请求从已存储的数据资源中查询出相应的信息,接收查看所述信息的请求,并在为所述信息付费后,显示或输出请求查看的信息。
可见,本发明的搜索引擎系统通过为专业数据供应商提供数据提交入口来接收专业数据供应商提交的数据信息,并通过设置特定的资源库来存储专业数据供应商提交的数据信息,搜索引擎系统通过搜索该资源库中的数据信息,即可搜索到现有技术中作为暗网数据存在的所述数据信息,使得搜索引擎系统搜索到的信息更加全面。
另一方面,通过设置支付模块,使得用户可以直接通过该支付模块向所有向该搜索引擎系统提交数据的专业数据供应商支付查看相应信息的费用,而不必频繁地登录各个专业数据供应商各自的网站,在方便用户的同时,也节省了网络资源。
【附图说明】
图1是本发明提供的搜索引擎系统第一组成示意图。
图2是本发明提供的搜索引擎系统第二组成示意图。
图3是本发明的搜索引擎系统详细组成示意图。
图4是本发明提供的信息搜索方法流程图。
图5是应用本发明向搜索引擎系统提交数据信息的方法流程图。
图6是应用本发明搜索数据信息的方法流程图。
【具体实施方式】
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明进一步详细说明。
图1是本发明提供的搜索引擎系统第一组成示意图,如图1所示,该系统包括搜索模块101、供应商数据提交入口102、资源库103和支付模块104。
搜索模块101,接收信息搜索请求,根据该信息搜索请求从资源库103中查询出相应的数据信息,接收到查看所述数据信息的请求后,向支付模块104发送支付请求,接收到支付模块104发来的支付成功指示后,显示或输出请求查看的信息。
供应商数据提交入口102与资源库103相连,用于专业数据供应商向资源库提交数据信息。
资源库103,接收并存储专业数据供应商提交的数据信息。
支付模块104,接收搜索模块101发来的支付请求,根据该支付请求中携带的账户信息,查询相应的账户并扣除与请求查看的数据信息相应的费用,并在扣除成功后,向搜索模块101发送支付成功指示。
图2是本发明提供的搜索引擎系统第二组成示意图,如图2所示,该系统在图1所示系统的基础上进一步包括个人用户数据提交入口105。
个人用户数据提交入口105与资源库103相连,用于个人用户向资源库103提交数据信息。
资源库103进一步用于,接收并存储个人用户提交的数据信息。
通过设置个人用户数据提交入口105,使得任何网络用户都可以通过该个人用户数据提交入口105向资源库103提交数据信息,使得搜索系统搜索的信息更加全面。
图2所示的搜索引擎系统在具体实现时,可以对搜索模块101、资源库103和支付模块104中的任意一个或多个进行细化,下面以对搜索模块101、资源库103和支付模块104均进行细化为例,说明搜索引擎系统的具体实现方式,具体请参见图3。
图3是本发明的搜索引擎系统详细组成示意图。图3所示系统对图2所示系统中的各个模块进行了细化,具体包括:
资源库103包括收费资源库1031、免费资源库1032和第二协商模块1033;搜索模块101包括前台模块1011、排序模块1012、收费资源搜索模块1013和免费资源搜索模块1014;支付模块104包括第一协商模块1041、费用管理模块1042、结算模块1043和付费历史记录模块1044。
收费资源库1031,接收并存储个人用户或专业数据供应商提交的收费数据信息。
免费资源库1032,接收并存储个人用户或专业数据供应商提交的免费数据信息。
前台模块1011,接收信息搜索请求,并根据该信息搜索请求分别向收费资源搜索模块1013和免费资源搜索模块1014发送搜索指示、向排序模块1012发送排序指示,接收排序模块1012发来的数据信息,显示所述数据信息的摘要,接收到查看收费数据信息的请求后,向支付模块104发送支付请求,接收到支付模块104发来的支付成功指示后,显示或输出请求查看的数据信息或者所述数据信息的链接。
排序模块1012,接收收费资源搜索模块1013和/或免费资源搜索模块1014发来的数据信息,并根据前台模块1012发来的排序指示对接收到的数据信息进行排序,将排序后的数据信息发给前台模块1012。
收费资源搜索模块1013,用于收到前台模块1012发来的搜索指示后,从收费资源库1031查询出相应的收费数据信息并发给排序模块1012。
免费资源搜索模块1014,用于收到前台模块1012发来的搜索指示后,从免费资源库1032查询出相应的免费数据信息并发给排序模块1012。
第一协商模块1041,接收第二协商模块1033发来的收入分成协议,并向第二协商模块1033发送确认指示。
第二协商模块1033,通过个人用户数据提交入口105或供应商数据提交入口102与个人用户或供应商协商收入分成协议,接收到同意所述收入分成协议的触发后,向第一协商模块1041发送所述收入分成协议,接收到第一协商模块1041的确认指示后,通过个人用户数据提交入口105或供应商数据提交入口102显示或输出确认消息。
费用管理模块1042,接收到搜索模块101发来的支付请求后,检查与所述支付请求对应的账户的余额是否大于所述费用,在大于所述费用时,从所述账户中扣除相应的费用,向搜索模块101发送支付成功指示。
结算模块1043,与第一协商模块1041和费用管理模块1042相连,获取费用管理模块1042扣除的费用、该费用对应的数据资源信息、提交该数据资源信息对应的数据资源的个人用户信息或者供应商信息以及第一协商模块1041存储的收入分成协议,根据所述收入分成协议以及所述费用,为所述个人用户信息或者供应商信息对应的账户进行收入结算。
费用管理模块1042,接收搜索模块101发来的支付请求,根据该支付请求中携带的账户信息,查询付费历史记录模块1044中记录的已经成功付费的数据资源信息,在判断出相应的账户没有为请求查看的信息付费时,扣除与请求查看的信息相应的费用,并在相应的账户已经为请求查看的信息付费后,向搜索模块101发送支付成功指示。
付费历史记录模块1044,记录费用管理模块1042已经成功付费的数据资源信息以及相应的账户信息。
为了提高个人用户或者专业数据供应商提交的数据资源(也就是数据信息)的安全性,资源库103还可以进一步用于,对接收的数据资源进行合法性检查,并在合法性检查成功后存储所述数据资源。其中,合法性检查可以采用现有技术实现,也可以采用其他方法实现,本发明对此不做限制。
上述系统中,个人用户和/或专业数据供应商提交的数据包括文本数据、带有描述信息的音频和/或视频数据或者指向所述文本数据或者音频和/或视频数据的有效链接。根据提交数据类型的不同和/或数据提交量的不同,搜索系统可以为个人用户数据提交入口和/或供应商数据提交入口提供不同的网络带宽等网络资源,例如,为提交的视频数据提供较大的网络带宽,为数据提交量较大的专业数据供应商提供较大的网络带宽和存储空间。
上述系统中的支付模块104还可以包括用于进行用户账户充值、转账或提款的模块。资源库103还可以包括用于个人用户或专业数据供应商更新和/或删除已经提交给该资源库103的数据信息的模块。排序模块1012对收费资源和免费资源可以采用不同的相关度计算方法来计算相关度。费用管理模块1042可以在用户账户资金不足时提醒用户充值后再访问。
进一步地,本发明还通过特定的排序方法来对包括收费资源和免费资源的数据信息进行排序,以使得对用户价值较大的数据信息尽量显示在搜索到的所有数据信息靠前的位置上。
具体地,排序模块1012,获取预先为收费资源与信息搜索请求的相关度、收费资源的点击数以及评价分别赋予的权值,根据所述权值以及收费资源实际与信息搜索请求的相关度、实际的点击数和对该收费资源的评价进行加权,根据加权结果对收费资源进行排序。
排序模块1012还可以进一步包括,用于判断收费资源实际与信息搜索请求的相关度是否大于预定值,仅在大于预定值时对所述收费资源进行排序的模块。
排序模块1012还可以将所有收费资源中排在前预定数目位的收费资源排在所有免费资源之前。
下面举例对排序模块1012进行排序的方法进行详细介绍:
排序模块1012对收费资源和免费资源进行联合排序,其中,可以为收费资源和免费资源设置不同的排序权值(即排序因子),对收费资源和免费资源分别计算加权结果,根据所述加权结果进行联合排序。
较佳地,对于收费资源,其加权结果可以根据下式得到:
Rank收费=P1×Rank点击+P2×Rank评价+P3×Rank相关度
其中,Rank收费是加权结果,P1、P2和P3分别是用户点击数、该收费资源的评价等级以及该收费资源与信息检索请求的相关度各自的权值,且P1+P2+P3=1。
Rank点击是根据该收费资源的用户实际点击数计算出的排序值,越多用户点击该收费资源,则该收费资源的Rank点击越高。
Rank评价是根据该收费资源的用户实际评价等级计算出的排序值,用户对该收费资源的评价越高,则该收费资源的Rank评价越高。
Rank相关度是根据该收费资源与信息检索请求的实际相关度计算出的排序值,两者的相关度越高,则该收费资源的Rank相关度越高。
根据以上计算方法,来自收费资源搜索模块的每个搜索结果都有一个加权结果,我们截取其中加权结果最高的前N个放在来自其他数据搜索模块的搜索结果前面。其中N可以取任意自然数,例如取3。
为避免出现相关度过低的收费资源,可以对收费资源的Rank相关度做一个门限要求,如果Rank相关度小于预设的门限值,则不出现相应的收费资源。这种方法可以避免不相关的收费数据干扰用户,也可以确保相关的前N个收费资源能够展现在前面供用户选择。
其中的支付模块104,可以实现小额扣费,即每次从用户账户上扣除的资金额度较小,例如0.5元人民币。
简要来说,本发明提出的搜索引擎系统允许任何用户或是第三方数据供应商向搜索引擎提交有价值的资源,然后搜索引擎会在其他用户检索的时候,根据相关度等因素将其中一些资源展示给搜索用户,如果其他用户愿意付费获得这些资源,就可以点击这些资源,并在后台支付模块计费成功后从搜索引擎获得这些资源。
根据上述搜索系统,本发明提出了相应的信息搜索方法,请参见图4。
图4是本发明提供的信息搜索方法流程图,如图4所示,该方法包括:
步骤401,开设用于供应商提交数据资源的第一入口。
步骤402,从第一入口接收供应商提交的数据资源并存储。
步骤403,接收信息搜索请求,根据该信息搜索请求从已存储的数据资源中查询出相应的信息,接收查看所述信息的请求,并在为所述信息付费后,显示或输出请求查看的信息。
该方法还可以进一步包括:开设用于个人用户提交数据资源的第二入口,从第二入口接收个人用户提交的数据资源并存储。
下面对应用本发明向搜索引擎系统提交数据信息的方法和搜索数据信息的方法进行介绍,具体请参见图5和图6。
图5是应用本发明向搜索引擎系统提交数据信息的方法流程图,如图5所示,该方法包括:
步骤501~502,个人用户或专业数据供应商通过相应的数据提交入口登录资源库。
步骤503~506,个人用户或专业数据供应商通过相应的数据提交入口与资源库协商收入分成协议,资源库将协商好的收入分成协议发给支付模块,支付模块收到该收入分成协议后,通过资源库向用户或专业数据供应商发送确认收入分成协议的消息。
步骤507,个人用户或专业数据供应商通过相应的数据提交入口向资源库提交数据资源信息。
步骤508,资源库接收数据资源信息并对其进行资源合法性检查,在资源合法性检查合格后,将该数据资源信息加入该资源库中的索引源数据库。
步骤509,资源库通过相应的数据提交入口向个人用户或专业数据供应商发送确认资源提交成功的消息。
步骤510~511,资源库向收费资源搜索模块发送将个人用户或专业数据供应商提交的资源推送到收费资源搜索模块中的收费资源索引库的请求消息,收费资源搜索模块将所述提交的资源推送到收费资源索引库后,向资源库发送确认推送成功的消息。
图6是应用本发明搜索数据信息的方法流程图,如图6所示,该方法包括:
步骤601~602,搜索引擎用户登录搜索模块。
步骤603~604,搜索引擎用户向搜索引擎系统提交信息搜索请求,搜索模块将搜索结果返回给搜索引擎用户。
步骤605~608,搜索模块接收搜索引擎用户对收费资源链接的点击,向支付模块提交对应该收费资源的计费请求,支付模块验证用户账户余额是否充足,并在账户余额充足时进行计费操作,计费完成后向搜索模块发送确认计费成功的消息。
步骤609,搜索模块向搜索引擎用户显示收费资源或可以访问收费资源的有效链接。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。