一种搜索财经文章的方法、装置及服务器.pdf

上传人:bo****18 文档编号:6274114 上传时间:2019-05-27 格式:PDF 页数:20 大小:1.43MB
返回 下载 相关 举报
摘要
申请专利号:

CN201511023160.9

申请日:

2015.12.29

公开号:

CN105404699A

公开日:

2016.03.16

当前法律状态:

驳回

有效性:

无权

法律详情:

发明专利申请公布后的驳回IPC(主分类):G06F 17/30申请公布日:20160316|||实质审查的生效IPC(主分类):G06F 17/30申请日:20151229|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

广州神马移动信息科技有限公司

发明人:

林鹏; 俞琪; 杨锋; 华能威

地址:

510627广东省广州市天河区黄埔大道西平云路163号广电平云广场B塔12层自编01单元

优先权:

专利代理机构:

北京超凡志成知识产权代理事务所(普通合伙)11371

代理人:

王术兰

PDF下载: PDF下载
内容摘要

本发明提供了一种搜索财经文章的方法、装置及服务器。其中,该方法包括:根据浏览器客户端发送的关键词,从预先创建的财经文库中获取与关键词匹配的财经文章信息;根据财经文章信息,生成财经文章信息对应的索引摘要及为财经文章信息分配类型标签;根据财经文章信息对应的类型标签,对财经文章信息对应的索引摘要进行分类排序,得到关键词对应的搜索结果。本发明为财经文章信息分配了类型标签,并根据类型标签进行了分类排序,如此得到的搜索结果类型明确,使得浏览器客户端可以分类显示该搜索结果,用户可以根据财经文章信息的类型进行浏览,提高了搜索的财经文章的参考性。

权利要求书

1.一种搜索财经文章的方法,其特征在于,所述方法包括:
根据浏览器客户端发送的关键词,从预先创建的财经文库中获
取与所述关键词匹配的财经文章信息;
根据所述财经文章信息,生成所述财经文章信息对应的索引摘
要及为所述财经文章信息分配类型标签;
根据所述财经文章信息对应的类型标签,对所述财经文章信息
对应的索引摘要进行分类排序,得到所述关键词对应的搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述财
经文章信息,为所述财经文章信息分配类型标签,包括:
从所述财经文章信息中获取文章标题及文章正文;
对所述文章标题及文章正文进行文本分析,确定所述财经文章
信息所属的类型;
根据确定的所述类型,为所述财经文章信息分配类型标签。
3.根据权利要求2所述的方法,其特征在于,所述对所述文章
标题及文章正文进行文本分析,确定所述财经文章信息所属的类型,
包括:
对所述文章标题及文章正文的结构特征进行分析,确定所述财
经文章信息是否属于直播类型;和/或,
对所述文章标题及文章正文进行文本分析,若分析出所述文章
标题及文章正文中包含股票信息,则根据所述股票信息确定所述财
经文章信息所属的股票类型;和/或,
对所述文章标题及文章正文进行文本分析,若分析出所述文章
标题及文章正文中包含情感描述信息,则根据所述情感描述信息确
定所述财经文章信息所属的情感类型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述财
经文章信息,生成所述财经文章信息对应的索引摘要,包括:
从所述财经文章信息中获取文章标题、作者信息及发布时间;
根据所述文章标题、作者信息及发布时间,生成所述财经文章
信息对应的摘要信息;
生成所述摘要信息与所述财经文章信息之间的跳转链接;
根据所述摘要信息与所述跳转链接,生成所述财经文章信息对
应的索引摘要。
5.根据权利要求1所述的方法,其特征在于,所述根据所述财
经文章信息对应的类型标签,对所述财经文章信息对应的索引摘要
进行分类排序,包括:
根据所述财经文章信息,计算所述财经文章信息的文章特征值;
根据所述财经文章信息对应的类型标签,对所述财经文章信息
进行分类;
根据分类得到的每类财经文章信息的文章特征值,分别对每类
财经文章信息对应的索引摘要进行排序。
6.根据权利要求5所述的方法,其特征在于,所述根据所述财
经文章信息,计算所述财经文章信息的文章特征值,包括:
根据所述财经文章信息,计算所述财经文章信息的时效特征值、
主题特征值、权威特征值和相关特征值;
对所述时效特征值、所述主题特征值、所述权威特征值和所述
相关特征值进行归一化处理,得到所述财经文章信息的文章特征值。
7.根据权利要求1所述的方法,其特征在于,所述根据浏览器
客户端发送的关键词,从预先创建的财经文库中获取与所述关键词
匹配的财经文章信息之前,还包括:
实时抓取预设财经链接对应的财经网页;
对抓取的所述财经网页进行内容抽取,得到所述财经网页的结
构化信息,所述结构化信息包括发布时间、文章正文、作者信息、
阅读次数及评论次数;
从所述财经网页的结构化信息中过滤掉外站链接对应的部分信
息;
将过滤剩余的结构化信息作为所述财经网页的财经文章信息,
将所述财经网页的财经文章信息存储在财经文库中。
8.根据权利要求1所述的方法,其特征在于,当所述关键词包
括股票信息时,所述方法还包括:
根据所述股票信息,获取所述股票信息对应的行业文章列表;
生成所述行业文章列表中每个行业文章对应的索引摘要;
计算所述行业文章列表中每个行业文章的文章特征值,根据所
述每个行业文章的文章特征值,对所述每个行业文章对应的索引摘
要进行排序;
将排序后的所述每个行业文章对应的索引摘要与分类排序后的
所述财经文章信息对应的索引摘要进行合并排序,得到所述关键词
对应的搜索结果。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述得
到所述关键词对应的搜索结果之后,还包括:
将所述关键词对应的搜索结果及预设的展示规则发送给所述浏
览器客户端,以使所述浏览器客户端根据所述预设的展示规则分类
显示所述搜索结果。
10.一种搜索财经文章的装置,其特征在于,所述装置包括:
获取模块,用于根据浏览器客户端发送的关键词,从预先创建
的财经文库中获取与所述关键词匹配的财经文章信息;
生成模块,用于根据所述财经文章信息,生成所述财经文章信
息对应的索引摘要及为所述财经文章信息分配类型标签;
排序模块,用于根据所述财经文章信息对应的类型标签,对所
述财经文章信息对应的索引摘要进行分类排序,得到所述关键词对
应的搜索结果。
11.根据权利要求10所述的装置,其特征在于,所述生成模块
包括:
第一获取单元,用于从所述财经文章信息中获取文章标题及文
章正文;
确定单元,用于对所述文章标题及文章正文进行文本分析,确
定所述财经文章信息所属的类型;
分配单元,用于根据确定的所述类型,为所述财经文章信息分
配类型标签。
12.根据权利要求11所述的装置,其特征在于,所述确定单元
包括:
第一确定子单元,用于对所述文章标题及文章正文的结构特征
进行分析,确定所述财经文章信息是否属于直播类型;和/或,
第二确定子单元,用于对所述文章标题及文章正文进行文本分
析,若分析出所述文章标题及文章正文中包含股票信息,则根据所
述股票信息确定所述财经文章信息所属的股票类型;和/或,
第三确定子单元,用于对所述文章标题及文章正文进行文本分
析,若分析出所述文章标题及文章正文中包含情感描述信息,则根
据所述情感描述信息确定所述财经文章信息所属的情感类型。
13.根据权利要求10所述的装置,其特征在于,所述生成模
块包括:
第二获取单元,用于从所述财经文章信息中获取文章标题、作
者信息及发布时间;
第一生成单元,用于根据所述文章标题、作者信息及发布时间,
生成所述财经文章信息对应的摘要信息;
第二生成单元,用于生成所述摘要信息与所述财经文章信息之
间的跳转链接;
第三生成单元,用于根据所述摘要信息与所述跳转链接,生成
所述财经文章信息对应的索引摘要。
14.根据权利要求10所述的装置,其特征在于,所述排序模
块包括:
计算单元,用于根据所述财经文章信息,计算所述财经文章信
息的文章特征值;
分类单元,用于根据所述财经文章信息对应的类型标签,对所
述财经文章信息进行分类;
排序单元,用于根据分类得到的每类财经文章信息的文章特征
值,分别对每类财经文章信息对应的索引摘要进行排序。
15.根据权利要求14所述的装置,其特征在于,所述计算单
元包括:
计算子单元,用于根据所述财经文章信息,计算所述财经文章
信息的时效特征值、主题特征值、权威特征值和相关特征值;
归一化子单元,用于对所述时效特征值、所述主题特征值、所
述权威特征值和所述相关特征值进行归一化处理,得到所述财经文
章信息的文章特征值。
16.根据权利要求10所述的装置,其特征在于,所述装置还
包括:
财经文库创建模块,用于实时抓取预设财经链接对应的财经网
页;对抓取的所述财经网页进行内容抽取,得到所述财经网页的结
构化信息,所述结构化信息包括发布时间、文章正文、作者信息、
阅读次数及评论次数;从所述财经网页的结构化信息中过滤掉外站
链接对应的部分信息;将过滤剩余的结构化信息作为所述财经网页
的财经文章信息,将所述财经网页的财经文章信息存储在财经文库
中。
17.根据权利要求10所述的装置,其特征在于,当所述关键
词包括股票信息时,所述装置还包括:
合并排序模块,用于根据所述股票信息,获取所述股票信息对
应的行业文章列表;生成所述行业文章列表中每个行业文章对应的
索引摘要;计算所述行业文章列表中每个行业文章的文章特征值,
根据所述每个行业文章的文章特征值,对所述每个行业文章对应的
索引摘要进行排序;将排序后的所述每个行业文章对应的索引摘要
与分类排序后的所述财经文章信息对应的索引摘要进行合并排序,
得到所述关键词对应的搜索结果。
18.根据权利要求10-17任一项所述的装置,其特征在于,所
述装置还包括:
发送模块,用于将所述关键词对应的搜索结果及预设的展示规
则发送给所述浏览器客户端,以使所述浏览器客户端根据所述预设
的展示规则分类显示所述搜索结果。
19.一种服务器,其特征在于,所述服务器包括:处理器和存
储器;
所述处理器,用于根据浏览器客户端发送的关键词,从预先创
建的财经文库中获取与所述关键词匹配的财经文章信息;根据所述
财经文章信息,生成所述财经文章信息对应的索引摘要及为所述财
经文章信息分配类型标签;根据所述财经文章信息对应的类型标签,
对所述财经文章信息对应的索引摘要进行分类排序,得到所述关键
词对应的搜索结果;
所述存储器,用于存储所述预先创建的财经文库及所述处理器
的可执行指令。

说明书

一种搜索财经文章的方法、装置及服务器

技术领域

本发明涉及互联网通信领域,具体而言,涉及一种搜索财经文
章的方法、装置及服务器。

背景技术

互联网中每天发布大量的财经资讯及股评篇章等财经文章,用
户可以通过浏览器客户端来搜索自己需要的财经文章,浏览器客户
端根据用户提供的关键词来搜索财经文章。

当前,浏览器后台一般都通过爬虫事先爬取财经站点的财经文
章,并存储爬取到的财经文章。当用户通过浏览器客户端搜索财经
文章时,浏览器客户端根据用户提供的关键词,从事先爬取并存储
的财经文章中搜索与该关键词匹配的财经文章,将搜索到的财经文
章显示给用户。

由于财经文章可以分为多种类型,如直播类型和非直播类型,
对于股评篇章还可以分为看空类型和看多类型等。不同类型的财经
文章对读者的参考价值不同,上述搜索方式并没有对财经文章的类
型进行区分,笼统地将搜索到的财经文章显示给用户,导致财经文
章显示杂乱,参考性低。

发明内容

有鉴于此,本发明实施例的目的在于提供一种搜索财经文章的
方法、装置及服务器,为财经文章信息分配了类型标签,并根据类
型标签进行了分类排序,提高了搜索的财经文章的参考性。

第一方面,本发明实施例提供了一种搜索财经文章的方法,所
述方法包括:

根据浏览器客户端发送的关键词,从预先创建的财经文库中获
取与所述关键词匹配的财经文章信息;

根据所述财经文章信息,生成所述财经文章信息对应的索引摘
要及为所述财经文章信息分配类型标签;

根据所述财经文章信息对应的类型标签,对所述财经文章信息
对应的索引摘要进行分类排序,得到所述关键词对应的搜索结果。

结合第一方面,本发明实施例提供了上述第一方面的第一种可
能的实现方式,其中,所述根据所述财经文章信息,为所述财经文
章信息分配类型标签,包括:

从所述财经文章信息中获取文章标题及文章正文;

对所述文章标题及文章正文进行文本分析,确定所述财经文章
信息所属的类型;

根据确定的所述类型,为所述财经文章信息分配类型标签。

结合第一方面的第一种可能的实现方式,本发明实施例提供了
上述第一方面的第二种可能的实现方式,其中,所述对所述文章标
题及文章正文进行文本分析,确定所述财经文章信息所属的类型,
包括:

对所述文章标题及文章正文的结构特征进行分析,确定所述财
经文章信息是否属于直播类型;和/或,

对所述文章标题及文章正文进行文本分析,若分析出所述文章
标题及文章正文中包含股票信息,则根据所述股票信息确定所述财
经文章信息所属的股票类型;和/或,

对所述文章标题及文章正文进行文本分析,若分析出所述文章
标题及文章正文中包含情感描述信息,则根据所述情感描述信息确
定所述财经文章信息所属的情感类型。

结合第一方面,本发明实施例提供了上述第一方面的第三种可
能的实现方式,其中,所述根据所述财经文章信息,生成所述财经
文章信息对应的索引摘要,包括:

从所述财经文章信息中获取文章标题、作者信息及发布时间;

根据所述文章标题、作者信息及发布时间,生成所述财经文章
信息对应的摘要信息;

生成所述摘要信息与所述财经文章信息之间的跳转链接;

根据所述摘要信息与所述跳转链接,生成所述财经文章信息对
应的索引摘要。

结合第一方面,本发明实施例提供了上述第一方面的第四种可
能的实现方式,其中,所述根据所述财经文章信息对应的类型标签,
对所述财经文章信息对应的索引摘要进行分类排序,包括:

根据所述财经文章信息,计算所述财经文章信息的文章特征值;

根据所述财经文章信息对应的类型标签,对所述财经文章信息
进行分类;

根据分类得到的每类财经文章信息的文章特征值,分别对每类
财经文章信息对应的索引摘要进行排序。

结合第一方面的第四种可能的实现方式,本发明实施例提供了
上述第一方面的第五种可能的实现方式,其中,所述根据所述财经
文章信息,计算所述财经文章信息的文章特征值,包括:

根据所述财经文章信息,计算所述财经文章信息的时效特征值、
主题特征值、权威特征值和相关特征值;

对所述时效特征值、所述主题特征值、所述权威特征值和所述
相关特征值进行归一化处理,得到所述财经文章信息的文章特征值。

结合第一方面,本发明实施例提供了上述第一方面的第六种可
能的实现方式,其中,所述根据浏览器客户端发送的关键词,从预
先创建的财经文库中获取与所述关键词匹配的财经文章信息之前,
还包括:

实时抓取预设财经链接对应的财经网页;

对抓取的所述财经网页进行内容抽取,得到所述财经网页的结
构化信息,所述结构化信息包括发布时间、文章正文、作者信息、
阅读次数及评论次数;

从所述财经网页的结构化信息中过滤掉外站链接对应的部分信
息;

将过滤剩余的结构化信息作为所述财经网页的财经文章信息,
将所述财经网页的财经文章信息存储在财经文库中。

结合第一方面,本发明实施例提供了上述第一方面的第七种可
能的实现方式,其中,当所述关键词包括股票信息时,所述方法还
包括:

根据所述股票信息,获取所述股票信息对应的行业文章列表;

生成所述行业文章列表中每个行业文章对应的索引摘要;

计算所述行业文章列表中每个行业文章的文章特征值,根据所
述每个行业文章的文章特征值,对所述每个行业文章对应的索引摘
要进行排序;

将排序后的所述每个行业文章对应的索引摘要与分类排序后的
所述财经文章信息对应的索引摘要进行合并排序,得到所述关键词
对应的搜索结果。

结合第一方面,本发明实施例提供了上述第一方面的第八种可
能的实现方式,其中,所述得到所述关键词对应的搜索结果之后,
还包括:

将所述关键词对应的搜索结果及预设的展示规则发送给所述浏
览器客户端,以使所述浏览器客户端根据所述预设的展示规则分类
显示所述搜索结果。

第二方面,本发明实施例提供了一种搜索财经文章的装置,所
述装置包括:

获取模块,用于根据浏览器客户端发送的关键词,从预先创建
的财经文库中获取与所述关键词匹配的财经文章信息;

生成模块,用于根据所述财经文章信息,生成所述财经文章信
息对应的索引摘要及为所述财经文章信息分配类型标签;

排序模块,用于根据所述财经文章信息对应的类型标签,对所
述财经文章信息对应的索引摘要进行分类排序,得到所述关键词对
应的搜索结果。

结合第二方面,本发明实施例提供了上述第二方面的第一种可
能的实现方式,其中,所述生成模块包括:

第一获取单元,用于从所述财经文章信息中获取文章标题及文
章正文;

确定单元,用于对所述文章标题及文章正文进行文本分析,确
定所述财经文章信息所属的类型;

分配单元,用于根据确定的所述类型,为所述财经文章信息分
配类型标签。

结合第二方面的第一种可能的实现方式,本发明实施例提供了
上述第二方面的第二种可能的实现方式,其中,所述确定单元包括:

第一确定子单元,用于对所述文章标题及文章正文的结构特征
进行分析,确定所述财经文章信息是否属于直播类型;和/或,

第二确定子单元,用于对所述文章标题及文章正文进行文本分
析,若分析出所述文章标题及文章正文中包含股票信息,则根据所
述股票信息确定所述财经文章信息所属的股票类型;和/或,

第三确定子单元,用于对所述文章标题及文章正文进行文本分
析,若分析出所述文章标题及文章正文中包含情感描述信息,则根
据所述情感描述信息确定所述财经文章信息所属的情感类型。

结合第二方面,本发明实施例提供了上述第二方面的第三种可
能的实现方式,其中,所述生成模块包括:

第二获取单元,用于从所述财经文章信息中获取文章标题、作
者信息及发布时间;

第一生成单元,用于根据所述文章标题、作者信息及发布时间,
生成所述财经文章信息对应的摘要信息;

第二生成单元,用于生成所述摘要信息与所述财经文章信息之
间的跳转链接;

第三生成单元,用于根据所述摘要信息与所述跳转链接,生成
所述财经文章信息对应的索引摘要。

结合第二方面,本发明实施例提供了上述第二方面的第四种可
能的实现方式,其中,所述排序模块包括:

计算单元,用于根据所述财经文章信息,计算所述财经文章信
息的文章特征值;

分类单元,用于根据所述财经文章信息对应的类型标签,对所
述财经文章信息进行分类;

排序单元,用于根据分类得到的每类财经文章信息的文章特征
值,分别对每类财经文章信息对应的索引摘要进行排序。

结合第二方面的第四种可能的实现方式,本发明实施例提供了
上述第二方面的第五种可能的实现方式,其中,所述计算单元包括:

计算子单元,用于根据所述财经文章信息,计算所述财经文章
信息的时效特征值、主题特征值、权威特征值和相关特征值;

归一化子单元,用于对所述时效特征值、所述主题特征值、所
述权威特征值和所述相关特征值进行归一化处理,得到所述财经文
章信息的文章特征值。

结合第二方面,本发明实施例提供了上述第二方面的第六种可
能的实现方式,其中,所述装置还包括:

财经文库创建模块,用于实时抓取预设财经链接对应的财经网
页;对抓取的所述财经网页进行内容抽取,得到所述财经网页的结
构化信息,所述结构化信息包括发布时间、文章正文、作者信息、
阅读次数及评论次数;从所述财经网页的结构化信息中过滤掉外站
链接对应的部分信息;将过滤剩余的结构化信息作为所述财经网页
的财经文章信息,将所述财经网页的财经文章信息存储在财经文库
中。

结合第二方面,本发明实施例提供了上述第二方面的第七种可
能的实现方式,其中,当所述关键词包括股票信息时,所述装置还
包括:

合并排序模块,用于根据所述股票信息,获取所述股票信息对
应的行业文章列表;生成所述行业文章列表中每个行业文章对应的
索引摘要;计算所述行业文章列表中每个行业文章的文章特征值,
根据所述每个行业文章的文章特征值,对所述每个行业文章对应的
索引摘要进行排序;将排序后的所述每个行业文章对应的索引摘要
与分类排序后的所述财经文章信息对应的索引摘要进行合并排序,
得到所述关键词对应的搜索结果。

结合第二方面,本发明实施例提供了上述第二方面的第八种可
能的实现方式,其中,所述装置还包括:

发送模块,用于将所述关键词对应的搜索结果及预设的展示规
则发送给所述浏览器客户端,以使所述浏览器客户端根据所述预设
的展示规则分类显示所述搜索结果。

第三方面,本发明实施例提供了一种服务器,所述服务器包括:
处理器和存储器;

所述处理器,用于根据浏览器客户端发送的关键词,从预先创
建的财经文库中获取与所述关键词匹配的财经文章信息;根据所述
财经文章信息,生成所述财经文章信息对应的索引摘要及为所述财
经文章信息分配类型标签;根据所述财经文章信息对应的类型标签,
对所述财经文章信息对应的索引摘要进行分类排序,得到所述关键
词对应的搜索结果;

所述存储器,用于存储所述预先创建的财经文库及所述处理器
的可执行指令。

在本发明实施例提供的方法、装置及服务器中,根据财经文
章信息,为财经文章信息分配类型标签;根据财经文章信息对应的
类型标签,对财经文章信息对应的索引摘要进行分类排序,得到关
键词对应的搜索结果。本发明为财经文章信息分配了类型标签,并
根据类型标签进行了分类排序,如此得到的搜索结果类型明确,使
得浏览器客户端可以分类显示该搜索结果,用户可以根据财经文章
信息的类型进行浏览,提高了搜索的财经文章的参考性。

为使本发明的上述目的、特征和优点能更明显易懂,下文
特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例
中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了
本发明的某些实施例,因此不应被看作是对范围的限定,对于本领
域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
这些附图获得其他相关的附图。

图1A示出了本发明实施例1所提供的一种创建财经文库的流
程示意图;

图1B示出了本发明实施例1所提供的一种搜索财经文章的方
法流程图;

图1C示出了本发明实施例1所提供的一种搜索结果的展示界
面示意图;

图2示出了本发明实施例2所提供的一种搜索财经文章的装置
结构示意图;

图3示出了本发明实施例3所提供的一种服务器的结构示意图。

具体实施方式

下面将结合本发明实施例中附图,对本发明实施例中的技术方
案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一
部分实施例,而不是全部的实施例。通常在此处附图中描述和示出
的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,
以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要
求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于
本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下
所获得的所有其他实施例,都属于本发明保护的范围。

在构思本发明的技术方案时,考虑到财经文章可以分为多种类
型,如直播类型和非直播类型,对于股评篇章还可以分为看空类型
和看多类型等。不同类型的财经文章对读者的参考价值不同,而相
关技术中并没有对财经文章的类型进行区分,仅笼统地将搜索到的
财经文章显示给用户,导致财经文章显示杂乱,参考性低。基于此,
本发明实施例提供了一种搜索财经文章的方法、装置及服务器。下
面通过实施例进行描述。

实施例1

本发明实施例提供了一种搜索财经文章的方法。本发明实施例
的执行主体为服务器,该服务器可以为浏览器后台服务器。

在本发明实施例中,预先选取了一些经常发布优质财经文章的
财经站点的链接、种子链接或优秀作者的博客链接等,将这些链接
作为预设财经链接,并将预设财经链接预先存储在服务器中。在通
过本发明实施例提供的方法搜索财经文章之前,首先需要根据预设
财经链接来创建财经文库,参见图1A,具体创建过程如下:

S1:实时抓取预设财经链接对应的财经网页。

获取上述预先存储的财经站点的链接、种子链接或优秀作者的
博客链接等预设财经链接,利用爬虫程序实时抓取预设财经链接对
应的财经网页。

由于财经站点、种子链接及优秀作者的博客等可能每天都会发
布新的财经文章,所以也可以周期性地抓取预设财经链接对应的财
经网页,如每隔5小时或6小时抓取一次。

在本发明实施例中,预设财经链接中包括种子链接,对种子链
接进行抓取得到财经网页后,需要对抓取到的财经网页进行外链抽
取,抽取出该财经网页中包括的所有内容页链接,判断抽取到的内
容页链接是否符合预设链接模板,若符合,则将该内容页链接存入
外链数据库中以备后续使用。若内容页链接不符合预设模板,则挑
选出该内容页链接,在下一次抓取财经网页时利用爬虫抓取该内容
页链接对应的财经网页。

上述预设链接模板可以为用于判别是否已经抓取过内容页链接
对应的财经网页的正则表达式。若内容页链接符合该预设链接模板,
则确定之前已抓取过该内容页链接对应的财经网页,若不符合,则
确定之前未抓取过该内容页链接对应的财经网页,需在下一次抓取
时抓取该内容页链接对应的财经网页。

S2:对抓取的财经网页进行内容抽取,得到财经网页的结构化
信息,该结构化信息包括发布时间、文章正文、作者信息、阅读次
数及评论次数。

抓取到的财经网页中都包含财经文章的网页来源、文章标题、
文章正文、发布时间、作者名称、财经文章的阅读次数、评论次数
及点赞次数等,有的财经网页中还包含作者的图片和作者的粉丝数
等,财经文章中也可能包含图片等。

对抓取的财经网页进行内容抽取,抽取出财经网页中的网页来
源、文章标题、发布时间、文章正文、财经文章中包含的图片以及
财经文章的阅读次数和评论次数,还抽取出作者的名称、图片及粉
丝数,将抽取出的作者的名称、图片和粉丝数组成作者信息。将抽
取得到的网页来源、文章标题、发布时间、文章正文、作者信息、
财经文章包含的图片、阅读次数及评论次数等组成该财经网页的结
构化信息。

另外,由于读者对财经文章的点赞实质上也是对财经文章的一
种评论,所以在本发明实施例中可以将财经文章的点赞次数与评论
次数进行求和,得到该财经文章的总的评论次数。

S3:从财经网页的结构化信息中过滤掉外站链接对应的部分信
息。

上述外站链接为链接到其他网站的链接。抓取到的财经网页中
可能存在很多外站链接,外站链接对应的文本或图片等信息通常与
财经网页的文章正文无关,因此需要过滤掉外站链接对应的部分信
息。

S4:将过滤剩余的结构化信息作为财经网页的财经文章信息,
将财经网页的财经文章信息存储在财经文库中。

在本发明实施例中,还对结构化信息中包括的作者的图片及财
经文章包含的图片进行处理,将作者的图片及财经文章包含的图片
缩放至预设尺寸比例,以便后续将作者的图片或财经文章包含的图
片作为缩略图显示给用户。

上述步骤S1-S4的操作来抓取网页并提取网页信息的方式,不
仅仅适用于对财经文章的处理,对新闻、购物评论等其他领域的文
章同样适用。

本发明实施例中,通过上述步骤S1-S4的操作周期性地抓取预
设财经链接对应的财经网页,生成抓取到的财经网页对应的财经文
章信息,并将生成的财经文章信息存储在采集文库中。之后,参见
图1B,通过步骤101-103的操作来搜索财经文章。

步骤101:根据浏览器客户端发送的关键词,从预先创建的财
经文库中获取与关键词匹配的财经文章信息。

当用户需要通过浏览器客户端搜索财经文章时,用户在浏览器
客户端中输入关键词,浏览器客户端将用户输入的关键词发送给服
务器。服务器根据浏览器客户端发送的关键词,从预先创建的财经
文库中获取包含该关键词的财经文章信息。

步骤102:根据获取的财经文章信息,生成财经文章信息对应
的索引摘要及为财经文章信息分配类型标签。

上述索引摘要为作为搜索结果时需要显示给用户的简要信息。
生成索引摘要的具体过程如下:

从财经文章信息中获取文章标题、作者信息及发布时间;根据
文章标题、作者信息及发布时间,生成财经文章信息对应的摘要信
息;生成摘要信息与财经文章信息之间的跳转链接;根据摘要信息
与跳转链接,生成财经文章信息对应的索引摘要。

本发明实施例中,还可以从财经文章信息中获取财经文章的网
页来源、阅读次数及财经文章中包含的图片等信息,将获取的文章
标题、作者信息、发布时间、阅读次数及财经文章中包含的图片等
信息组成该财经文章信息对应的摘要信息。将摘要信息与财经文章
信息之间的跳转链接与该摘要信息进行绑定,生成该财经文章信息
对应的索引摘要。

财经文章信息对应的类型标签用于标识财经文章信息的类型,
为财经文章信息分配类型标签的具体过程如下:

从财经文章信息中获取文章标题及文章正文;对文章标题及文
章正文进行文本分析,确定财经文章信息所属的类型;根据确定的
类型,为财经文章信息分配类型标签。

上述确定财经文章信息所属的类型的确定过程包括:

对文章标题及文章正文的结构特征进行分析,确定财经文章信
息是否属于直播类型;和/或,对文章标题及文章正文进行文本分析,
若分析出文章标题及文章正文中包含股票信息,则根据股票信息确
定财经文章信息所属的股票类型;和/或,对文章标题及文章正文进
行文本分析,若分析出文章标题及文章正文中包含情感描述信息,
则根据情感描述信息确定财经文章信息所属的情感类型。

一般直播类型的财经文章的页面结构特征中都包含明显的时间
信息,分析文章标题及文章正文的结构特征可以确定财经文章信息
是否属于直播类型。例如,财经文章的文章标题“11月3日股市直
播”中包含时间信息“11月3日”。

对财经文章信息的文章标题及文章正文进行分析,当检测到文
章标题及文章正文中包含股票名称、股票编号或股票代码等股票信
息时,确定该财经文章信息为股评篇章,此时根据文章标题及文章
正文中包含的股票信息来确定财经文章信息所属的股票类型,股票
类型用于表示该财经文章信息所评论的股票的名称、代码及其所属
的行业及板块等。

通常作者会在财经文章中发表自己的主观观点,如对经济走势
的预测以及对股票涨跌的判断等。作者的主观观点即为财经文章信
息中的情感描述信息,从文章标题及文章正文中获取这些情感描述
信息,识别这些情感描述信息的语义,确定作者所表达的情感倾向,
进而确定该财经文章信息所属的情感类型。例如,识别出情感描述
信息的语义为作者表达对股票后续看涨的判断,则可以确定该财经
文章信息所属的情感类型为“看多声音”。相反地,若识别出情感描
述信息的语义为作者表达对股票后续看跌的判断,则可以确定该财
经文章信息所属的情感类型为“看空声音”。

通过上述方式确定财经文章信息所属的类型后,存在确定出财
经文章信息同时属于多种类型的情况,如财经文章信息同时属于股
票类型和情感类型。在后续对财经文章信息进行分类排序时,对于
同时属于多种类型的财经文章信息,可分别在其所属的不同类型的
财经文章中进行排序。

上述确定财经文章信息所属的类型后,为财经文章信息分配类
型标签的分配过程包括:

当确定财经文章信息属于直播类型时,为财经文章信息分配直
播帖标签;当确定财经文章信息所属的股票类型时,为财经文章信
息分配个股标签及股票类型对应的行业标签和股票板块标签;当确
定财经文章信息所属的情感类型时,为财经文章信息分配情感类型
对应的情感标签。

步骤103:根据财经文章信息对应的类型标签,对财经文章信
息对应的索引摘要进行分类排序,得到关键词对应的搜索结果。

上述分类排序的具体过程包括:

根据财经文章信息,计算财经文章信息的文章特征值;根据财
经文章信息对应的类型标签,对财经文章信息进行分类;根据分类
得到的每类财经文章信息的文章特征值,分别对每类财经文章信息
对应的索引摘要进行排序。

在本发明实施例中,根据财经文章信息,计算财经文章信息的
时效特征值、主题特征值、权威特征值和相关特征值;对时效特征
值、主题特征值、权威特征值和相关特征值进行归一化处理,得到
财经文章信息的文章特征值。

本发明实施例中,预设了不同的时间差区间与时效特征值之间
的对应关系,且时间差越长,其对应的时效特征值就越低。例如,
预设时间差区间与时效特征值之间的对应关系如表1所示。

表1

时间差区间(单位:小时)
时效特征值
(0,12)
10
(12,24)
8
(24,48)
6
……
……

根据财经文章的发布时间来计算财经文章信息的时效特征值,
计算财经文章信息的发布时间与当前时间之间的时间差。确定上述
计算的时间差所在的时间差区间,获取该时间差区间对应的时效特
征值作为该财经文章信息的时效特征值。

在本发明实施例中,根据财经文章信息包括的阅读次数、评论
次数、点赞次数以及文章正文的长度,计算财经文章信息的主题特
征值。其中,阅读次数、评论次数及点赞次数越多,主题特征值越
高,而文章正文的长度小于预设值,则会降低主题特征值。

对于权威特征值的计算,则根据财经文章信息包括的作者信息
进行权威性打分。对于博客作者通过人工标注的方式,标注作者自
身的权威特征值,然后对该作者发布的文章都附上标注的该权威特
征值。对于非博客作者,根据作者信息中包括的粉丝数来计算权威
特征值,粉丝数越多,权威特征值越高。

对于相关特征值的计算,则根据财经文章信息与关键词的匹配
程度来计算。当财经文章信息为股评篇章时,在文章标题或文章正
文手段中出现与关键词匹配的股票信息,则相关特征值越高,文章
正文中提到与关键词匹配的股票信息的次数越多,则相关特征值就
越高。

通过上述方式计算出财经文章信息的时效特征值、主题特征值、
权威特征值及相关特征值之后,将上述四个特征值进行归一化处理,
即按照不同的权重对这四个特征值进行累加,得到该财经文章信息
的文章特征值。

然后根据步骤102中为财经文章信息分配的类型标签对与关键
词匹配的所有财经文章信息进行分类。根据每类财经文章信息中每
个财经文章信息的文章特征值,分别对每类财经文章信息对应的索
引摘要进行排序。

排序时可以按照文章特征值从高到低或从低到高的顺序进行排
序。在本发明实施例中,优选按照文章特征值从高到低的顺序进行
排序。

另外,当浏览器客户端发送的关键词中包括股票信息时,认为
用户需要浏览与该股票信息相关的财经文章来了解股票的走势,由
于股票所属行业的形势对股票的走势有很大影响,所以在本发明实
施例中,还根据该股票信息,获取该股票信息对应的行业文章列表;
生成该行业文章列表中每个行业文章对应的索引摘要;计算该行业
文章列表中每个行业文章的文章特征值,根据每个行业文章的文章
特征值,对每个行业文章对应的索引摘要进行排序;将排序后的每
个行业文章对应的索引摘要与分类排序后的财经文章信息对应的索
引摘要进行合并排序,得到关键词对应的搜索结果。

上述合并排序可以为根据每个行业文章的文章特征值及每个财
经文章信息的文章特征值,按照文章特征值从高到低或从低到高的
顺序进行排序。优选按照从高到低的顺序进行排序。

通过上述步骤101-103的操作得到关键词对应的搜索结果之
后,将关键词对应的搜索结果及预设的展示规则发送给浏览器客户
端,以使浏览器客户端根据预设的展示规则分类显示该搜索结果。

预设的展示规则可以规定在同一界面中展示所有类型,可以规
定每种类型最少展示的索引摘要的个数等。浏览器客户端接收到服
务器发送的搜索结果及预设的展示规则之后,根据预设的展示规则
分类显示搜索结果。

为了便于理解本发明搜索结果分类展示的效果,下面结合附图
1C进行详细说明。如图1C中所示,搜索结果共分为三种类型“看多
声音”、“看空声音”和“文字直播”,其中“看多声音”类型的搜索结果
共有721条,在图1C所示的搜索结果展示界面中仅显示了一条,
该条搜索结果的文章标题为“调整之后还有补涨行情”,作者为“张
三”,网页来源为“财富博客”,发布时间为“2015-10-31”。“看空声
音”类型的搜索结果共有539条,在该搜索结果展示界面中也只显示
了一条,该条搜索结果的文章标题为“缩量下跌意欲何为?”,作者
为“李四”,网页来源为“财富博客”,发布时间为“2015-11-01”。“文
字直播”类型的搜索结果共有135条,在该搜索结果展示界面中也只
显示了一条,该条搜索结果的文章标题为“11月3日股市直播”,作
者为“王二”,网页来源为“财富博客”,发布时间为“2015-11-02”。

本发明实施例中,对与关键词匹配的财经文章信息进行了分类
排序,综合考虑了财经文章的时效性、权威性、与关键词的匹配程
度、文正的主题质量以及作者在文章中的主观情感倾向,如此大大
提高了搜索出的财经文章对读者的参考价值,能够提高搜索出的财
经文章的点击量,且在展示搜索结果时进行结构化数据展示,为读
者提供包括作者图片等更丰富的索引摘要。

在本发明实施例中,根据财经文章信息,为财经文章信息分配
类型标签;根据财经文章信息对应的类型标签,对财经文章信息对
应的索引摘要进行分类排序,得到关键词对应的搜索结果。本发明
为财经文章信息分配了类型标签,并根据类型标签进行了分类排序,
如此得到的搜索结果类型明确,使得浏览器客户端可以分类显示该
搜索结果,用户可以根据财经文章信息的类型进行浏览,提高了搜
索的财经文章的参考性。

实施例2

参见图2,本发明实施例提供了一种搜索财经文章的装置,该
装置用于执行上述实施例1提供的搜索财经文章的方法。该装置具
体包括:

获取模块201,用于根据浏览器客户端发送的关键词,从预先
创建的财经文库中获取与关键词匹配的财经文章信息;

生成模块202,用于根据财经文章信息,生成财经文章信息对
应的索引摘要及为财经文章信息分配类型标签;

排序模块203,用于根据财经文章信息对应的类型标签,对财
经文章信息对应的索引摘要进行分类排序,得到关键词对应的搜索
结果。

上述生成模块202包括:

第一获取单元,用于从财经文章信息中获取文章标题及文章正
文;确定单元,用于对文章标题及文章正文进行文本分析,确定财
经文章信息所属的类型;分配单元,用于根据确定的类型,为财经
文章信息分配类型标签。

其中,确定单元包括:第一确定子单元,用于对文章标题及文
章正文的结构特征进行分析,确定财经文章信息是否属于直播类型;
和/或,第二确定子单元,用于对文章标题及文章正文进行文本分析,
若分析出文章标题及文章正文中包含股票信息,则根据股票信息确
定财经文章信息所属的股票类型;和/或,第三确定子单元,用于对
文章标题及文章正文进行文本分析,若分析出文章标题及文章正文
中包含情感描述信息,则根据情感描述信息确定财经文章信息所属
的情感类型。

在本发明实施例中,生成模块202包括:第二获取单元,用于
从财经文章信息中获取文章标题、作者信息及发布时间;第一生成
单元,用于根据文章标题、作者信息及发布时间,生成财经文章信
息对应的摘要信息;第二生成单元,用于生成摘要信息与财经文章
信息之间的跳转链接;第三生成单元,用于根据摘要信息与跳转链
接,生成财经文章信息对应的索引摘要。

排序模块203包括:计算单元,用于根据财经文章信息,计算
财经文章信息的文章特征值;分类单元,用于根据财经文章信息对
应的类型标签,对财经文章信息进行分类;排序单元,用于根据分
类得到的每类财经文章信息的文章特征值,分别对每类财经文章信
息对应的索引摘要进行排序。

其中,计算单元包括:计算子单元,用于根据财经文章信息,
计算财经文章信息的时效特征值、主题特征值、权威特征值和相关
特征值;归一化子单元,用于对时效特征值、主题特征值、权威特
征值和相关特征值进行归一化处理,得到财经文章信息的文章特征
值。

在本发明实施例中,通过该装置搜索财经文章之前,该装置还
通过财经文库创建模块来创建财经文库。

财经文库创建模块,用于实时抓取预设财经链接对应的财经网
页;对抓取的财经网页进行内容抽取,得到财经网页的结构化信息,
结构化信息包括发布时间、文章正文、作者信息、阅读次数及评论
次数;从财经网页的结构化信息中过滤掉外站链接对应的部分信息;
将过滤剩余的结构化信息作为财经网页的财经文章信息,将财经网
页的财经文章信息存储在财经文库中。

在本发明实施例中,当关键词包括股票信息时,该装置还通过
合并排序模块来获取行业文章列表,并将获取的行业文章列表与搜
索出的与关键词匹配的财经文章信息进行合并。

合并排序模块,用于根据股票信息,获取股票信息对应的行业
文章列表;生成行业文章列表中每个行业文章对应的索引摘要;计
算行业文章列表中每个行业文章的文章特征值,根据每个行业文章
的文章特征值,对每个行业文章对应的索引摘要进行排序;将排序
后的每个行业文章对应的索引摘要与分类排序后的财经文章信息对
应的索引摘要进行合并排序,得到关键词对应的搜索结果。

得到关键词对应的搜索结果后,该装置还通过发送模块将搜素
结果发送给浏览器客户端。发送模块,用于将关键词对应的搜索结
果及预设的展示规则发送给浏览器客户端,以使浏览器客户端根据
预设的展示规则分类显示搜索结果。

在本发明实施例中,根据财经文章信息,为财经文章信息分配
类型标签;根据财经文章信息对应的类型标签,对财经文章信息对
应的索引摘要进行分类排序,得到关键词对应的搜索结果。本发明
为财经文章信息分配了类型标签,并根据类型标签进行了分类排序,
如此得到的搜索结果类型明确,使得浏览器客户端可以分类显示该
搜索结果,用户可以根据财经文章信息的类型进行浏览,提高了搜
索的财经文章的参考性。

实施例3

参见图3,本发明实施例提供了一种服务器,该服务器用于执
行上述实施例1提供的搜索财经文章的方法,该服务器包括处理器
301和存储器302;

处理器301,用于根据浏览器客户端发送的关键词,从预先创
建的财经文库中获取与关键词匹配的财经文章信息;根据财经文章
信息,生成财经文章信息对应的索引摘要及为财经文章信息分配类
型标签;根据财经文章信息对应的类型标签,对财经文章信息对应
的索引摘要进行分类排序,得到关键词对应的搜索结果;

存储器302,用于存储预先创建的财经文库及处理器301的可
执行指令。

处理器301,用于从财经文章信息中获取文章标题及文章正文;
对文章标题及文章正文进行文本分析,确定财经文章信息所属的类
型;根据确定的类型,为财经文章信息分配类型标签。

处理器301确定财经文章信息所属的类型时,处理器301,用
于对文章标题及文章正文的结构特征进行分析,确定财经文章信息
是否属于直播类型;和/或,对文章标题及文章正文进行文本分析,
若分析出文章标题及文章正文中包含股票信息,则根据股票信息确
定财经文章信息所属的股票类型;和/或,对文章标题及文章正文进
行文本分析,若分析出文章标题及文章正文中包含情感描述信息,
则根据情感描述信息确定财经文章信息所属的情感类型。

处理器301生成财经文章信息对应的索引摘要时,处理器301,
用于从财经文章信息中获取文章标题、作者信息及发布时间;根据
文章标题、作者信息及发布时间,生成财经文章信息对应的摘要信
息;生成摘要信息与财经文章信息之间的跳转链接;根据摘要信息
与跳转链接,生成财经文章信息对应的索引摘要。

处理器301对财经文章信息对应的索引摘要进行分类排序时,
处理器301,用于根据财经文章信息,计算财经文章信息的文章特
征值;根据财经文章信息对应的类型标签,对财经文章信息进行分
类;根据分类得到的每类财经文章信息的文章特征值,分别对每类
财经文章信息对应的索引摘要进行排序。

上述处理器301计算财经文章信息的文章特征值时,处理器
301,用于根据财经文章信息,计算财经文章信息的时效特征值、主
题特征值、权威特征值和相关特征值;对时效特征值、主题特征值、
权威特征值和相关特征值进行归一化处理,得到财经文章信息的文
章特征值。

在本发明实施例中,处理器301从预先创建的财经文库中获取
与关键词匹配的财经文章信息之前,处理器301,还用于实时抓取
预设财经链接对应的财经网页;对抓取的财经网页进行内容抽取,
得到财经网页的结构化信息,结构化信息包括发布时间、文章正文、
作者信息、阅读次数及评论次数;从财经网页的结构化信息中过滤
掉外站链接对应的部分信息;将过滤剩余的结构化信息作为财经网
页的财经文章信息,将财经网页的财经文章信息存储在存储器302
中的财经文库中。

在本发明实施例中,当关键词包括股票信息时,处理器301,
还用于根据股票信息,获取股票信息对应的行业文章列表;生成行
业文章列表中每个行业文章对应的索引摘要;计算行业文章列表中
每个行业文章的文章特征值,根据每个行业文章的文章特征值,对
每个行业文章对应的索引摘要进行排序;将排序后的每个行业文章
对应的索引摘要与分类排序后的财经文章信息对应的索引摘要进行
合并排序,得到关键词对应的搜索结果。

本发明实施例中,服务器还包括发送器,该发送器,用于将关
键词对应的搜索结果及预设的展示规则发送给浏览器客户端,以使
浏览器客户端根据预设的展示规则分类显示搜索结果。

在本发明实施例中,根据财经文章信息,为财经文章信息分配
类型标签;根据财经文章信息对应的类型标签,对财经文章信息对
应的索引摘要进行分类排序,得到关键词对应的搜索结果。本发明
为财经文章信息分配了类型标签,并根据类型标签进行了分类排序,
如此得到的搜索结果类型明确,使得浏览器客户端可以分类显示该
搜索结果,用户可以根据财经文章信息的类型进行浏览,提高了搜
索的财经文章的参考性。

本发明实施例所提供的搜索财经文章的装置可以为设备上的特
定硬件或者安装于设备上的软件或固件等。所属领域的技术人员可
以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和
单元的具体工作过程,均可以参考上述方法实施例中的对应过程。

在本申请所提供的几个实施例中,应该理解到,所揭露装置、
服务器和方法,可以通过其它的方式实现。以上所描述的装置实施
例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能
划分,实际实现时可以有另外的划分方式,又例如,多个单元或组
件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或
不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通
信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连
接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分
开的,作为单元显示的部件可以是或者也可以不是物理单元,即可
以位于一个地方,或者也可以分布到多个网络单元上。可以根据实
际的需要选择其中的部分或者全部单元来实现本实施例方案的目
的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处
理单元中,也可以是各个单元单独物理存在,也可以两个或两个以
上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销
售或使用时,可以存储在一个计算机可读取存储介质中。基于这样
的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部
分或者该技术方案的部分可以以软件产品的形式体现出来,该计算
机软件产品存储在一个存储介质中,包括若干指令用以使得一台计
算机设备(可以是个人计算机,服务器,或者网络设备等)执行本
发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包
括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、
随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘
等各种可以存储程序代码的介质。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围
并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技
术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围
之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

一种搜索财经文章的方法、装置及服务器.pdf_第1页
第1页 / 共20页
一种搜索财经文章的方法、装置及服务器.pdf_第2页
第2页 / 共20页
一种搜索财经文章的方法、装置及服务器.pdf_第3页
第3页 / 共20页
点击查看更多>>
资源描述

《一种搜索财经文章的方法、装置及服务器.pdf》由会员分享,可在线阅读,更多相关《一种搜索财经文章的方法、装置及服务器.pdf(20页珍藏版)》请在专利查询网上搜索。

本发明提供了一种搜索财经文章的方法、装置及服务器。其中,该方法包括:根据浏览器客户端发送的关键词,从预先创建的财经文库中获取与关键词匹配的财经文章信息;根据财经文章信息,生成财经文章信息对应的索引摘要及为财经文章信息分配类型标签;根据财经文章信息对应的类型标签,对财经文章信息对应的索引摘要进行分类排序,得到关键词对应的搜索结果。本发明为财经文章信息分配了类型标签,并根据类型标签进行了分类排序,如此。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1