基于景点成分识别的检索结果排序方法、装置、用户终端技术领域
本发明涉及计算机通信技术领域,尤其涉及一种基于景点成分识别的
检索结果排序方法、装置、用户终端。
背景技术
现有旅游类检索大多是基于文本关键词匹配来实现用户对旅游信息的
获取。在具体文本相关性排序上,基本是对旅游信息文档的标题和正文内
容给予不同的权重,继而根据用户查询词在标题和正文上的匹配情况以及
查询词的逆文本频率指数(Inverse Document Frequency,IDF)权重进行加
权打分,进而按此分数对检索结果进行排序。
但对于用户查询串中的词,现有技术只能根据IDF值来区分重要度,
但并不理解其所代表的成分,尤其是该类查询串中的景点成分,其IDF值
不一定高,但却是查询串中最关键的部分,因此,现有技术无法准确地给
出用户期望的检索结果排序,用户体验差。
发明内容
有鉴于此,本发明提供一种基于景点成分识别的检索结果排序方法、
装置、用户终端,能准确地给出用户期望的检索结果排序,用户体验好。
本发明提供一种基于景点成分识别的检索结果排序方法,其包括获取
查询串;对获取的所述查询串进行切词处理;识别进行切词处理后的查询
串中的景点成分;以及进行检索召回,并对包含景点成分的检索结果进行
打分排序处理。
本发明还提供一种基于景点成分识别的检索结果排序装置,所述基于
景点成分识别的检索结果排序装置包括查询串获取模块、切词模块、景点
成分识别模块、检索结果获取及处理模块。所述查询串获取模块用于获取
查询串;所述切词模块用于对获取的所述查询串进行切词处理;所述景点
成分识别模块用于识别进行切词处理后的查询串中的景点成分;所述检索
结果获取及处理模块用于进行检索召回,并对包含景点成分的检索结果进
行打分排序处理。
本发明还提供一种用户终端,用户终端包括基于景点成分识别的检索
结果排序装置,所述基于景点成分识别的检索结果排序装置包括查询串获
取模块、切词模块、景点成分识别模块、检索结果获取及处理模块。所述
查询串获取模块用于获取查询串;所述切词模块用于对获取的所述查询串
进行切词处理;所述景点成分识别模块用于识别进行切词处理后的查询串
中的景点成分;所述检索结果获取及处理模块用于进行检索召回,并对包
含景点成分的检索结果进行打分排序处理。
本发明提供的基于景点成分识别的检索结果排序方法、装置、用户终
端能通过对景点成分的识别准确地给出用户期望的检索结果排序,用户体
验好。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举
较佳实施例,并配合所附图式,作详细说明如下。
附图说明
图1示出一种用户终端的结构图。
图2为本发明第一实施例提供的基于景点成分识别的检索结果排序装
置的结构图。
图3为图2的基于景点成分识别的检索结果排序装置的存储环境示意
图。
图4为本发明第二实施例提供的基于景点成分识别的检索结果排序装
置的结构图。
图5为本发明第三实施例提供的基于景点成分识别的检索结果排序装
置的结构图。
图6为本发明第四实施例提供的用户终端的结构图。
图7为本发明第五实施例提供的基于景点成分识别的检索结果排序方
法的流程图。
图8为本发明第六实施例提供的基于景点成分识别的检索结果排序方
法的流程图。
具体实施方式
为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功
效,以下结合附图及较佳实施例,对依据本发明的具体实施方式、结构、
特征及其功效,详细说明如后。
图1示出了一种用户终端的结构框图。如图1所示,用户终端包括存
储器102、存储控制器104,一个或多个(图中仅示出一个)处理器106、
外设接口108、射频模块110、定位模块112、摄像模块114、音频模块116、
触控屏幕118以及按键模块120。这些组件通过一条或多条通讯总线/信号
线相互通讯。
可以理解,图1所示的结构仅为示意,用户终端还可包括比图1中所
示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的
各组件可以采用硬件、软件或其组合实现。
存储器102可用于存储软件程序以及模块,如本发明实施例中的在用
户终端内进行基于景点成分识别的检索结果排序方法对应的程序指令/模
块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而
执行各种功能应用以及数据处理,即实现上述的在用户终端内进行基于景
点成分识别的检索结果排序方法。
存储器102可包括高速随机存储器,还可包括非易失性存储器,如一
个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些
实例中,存储器102可进一步包括相对于处理器106远程设置的存储器,
这些远程存储器可以通过网络连接至用户终端。上述网络的实例包括但不
限于互联网、企业内部网、局域网、移动通信网及其组合。处理器106以
及其他可能的组件对存储器102的访问可在存储控制器104的控制下进行。
外设接口108将各种输入/输出装置耦合至CPU以及存储器102。处理
器106运行存储器102内的各种软件、指令以执行用户终端的各种功能以
及进行数据处理。
在一些实施例中,外设接口108,处理器106以及存储控制器104可以
在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
射频模块110用于接收以及发送电磁波,实现电磁波与电信号的相互
转换,从而与通讯网络或者其他设备进行通讯。射频模块110可包括各种
现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信
号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。射频
模块110可与各种网络如互联网、企业内部网、无线网络进行通讯或者通
过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、
无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及
技术,包括但并不限于全球移动通信系统(Global System for Mobile
Communication,GSM)、增强型移动通信技术(Enhanced Data GSM
Environment,EDGE),宽带码分多址技术(wideband code division multiple
access,W-CDMA),码分多址技术(Code division access,CDMA)、时分多
址技术(time division multiple access,TDMA),蓝牙,无线保真技术(Wireless,
Fidelity,WiFi)(如美国电气和电子工程师协会标准IEEE 802.11a,IEEE
802.11b,IEEE802.11g和/或IEEE 802.11n)、网络电话(Voice over internet
protocal,VoIP)、全球微波互联接入(Worldwide Interoperability for Microwave
Access,Wi-Max)、其他用于邮件、即时通讯及短消息的协议,以及任何
其他合适的通讯协议,甚至可包括那些当前仍未被开发出来的协议。
定位模块112用于获取用户终端的当前位置。定位模块112的实例包
括但不限于全球卫星定位系统(GPS)、基于无线局域网或者移动通信网的
定位技术。
摄像模块114用于拍摄照片或者视频。拍摄的照片或者视频可以存储
至存储器102内,并可通过射频模块110发送。
音频模块116向用户提供音频接口,其可包括一个或多个麦克风、一
个或者多个扬声器以及音频电路。音频电路从外设接口108处接收声音数
据,将声音数据转换为电信息,将电信息传输至扬声器。扬声器将电信息
转换为人耳能听到的声波。音频电路还从麦克风处接收电信息,将电信号
转换为声音数据,并将声音数据传输至外设接口108中以进行进一步的处
理。音频数据可以从存储器102处或者通过射频模块110获取。此外,音
频数据也可以存储至存储器102中或者通过射频模块110进行发送。在一
些实例中,音频模块116还可包括一个耳机播孔,用于向耳机或者其他设
备提供音频接口。
触控屏幕118在用户终端与用户之间同时提供一个输出及输入界面。
具体地,触控屏幕118向用户显示视频输出,这些视频输出的内容可包括
文字、图形、视频、及其任意组合。一些输出结果是对应于一些用户界面
对象。触控屏幕118还接收用户的输入,例如用户的点击、滑动等手势操
作,以便用户界面对象对这些用户的输入做出响应。检测用户输入的技术
可以是基于电阻式、电容式或者其他任意可能的触控检测技术。触控屏幕
118显示单元的具体实例包括但并不限于液晶显示器或发光聚合物显示器。
按键模块120同样提供用户向用户终端进行输入的接口,用户可以通
过按下不同的按键以使用户终端执行不同的功能。
第一实施例
图2为本发明第一实施例提供的基于景点成分识别的检索结果排序装
置的结构图。如图2所示,基于景点成分识别的检索结果排序装置20包括
查询串获取模块201、切词模块202、景点成分识别模块203、检索结果获
取及处理模块204。
其中,查询串获取模块201用于获取查询串。
具体地,可以但不限于根据用户利用按键或触控屏幕输入的字符获取
查询串,也可以通过其它方式获取查询串例如语音输入等等。
其中,切词模块202用于对获取的所述查询串进行切词处理。
具体地,切词处理是指将查询串例如一个汉字序列或多个汉子序列切
分成一个一个单独的词。例如将查询串“杭州西湖”切分成“杭州/西湖”
两个词,将查询串“国庆去旅游,一路经过昆明,丽江”切分成“国庆/去/
旅游/,一路/经过/昆明/,丽江”,将查询串“从北京到深圳玩”切分成“从
/北京/到/深圳/玩”等等。
其中,景点成分识别模块203用于识别进行切词处理后的查询串中的
景点成分。
例如,将“杭州/西湖”中的“杭州”和“西湖”识别为景点成分;将
“国庆/去/旅游/,一路/经过/昆明/,丽江”中的“昆明”和“丽江”识别为
景点成分;将“从/北京/到/深圳/玩”中的“北京”和“深圳”识别为景点
成分。
其中,检索结果获取及处理模块204用于进行检索召回,并对包含景
点成分的检索结果进行打分排序处理。
具体地,可以但不限于对包含景点成分的检索结果进行加权打分处理,
以使得包含景点成分的检索结果排在前面。
以上各个模块可以是由软件代码实现,此时,上述的各模块可存储于
存储器102内,如图3所示。以上各模块同样可以由硬件例如集成电路芯
片实现。
基于景点成分识别的检索结果排序装置20,将查询串进行切词处理后
进行景点成分的识别,能准确地给出用户期望的检索结果排序,用户体验
好。
第二实施例
图4为本发明第二实施例提供的基于景点成分识别的检索结果排序装
置的结构图。如图4所示,基于景点成分识别的检索结果排序装置40包括
查询串获取模块401、切词模块402、景点及区划关联表获取模块403、景
点成分识别模块404、景点成分分析模块405、检索结果获取及处理模块406。
其中,查询串获取模块401用于获取查询串。
具体地,可以但不限于根据用户利用按键或触控屏幕输入的字符获取
查询串,也可以通过其它方式获取查询串例如语音输入等等。
其中,切词模块402用于对获取的所述查询串进行切词处理。
具体地,切词处理是指将查询串例如一个汉字序列或多个汉子序列切
分成一个一个单独的词。例如将查询串“杭州西湖”切分成“杭州/西湖”
两个词,将查询串“国庆去旅游,一路经过昆明,丽江”切分成“国庆/去/
旅游/,一路/经过/昆明/,丽江”,将查询串“从北京到深圳玩”切分成“从
/北京/到/深圳/玩”等等。
其中,景点及区划关联表获取模块403用于获取并存储景点及区划关
联表。
具体地,可以获取各个网站编辑整理的景点/景区及其关系图片,并进
行校验后获取景点及区划关联表。
其中,景点成分识别模块404用于识别进行切词处理后的查询串中的
景点成分。
例如,将“杭州/西湖”中的“杭州”和“西湖”识别为景点成分;将
“国庆/去/旅游/,一路/经过/昆明/,丽江”中的“昆明”和“丽江”识别为
景点成分;将“从/北京/到/深圳/玩”中的“北京”和“深圳”识别为景点
成分。
其中,景点成分分析模块405用于分析进行切词处理后的查询串中的
景点成分之间的关系。
具体地,可以但不限于根据进行切词处理后的查询串及景点及区划关
联表分析景点成分之间的关系例如隶属关系、并列关系、始发终到关系等
等。
例如“杭州/西湖”中“西湖”隶属于“杭州”,属于隶属关系;“国庆/
去/旅游/,一路/经过/昆明/,丽江”中“昆明”和“丽江”是并联关系;“从
/北京/到/深圳/玩”中“北京”和“深圳”是始发终到关系。
其中,检索结果获取及处理模块406用于进行检索召回,并对包含景
点成分的检索结果进行打分排序处理。
具体地,可以但不限于根据景点成分之间的关系使用对应的打分排序
策略。
本发明的基于景点成分识别的检索结果排序装置40,将查询串进行切
词处理后进行景点成分的识别后对景点成分之间的关系进行分析,且根据
景点成分之间的关系使用对应的打分排序策略,能更进一步准确地给出用
户期望的检索结果排序,用户体验好。
第三实施例
图5为本发明第三实施例提供的基于景点成分识别的检索结果排序装
置的结构图。如图5所示,基于景点成分识别的检索结果排序装置50包括
查询串获取模块501、切词模块502、景点及区划关联表获取模块503、景
点成分识别模块504、景点成分分析模块505、检索结果获取及处理模块506。
其中,检索结果获取及处理模块506包括第一处理单元516、第二处理
单元526、第三处理单元536。
第一处理单元516用于在景点成分之间属于隶属关系时,对包含隶属
上位的景点成分的检索结果进行过滤处理,对包含隶属下位的景点成分的
检索结果进行加权打分处理。
具体地,例如“杭州/西湖”中“西湖”隶属于“杭州”,因此,对包含
隶属上位的“西湖”的检索结果进行过滤处理,对包含隶属下位的“杭州”
的检索结果进行加权打分处理。当然,也可以将包含隶属上位的“西湖”
的检索结果排在检索结果的后面等等。
第二处理单元526用于在景点成分之间属于并列关系时,对包含景点
成分的检索结果均进行加权打分处理。
具体地,例如“国庆/去/旅游/,一路/经过/昆明/,丽江”中“昆明”和
“丽江”是并联关系,对包含“昆明”和“丽江”的检索结果均进行加权处
理。
第三处理单元536用于在景点成分之间属于始发终到关系时,对包含
始发地景点成分的检索结果进行过滤处理,对包括终到地景点成分的检索
结果进行加权打分处理。
具体地,例如“从/北京/到/深圳/玩”中“北京”和“深圳”是始发终到
关系,对包含始发地“北京”的检索结果进行过滤处理,对包括终到地“深
圳”的检索结果进行加权打分处理。
优选地,检索结果获取及处理模块506还包括第四处理单元546。
第四处理单元546用于根据阅读量、转发数、发布时间因子中的一个
或多个因子的组合对包含景点成分的检索结果进行打分排序处理。
本实施例基于景点成分识别的检索结果排序装置50的查询串获取模块
501、切词模块502、景点及区划关联表获取模块503、景点成分识别模块
504、景点成分分析模块505实现各自功能的具体过程,请参见图1至图4
所示实施例中描述的具体内容,在此不再赘述。
本发明的基于景点成分识别的检索结果排序装置50,将查询串进行切
词处理后进行景点成分的识别后对景点成分之间的关系进行分析,且根据
景点成分之间的关系使用对应的打分排序策略,能更进一步准确地给出用
户期望的检索结果排序,用户体验好。
第四实施例
图6为本发明第四实施例提供的用户终端的结构图。如图6所示,用
户终端包括如图2所示的基于景点成分识别的检索结果排序装置。
本实施例基于景点成分识别的检索结果排序装置中各个模块实现各自
功能的具体过程,请参见图2所示实施例中描述的具体内容,在此不再赘
述。
用户终端将查询串进行切词处理后进行景点成分的识别,能准确地给
出用户期望的检索结果排序,用户体验好。
第五实施例
图7为本发明第五实施例提供的基于景点成分识别的检索结果排序方
法的流程图。如图7所示的基于景点成分识别的检索结果排序方法应用于
如图2所示的基于景点成分识别的检索结果排序装置20,基于景点成分识
别的检索结果排序方法包括如下步骤:
步骤S71:获取查询串。
具体地,可以但不限于根据用户利用按键或触控屏幕输入的字符获取
查询串,也可以通过其它方式获取查询串例如语音输入等等。
步骤S72:对获取的所述查询串进行切词处理。
具体地,切词处理是指将查询串例如一个汉字序列或多个汉子序列切
分成一个一个单独的词。例如将查询串“杭州西湖”切分成“杭州/西湖”
两个词,将查询串“国庆去旅游,一路经过昆明,丽江”切分成“国庆/去/
旅游/,一路/经过/昆明/,丽江”,将查询串“从北京到深圳玩”切分成“从
/北京/到/深圳/玩”等等。
步骤S73:识别进行切词处理后的查询串中的景点成分。
例如,将“杭州/西湖”中的“杭州”和“西湖”识别为景点成分;将
“国庆/去/旅游/,一路/经过/昆明/,丽江”中的“昆明”和“丽江”识别为
景点成分;将“从/北京/到/深圳/玩”中的“北京”和“深圳”识别为景点
成分。
步骤S74:进行检索召回,并对包含景点成分的检索结果进行打分排序
处理。
具体地,可以但不限于对包含景点成分的检索结果进行加权打分处理,
以使得包含景点成分的检索结果排在前面。
基于景点成分识别的检索结果排序方法,将查询串进行切词处理后进
行景点成分的识别,能准确地给出用户期望的检索结果排序,用户体验好。
第六实施例
图8为本发明第六实施例提供的基于景点成分识别的检索结果排序方
法的流程图。如图8所示,基于景点成分识别的检索结果排序方法包括如
下步骤:
步骤S81:获取查询串;
步骤S82:对获取的所述查询串进行切词处理;
步骤S83:获取并存储景点及区划关联表;
具体地,可以获取各个网站编辑整理的景点/景区及其关系图片,并进
行校验后获取景点及区划关联表。
其中,获取并并存储景点及区划关联表也可以在步骤S81之前。
步骤S84:识别进行切词处理后的查询串中的景点成分;
例如,将“杭州/西湖”中的“杭州”和“西湖”识别为景点成分;将
“国庆/去/旅游/,一路/经过/昆明/,丽江”中的“昆明”和“丽江”识别为
景点成分;将“从/北京/到/深圳/玩”中的“北京”和“深圳”识别为景点
成分。
步骤S85:分析进行切词处理后的查询串中的景点成分之间的关系;
具体地,可以但不限于根据进行切词处理后的查询串及景点及区划关
联表分析景点成分之间的关系例如隶属关系、并列关系、始发终到关系等
等。
例如“杭州/西湖”中“西湖”隶属于“杭州”,属于隶属关系;“国庆/
去/旅游/,一路/经过/昆明/,丽江”中“昆明”和“丽江”是并联关系;“从/
北京/到/深圳/玩”中“北京”和“深圳”是始发终到关系。
步骤S86:进行检索召回,并对包含景点成分的检索结果进行打分排序
处理。
优选地,步骤S86包括若景点成分之间属于隶属关系,则对包含隶属
上位的景点成分的检索结果进行过滤处理,对包含隶属下位的景点成分的
检索结果进行加权打分处理。
具体地,例如“杭州/西湖”中“西湖”隶属于“杭州”,因此,对包含
隶属上位的“西湖”的检索结果进行过滤处理,对包含隶属下位的“杭州”
的检索结果进行加权打分处理。当然,也可以将包含隶属上位的“西湖”
的检索结果排在检索结果的后面等等。
优选地,步骤S86包括若景点成分之间属于并列关系,则对包含景点
成分的检索结果均进行加权打分处理。
具体地,例如“国庆/去/旅游/,一路/经过/昆明/,丽江”中“昆明”和
“丽江”是并联关系,对包含“昆明”和“丽江”的检索结果均进行加权处
理。
优选地,步骤S86包括若景点成分之间属于始发终到关系,则对包含
始发地景点成分的检索结果进行过滤处理,对包括终到地景点成分的检索
结果进行加权打分处理。
具体地,例如“从/北京/到/深圳/玩”中“北京”和“深圳”是始发终到
关系,对包含始发地“北京”的检索结果进行过滤处理,对包括终到地“深
圳”的检索结果进行加权打分处理。
优选地,步骤S86还包括根据阅读量、转发数、发布时间因子中的一
个或多个因子的组合对包含景点成分的检索结果进行打分排序处理。
本发明的基于景点成分识别的检索结果排序方法,将查询串进行切词
处理后进行景点成分的识别后对景点成分之间的关系进行分析,且根据景
点成分之间的关系使用对应的打分排序策略,能更进一步准确地给出用户
期望的检索结果排序,用户体验好。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每
个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同
相似的部分互相参见即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用
来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者
暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语
“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得
包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还
包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或
者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”
限定的要素,并不排除在包括要素的过程、方法、物品或者装置中还存在
另外的相同要素。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以
通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可
以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存
储器,磁盘或光盘等。
以上,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的
限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,
任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用
上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡
是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作
的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。