一种旅游线路的推荐方法以及装置.pdf

上传人:1*** 文档编号:6180861 上传时间:2019-05-17 格式:PDF 页数:28 大小:8.17MB
返回 下载 相关 举报
摘要
申请专利号:

CN201210365302.X

申请日:

2012.09.26

公开号:

CN103678429A

公开日:

2014.03.26

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20120926|||公开

IPC分类号:

G06F17/30; G06Q50/14(2012.01)I

主分类号:

G06F17/30

申请人:

阿里巴巴集团控股有限公司

发明人:

王鹏飞

地址:

英属开曼群岛大开曼资本大厦一座四层847号邮箱

优先权:

专利代理机构:

北京润泽恒知识产权代理有限公司 11319

代理人:

苏培华

PDF下载: PDF下载
内容摘要

本申请公开了一种旅游线路的推荐方法以及装置,用于解决现有的旅游推荐服务推荐的旅游景点零散、旅游线路单一的问题。提供的旅游线路的推荐方法,包括:服务器接收客户端提交的旅游线路搜索请求;根据搜索请求携带的搜索条件,搜索符合搜索条件的旅游景点;根据搜索到的各旅游景点的描述信息以及旅游天数,对旅游景点进行聚类处理;并将旅游景点的聚类结果推荐给客户端。采用该技术方案,能够智能化地根据用户的搜索条件反馈旅游景点的搜索结果,通过聚类处理提高了旅游景点之间的关联性,实现了零散旅游景点向关联旅游景点的转变,并且能够实现动态搜索,避免了旅游景点单一的问题。

权利要求书

权利要求书
1.  一种旅游线路的推荐方法,其特征在于,包括:
服务器接收客户端提交的旅游线路搜索请求;
根据所述搜索请求携带的搜索条件,搜索符合所述搜索条件的旅游景点;
根据搜索到的各旅游景点的描述信息以及旅游天数,对所述旅游景点进行聚类处理;并
将旅游景点的聚类结果推荐给所述客户端。

2.  如权利要求1所述的方法,其特征在于,所述搜索条件包括地理位置信息、旅游景点名称以及旅游景点的属性信息中的至少一个条件;
根据所述搜索请求携带的搜索条件,搜索符合所述搜索条件的旅游景点,包括:
若所述搜索条件中包括一个条件,则搜索符合该条件的旅游景点;
若所述搜索条件中包括两个以上的条件,则根据所述搜索条件中包括的每个条件,分别搜索符合对应条件的旅游景点,并选择根据每个条件搜索到的旅游景点中的共有旅游景点。

3.  如权利要求2所述的方法,其特征在于,
所述搜索条件包括地理位置信息条件时,搜索符合该条件的旅游景点,包括:搜索位于所述地理位置信息对应的地理位置的旅游景点;
所述搜索条件包括旅游景点的属性信息时,搜索符合该条件的旅游景点,包括:搜索对应的属性中包括所述属性信息对应的属性的旅游景点;
所述搜索条件包括旅游景点名称时,搜索符合该条件的旅游景点,包括:搜索所述旅游景点名称对应的旅游景点以及与该旅游景点关联的旅游景点;其中,与该旅游景点关联的旅游景点为地理位置与该旅游景点临近的旅游景点、或预设的包括该旅游景点的旅游线路中的旅游景点。

4.  如权利要求1所述的方法,其特征在于,根据搜索到的各旅游景点的描述信息以及旅游天数,对所述旅游景点进行聚类处理之前,还包括:
按照设定的筛选条件,对搜索到的旅游景点进行筛选。

5.  如权利要求4所述的方法,其特征在于,所述筛选条件包括如下中的至少一个条件:
筛除地理位置重复的旅游景点;
筛除缺少描述信息的旅游景点;
筛除景点滞留时间大于旅游天数的设定百分比的旅游景点。

6.  如权利要求1或4所述的方法,其特征在于,根据搜索到的各旅游景点的描述信息以及旅游天数,对所述旅游景点进行聚类处理,包括:
根据搜索到的各旅游景点的描述信息包括的景点地理位置,将地理位置位于设定范围内的旅游景点确定为一组;并
判断旅游景点的组数是否大于旅游天数;
若是,则根据各组旅游景点包括的旅游景点的描述信息,对相似的旅游景点组进行合并,直到旅游景点的组数不大于旅游天数,其中,合并后的一组旅游景点为一天的旅游线路;
若否,则针对每个旅游景点组,根据组内旅游景点的描述信息,确定出一条旅游线路,其中,一组旅游景点为一天的旅游线路或至少连续两天的旅游线路。

7.  如权利要求6所述的方法,其特征在于,根据各组旅游景点包括的旅游景点的描述信息,对相似的旅游景点组进行合并,包括:
根据各组旅游景点包括的旅游景点的描述信息,确定旅游景点组两两之间的相似度,并将相似度大于第一设定阈值的两个旅游景点组合并为一组。

8.  如权利要求7所述的方法,其特征在于,根据两组旅游景点包括的旅游景点的描述信息,确定该两组旅游景点组之间的相似度,包括:
根据两组旅游景点包括的旅游景点的描述信息包括的景点地理位置,确定两组旅游景点之间的距离;
若确定出的距离大于第二设定阈值,则确定该两组旅游景点之间的相似度 为设定的最小相似度值;
若确定出的距离不大于所述第二设定阈值,则根据两组旅游景点中各旅游景点的描述信息,计算该两组旅游景点的相似度,其中,该描述信息包括景点地理位置,或包括景点地理位置和景点滞留时间。

9.  如权利要求8所述的方法,其特征在于,根据两组旅游景点中各旅游景点的描述信息,计算该两组旅游景点的相似度,包括:
确定所述两组旅游景点中包括的旅游景点的总数量;
若所述数量小于第三设定阈值,则根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置,计算对应不同旅游景点组的旅游景点之间距离的相似度;
若所述数量大于第四设定阈值,则根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置和滞留时间,计算对应不同旅游景点组的旅游景点之间距离和滞留时间的相似度,并对该相似度乘以设定的小于1的系数;
若所述数量在所述第三设定阈值以及所述第四设定阈值以内,则根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置和滞留时间,计算对应不同旅游景点组的旅游景点之间距离和滞留时间的相似度;
其中,旅游景点之间的距离根据旅游景点的地理位置确定,所述第四设定阈值大于所述第三设定阈值。

10.  如权利要求9所述的方法,其特征在于,根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置,计算对应不同旅游景点组的旅游景点之间距离的相似度,通过如下公式:
Sim(ha,hb)=(Σi=1nΣj=1mdis[ha(i),hb(j)])2-factor2]]>
根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置和滞留时间,计算对应不同旅游景点组的旅游景点之间距离和滞留时间的相似度,通过如下公式:
Sim(ha,hb)=(Σi=1nΣj=1mdis[ha(i),hb(j)])2-{Σi=1ntimestay[ha(i)]+Σj=1mtimestay[hb(j)]}2-factor2]]>
其中:
ha与hb分别表示两组旅游景点,n为旅游景点组ha中包括的旅游景点数,m为旅游景点组hb中包括的旅游景点数;
dis[ha(i),hb(j)]表示游景点组ha中第i个旅游景点与旅游景点组hb中第j个旅游景点的距离,其中,i∈[1,n],j∈[1,m];
timestay[ha(i)]表示旅游景点组ha中第i个旅游景点的滞留时间;
timestay[hb(j)]表示旅游景点组hb中第j个旅游景点的滞留时间;
factor为0或设定值。

11.  如权利要求6所述的方法,其特征在于,将旅游景点的聚类结果推荐给所述客户端之前,还包括:
针对每组旅游景点,确定完成该组旅游景点耗费的总时间;并
根据该组旅游景点的计划旅游时间以及该组旅游景点耗费的总时间,对该组内的旅游景点进行优化处理,使该组旅游景点的计划旅游时间与该组旅游景点耗费的总时间的差值小于设定值。

12.  如权利要求11所述的方法,其特征在于,确定完成该组旅游景点耗费的总时间,包括:
根据该组中各旅游景点的游玩顺序,确定相邻旅游景点之间的距离;
根据各相邻旅游景点之间的距离以及对应的出行方式,确定耗费在相邻旅游景点路径上的时间;
将耗费在各相邻旅游景点路径上的时间、各旅游景点的滞留时间的总和,确定为完成该组旅游景点耗费的总时间。

13.  如权利要求11所述的方法,其特征在于,根据设定的每日旅游时间以及该组旅游景点耗费的总时间,对该组内的旅游景点进行优化处理,包括:
若设定的每日旅游时间大于该组旅游景点耗费的总时间的差值大于所述 设定值,则增加该组内的旅游景点;
若设定的每日旅游时间小于该组旅游景点耗费的总时间的差值大于所述设定值,则减少该组内的旅游景点。

14.  如权利要求11所述的方法,其特征在于,将旅游景点的聚类结果推荐给所述客户端之前,还包括:
确定对搜索到的旅游景点执行所述聚类处理以及优化处理的次数达到设定次。

15.  一种旅游线路的推荐装置,其特征在于,包括:
搜索请求接收单元,用于接收客户端提交的旅游线路搜索请求;
搜索引擎单元,用于根据所述搜索请求接收单元接收的搜索请求携带的搜索条件,搜索符合所述搜索条件的旅游景点;
搜索结果处理单元,用于根据所述搜索引擎单元搜索到的各旅游景点的描述信息以及旅游天数,对所述旅游景点进行聚类处理;
搜索结果反馈单元,用于将所述搜索结果处理单元处理后的旅游景点的聚类结果推荐给所述客户端。

说明书

说明书一种旅游线路的推荐方法以及装置
技术领域
本申请涉及互联网技术领域,尤其涉及一种旅游线路的推荐方法以及装置。
背景技术
随着人们生活质量的提高,度假休闲等旅游需求急剧增加,外出旅游人数增长较快。对于旅游人士来说,如何找到贴切、便捷的旅游出行指导、线路导航服务,如何实现知性旅游是众多出行者考虑的问题。
目前,常见的旅游指导服务多是基于书籍、地图、网站介绍、旅行社定制等,这些旅行方式存在如下问题:
无论书籍、地图或是网站,一般主要提供旅游景点介绍或推荐服务,用户只能获得一些零散的旅游景点信息,如果用户希望游玩多个景点,需要根据获得的零散的旅游景点信息自行分析旅游线路。虽然目前也有一些网站或旅行社能够提供旅游线路推荐的服务,但是这些旅游线路一般是由网站维护人员确定并导入,旅游线路单一,并且对于用户输入的搜索条件也存在很大限制,如果未保存包括用户输入的旅游景点的旅游线路,则无法向用户推荐旅游线路,可能只能向用户反馈该旅游景点的相关信息。
综上所述,现有的旅游推荐服务存在推荐的旅游景点零散、旅游线路单一的问题,通常都不能满足用户的旅游需求,用户可能需要反复搜索多次才能确定旅游线路,因此,亟需一种智能化的旅游推荐系统。
发明内容
有鉴于此,本申请实施例提供一种旅游线路的推荐方法以及装置,用于解 决现有的旅游推荐服务推荐的旅游景点零散、旅游线路单一的问题。
本申请实施例通过如下技术方案实现:
根据本申请实施例的一个方面,提供了一种旅游线路的推荐方法,包括:
服务器接收客户端提交的旅游线路搜索请求;
根据所述搜索请求携带的搜索条件,搜索符合所述搜索条件的旅游景点;
根据搜索到的各旅游景点的描述信息以及旅游天数,对所述旅游景点进行聚类处理;并
将旅游景点的聚类结果推荐给所述客户端。
根据本申请实施例的另一个方面,还提供了一种旅游线路的推荐装置,包括:
搜索请求接收单元,用于接收客户端提交的旅游线路搜索请求;
搜索引擎单元,用于根据所述搜索请求接收单元接收的搜索请求携带的搜索条件,搜索符合所述搜索条件的旅游景点;
搜索结果处理单元,用于根据所述搜索引擎单元搜索到的各旅游景点的描述信息以及旅游天数,对所述旅游景点进行聚类处理;
搜索结果反馈单元,用于将所述搜索结果处理单元处理后的旅游景点的聚类结果推荐给所述客户端。
通过本申请实施例提供的上述至少一个技术方案,服务器能够根据用户提交的搜索条件,动态搜索符合用户的搜索条件的旅游景点,并且为了进一步提高搜索结果与用户搜索条件的匹配度,能够进一步根据搜索到的旅游景点的描述信息以及旅游天数,对符合搜索条件的旅游景点进行聚类处理,从而能够智能化地根据用户的搜索条件反馈旅游景点的搜索结果,与现有技术相比,通过聚类处理提高了旅游景点之间的关联性,实现了零散旅游景点向关联旅游景点的转变,并且能够实现动态搜索,避免了旅游景点单一的问题。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可 通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本申请的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中:
图1为本申请实施例一提供的推荐旅游线路的流程示意图;
图2为本申请实施例一提供的对搜索到的旅游景点进行聚类处理的流程示意图;
图3为本申请实施例一提供的确定两组旅游景点之间的相似度的流程示意图;
图4为本申请实施例一提供的计算两组旅游景点的相似度的流程示意图;
图5为本申请实施例一提供的一组旅游景点组的聚类结果优化的流程示意图;
图6为本申请实施例二提供的旅游线路推荐系统的逻辑结构示意图;
图7为本申请实施例二提供的算法模块603C对搜索结果进行处理的流程示意图;
图8为本申请实施例三提供的旅游线路的推荐装置的一个结构示意图;
图9为本申请实施例三提供的旅游线路的推荐装置的又一个结构示意图;
图10为本申请实施例三提供的旅游线路的推荐装置的又一个结构示意图;
图11为本申请实施例三提供的旅游线路的推荐装置的又一个结构示意图。
具体实施方式
为了给出智能推荐旅游线路的实现方案,本申请实施例提供了一种旅游线路的推荐方法,该技术方案可以应用于旅游线路搜索的过程。以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅 用于说明和解释本申请,并不用于限定本申请。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例一
本申请实施例一提供了一种旅游线路的推荐方法,该推荐方法能够根据用户提交的搜索请求智能化地为用户推荐旅游线路。该方法可以应用于网络侧的服务器中,尤其适用于提供旅游服务或信息资源类的服务器中。用户可以根据自身的旅游需求,通过客户端向服务器提交旅游线路搜索请求,服务器基于该搜索请求,向用户推荐旅游线路。以下结合图1示出的推荐旅游线路的流程示意图,对服务器向用户推荐旅游线路的过程进行详细说明。
如图1所示,该旅游线路的推荐方法,主要包括如下步骤101至步骤104:
步骤101、服务器接收用户提交的旅游线路搜索请求。
该步骤中,接收的旅游线路搜索请求中携带搜索条件,作为本申请的优选实施方式,用户可以在服务器提供的旅游推荐服务页面手动输入搜索条件,该方式可以减少对用户搜索条件的限制;用户也可以在服务器提供的旅游推荐服务页面上选择页面上显示的搜索条件,该方式可以减少用户的输入操作,为用户提供便利。
步骤102、服务器根据该搜索请求携带的搜索条件,搜索符合该搜索条件的旅游景点。
该步骤中,搜索请求携带的搜索条件可以为一个或多个,如果搜索请求中只包括一个条件,则搜索符合该条件的旅游景点即可,如果搜索请求中包括两个以上的条件,则可以根据搜索条件中包括的每个条件,分别搜索符合对应条件的旅游景点,并进一步选择根据每个条件搜索到的旅游景点中的共有旅游景点,或在每个条件的搜索结果中出现至少两次的旅游景点。
步骤103、服务器根据搜索到的各旅游景点的描述信息以及旅游天数,对旅游景点进行聚类处理。
该步骤中,旅游景点的描述信息主要包括旅游景点的地理位置信息,如旅 游景点的地址信息或GPS(Global Positioning System,全球定位系统)信息,还可以包括旅游景点的滞留时间,即游玩该旅游景点所需要的时间,该时间通常可以根据旅游景点的大小确定。当然,旅游景点的描述信息还可以包括对旅游景点的介绍等信息,此处不再一一列举。
步骤104、服务器将旅游景点的聚类结果推荐给客户端。
至此,服务器向用户推荐旅游景点的流程结束。
作为本申请优选实施例,为了满足不同用户的不同需求,本申请支持对不同搜索条件的搜索,即用户提交的旅游线路搜索请求中可以包括各类搜索条件,并且搜索条件可以为一个或多个,例如,该搜索条件包括地理位置信息、旅游景点名称以及旅游景点的属性信息中的至少一个条件。更进一步地,地理位置信息可以根据用户希望旅游的范围而确定,例如,可以为省份名称、城市名称或区县名称,当然也可以为国家名称。旅游景点的属性信息可以为旅游景点的描述信息,如旅游景点的类型,也可以为用户为该旅游景点添加的标签,例如,旅游景点A适合度蜜月,则可以为该旅游景点添加标签“蜜月景点”,该标签可以作为该旅游景点的属性信息。旅游景点B冬天气候温暖,适合冬天旅游,则可以为该旅游景点添加标签“冬日游景点”,该标签可以作为该旅游景点的属性信息。
为了进一步清楚地理解本申请实施例,以下对搜索条件分别为地理位置信息、旅游景点名称、旅游景点的属性信息时,上述步骤102中服务器的搜索过程进行说明。
当搜索条件包括地理位置信息条件时,搜索符合该条件的旅游景点,包括:搜索位于地理位置信息对应的地理位置的旅游景点。例如,搜索条件为城市名“北京”,则可以搜索位于“北京”的各旅游景点。
当搜索条件包括旅游景点的属性信息时,搜索符合该条件的旅游景点,包括:搜索对应的属性中包括属性信息对应的属性的旅游景点。例如,搜索条件为“冬日游”,则服务器可以搜索带有“冬日游”属性的旅游景点,该属性可 以为旅游景点的描述信息,也可以为用户添加的标签。
当搜索条件包括旅游景点名称时,搜索符合该条件的旅游景点,包括:搜索该旅游景点名称对应的旅游景点以及与该旅游景点关联的旅游景点;其中,与该旅游景点关联的旅游景点为地理位置与该旅游景点临近的旅游景点、或预设的包括该旅游景点的旅游线路中的旅游景点。例如,用户输入的搜索条件为“故宫”,则可以搜索“故宫”及其周边的景点,如天安门、颐和园等,或者搜索包括故宫的旅游线路,如包括故宫、长城、圆明园等景点的旅游线路。
作为本申请的优选实施方式,能够上述步骤102搜索到的符合搜索条件的旅游景点的数量进行优化,例如,当符合用户输入的搜索条件的旅游景点数量较为庞大时,服务器可以添加限制条件以限制搜索结果中旅游景点的数量,该限制条件可以灵活设置,例如可以为旅游景点的数量限制、也可以为游客访问量限制等;当符合用户输入的搜索条件的旅游景点数量较少时,则可以自动填补与搜索到的旅游景点临近的旅游景点,或知名度更高的旅游景点。
本申请实施例中,服务器向用户推荐旅游线路的一个重要处理方式在于上述步骤103,即服务器对搜索到的旅游景点进行聚类处理的过程,以下对此进行详细说明。
作为本申请的优选实施方式,为了提高聚类处理效率,可以对步骤102的搜索结果进行精简,即在根据搜索到的各旅游景点的描述信息以及旅游天数,对旅游景点进行聚类处理之前,按照设定的筛选条件,对搜索到的旅游景点进行筛选。其中,筛选条件可以灵活设置,例如,筛选条件包括如下中的至少一个条件:
筛除地理位置重复的旅游景点,即排除同一旅游景点对应不同名称的情况;
筛除缺少描述信息的旅游景点,即排除旅游景点不成熟的情况;
筛除景点滞留时间大于旅游天数的设定百分比的旅游景点,即排除需要耗费较多时间游历的大景点。优选地,该筛选条件可以由用户选择,如果用户希 望游历大景点,则可以不包括该筛选条件。
实际应用中,筛选条件还可以包括其他条件,此处不再一一列举。并且,筛选条件可以由服务器定制,也可以由用户定制,具体地,用户提交定制的筛选条件的过程和提交搜索请求的过程类似,此处不再详细说明。
图2示出了上述步骤103中对搜索到的旅游景点进行聚类处理的流程示意图。具体地,根据搜索到的各旅游景点的描述信息以及旅游天数,对步骤102搜索到的旅游景点进行聚类处理,主要包括如下步骤201至步骤204:
步骤201、根据搜索到的各旅游景点的描述信息包括的景点地理位置,将地理位置位于设定范围内的旅游景点确定为一组。
该步骤中,设定范围可以灵活设置,例如,为便于区分,该设定范围可以为城市范围,即将地理位置位于同一城市的旅游景点确定为一组。实际应用中,该设定范围的大小可以根据一组旅游景点计划游玩的天数而确定,例如,如果一组旅游景点计划游玩一天,则该设定范围可以优选地为城市范围(旅游景点较为稀疏的情况)或区县范围(旅游景点较为密的情况);如果一组旅游景点计划游玩两天,则该设定范围可以优选地为省份范围。
步骤202、判断旅游景点的组数是否大于旅游天数,若是,执行步骤203,若否,执行步骤204。
该步骤中,旅游天数信息可以由用户提交,例如,旅游天数信息包括在搜索请求中作为搜索条件提交,对于没有旅游天数计划的用户,也可以由服务器确定,服务器确定旅游天数的方式可以有多种,例如,该旅游天数可以为默认天数;该旅游天数也可以根据用户提交的搜索条件动态确定,如根据用户提交的搜索条件中的地理位置信息,确定估计的游玩该地理位置需要的天数;该旅游天数还可以根据提交相同搜索请求的其他用户提交的旅游天数确定。
步骤203、根据各组旅游景点包括的旅游景点的描述信息,对相似的旅游景点组进行合并。
该步骤中,可以进行多次旅游景点组合并,直到旅游景点的组数不大于旅 游天数,例如,每次合并后再判断合并后的旅游景点组是否大于旅游天数,如果大于,则继续对相似的旅游景点组进行合并。优选地,合并后的一组旅游景点为一天的旅游线路。
步骤204、针对每个旅游景点组,根据组内旅游景点的描述信息,确定出一条旅游线路。
其中,一组旅游景点为一天的旅游线路或至少连续两天的旅游线路。
至此,服务器对根据搜索条件搜索到的旅游景点进行聚类处理的流程结束。
上述步骤203中,根据各组旅游景点包括的旅游景点的描述信息,对相似的旅游景点组进行合并,可以有多种方式,例如,可以根据组内旅游景点所在的地理位置,将地理位置临近的旅游景点组合并,或者,可以根据旅游景点组内各旅游景点的描述信息,将描述信息有关联的旅游景点组合并。作为本申请的优选实施方式,为了提高旅游景点组合并的有效性,根据各组旅游景点包括的旅游景点的描述信息,对相似的旅游景点组进行合并,可以通过如下方式:
根据各组旅游景点包括的旅游景点的描述信息,确定旅游景点组两两之间的相似度,并将相似度大于第一设定阈值的两个旅游景点组合并为一组。例如,通过上述步骤201确定出了三组旅游景点组,分别为A、B、C,则在该步骤203中,可以分别确定AB、AC、BC两两之间的相似度,若其中AB的相似度大于第一设定阈值,则可以将AB合并为一组。
作为本申请一个更为具体的实施方式,图3示出了确定两组旅游景点之间的相似度的流程示意图,具体地,根据两组旅游景点包括的旅游景点的描述信息,确定该两组旅游景点组之间的相似度,主要包括如下步骤301至步骤304:
步骤301、根据两组旅游景点包括的旅游景点的描述信息包括的景点地理位置,确定两组旅游景点之间的距离。
该步骤中,确定旅游景点组之间的距离可以有多种方式,例如,可以确定两个旅游景点组的中心位置之间的距离,也可以确定两个旅游景点组中距离最 近的两个旅游景点之间的距离。
步骤302、判断确定出的两组旅游景点之间的距离是否大于第二设定阈值,若是,执行步骤303,若否,执行步骤304。
步骤303、确定该两组旅游景点之间的相似度为设定的最小相似度值。
该步骤303中,在确定两组旅游景点之间的距离大于第二设定阈值时,表示该两组旅游景点距离较远,不适合进行合并处理,因此,直接设置该两组旅游景点之间的相似度为最小值,如0或负数。其中,第二设定阈值可以根据经验值设定,例如,设置为跨城市或跨区县的距离值,具体可以根据实际情况灵活设定。
步骤304、根据两组旅游景点中各旅游景点的描述信息,计算该两组旅游景点的相似度。
该步骤中,计算相似度使用的描述信息可以视情况只包括景点地理位置,也可以包括景点地理位置和景点滞留时间。
至此,确定两组旅游景点组之间的相似度的流程结束。
作为本申请一个更为具体的实施方式,图4示出了上述步骤304中计算两组旅游景点的相似度的流程示意图,具体地,根据两组旅游景点中各旅游景点的描述信息,计算该两组旅游景点的相似度,主要包括如下步骤401至步骤405:
步骤401、确定该两组旅游景点中包括的旅游景点的总数量。
步骤402、判断确定出的总数量与设定的阈值范围的关系,若总数量小于第三设定阈值,则执行步骤403,若总数量大于第四设定阈值,则执行步骤404,若确定出的总数量在第三设定阈值以及第四设定阈值以内,则执行步骤405。
该步骤中,第四设定阈值为阈值范围的上限,第三设定阈值为阈值范围的下限。对于小组(即总数量小于第三设定阈值),比较适合合并,可以不考虑滞留时间的影响,只计算距离的相似度,尽量将距离近的景点合并为一组;对于大组(即总数量大于第四设定阈值),不太适合继续合并,可以计算距离和 时间的相似度,并乘以设定的小于1的限制因子以调低相似度值;对于比较适中的组(即总数量大于等于第三设定阈值且小于等于第四设定阈值),可以计算距离和时间的相似度。
步骤403、根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置,计算对应不同旅游景点组的旅游景点之间距离的相似度。
步骤404、根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置和滞留时间,计算对应不同旅游景点组的旅游景点之间距离和滞留时间的相似度,并对该相似度乘以设定的小于1的系数;
步骤405、根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置和滞留时间,计算对应不同旅游景点组的旅游景点之间距离和滞留时间的相似度。
至此,计算两组旅游景点的相似度的流程结束。
更为具体地,在图4对应的流程包括的步骤403中,根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置,计算对应不同旅游景点组的旅游景点之间距离的相似度,可以通过如下公式:
Sim(ha,hb)=(Σi=1nΣj=1mdis[ha(i),hb(j)])2-factor2]]>
在图4对应的流程包括的步骤404和步骤405中,根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置和滞留时间,计算对应不同旅游景点组的旅游景点之间距离和滞留时间的相似度,可以通过如下公式:
Sim(ha,hb)=(Σi=1nΣj=1mdis[ha(i),hb(j)])2-{Σi=1ntimestay[ha(i)]+Σj=1mtimestay[hb(j)]}2-factor2]]>
其中:
ha与hb分别表示两组旅游景点,n为旅游景点组ha中包括的旅游景点数,m为旅游景点组hb中包括的旅游景点数;
dis[ha(i),hb(j)]表示游景点组ha中第i个旅游景点与旅游景点组hb中第j个旅游景点的距离,其中,i∈[1,n],j∈[1,m];
timestay[ha(i)]表示旅游景点组ha中第i个旅游景点的滞留时间;
timestay[hb(j)]表示旅游景点组hb中第j个旅游景点的滞留时间;
factor为0或设定值,当factor为设定值时,可以为理想状态下分组结果的均方差,该值为经验值。
上述步骤403至405中,两个旅游景点之间的距离可以根据旅游景点的地理位置确定,具体地,可以调用地图,在地图上根据旅游景点的地理位置定位出旅游景点,并采用地图的现有功能确定出定位点之间的距离。确定旅游景点之间的距离也可以调用交通信息数据库,根据旅游景点的地理位置,确定位于该地理位置之间的路径以及出行方式,结合交通信息确定出旅游景点之间的距离。例如,两个旅游景点位于不同城市时,可能在市内采用公交或自驾的方式,在城市之间采用火车出行的方式,则可以根据公交或自驾的线路以及火车的线路,确定两个旅游点之间的距离。
进一步地,作为本申请的优选实施例,在对搜索的旅游景点进行聚类处理后,可以进一步对聚类结果进行优化处理,即在执行上述步骤103之后以及执行上述步骤104之前,进一步对旅游景点的聚类结果进行优化处理。具体地,可以分别对每组聚类处理后的旅游景点进行优化,图5示出了对一组旅游景点组的聚类结果优化的流程示意图,具体地,包括如下步骤501以及步骤502:
步骤501、确定完成该组旅游景点耗费的总时间。
该步骤中,该组旅游景点耗费的总时间,即旅游景点的滞留时间与耗费在路上的时间总和,具体地,可以根据该组中各旅游景点的游玩顺序,确定相邻旅游景点之间的距离,并根据各相邻旅游景点之间的距离以及对应的出行方式,确定耗费在相邻旅游景点路径上的时间,并进一步将耗费在各相邻旅游景点路径上的时间、各旅游景点的滞留时间的总和,确定为完成该组旅游景点耗费的总时间。
步骤502、根据该组旅游景点的计划旅游时间以及该组旅游景点耗费的总时间,对该组内的旅游景点进行优化处理,使该组旅游景点的计划旅游时间与 该组旅游景点耗费的总时间的差值小于设定值。
该步骤中,若设定的每日旅游时间大于该组旅游景点耗费的总时间,并且差值大于设定值,说明该组旅游景点数量不足,则增加该组内的旅游景点,例如,增加和该组旅游景点距离临近的旅游景点或知名度高的旅游景点;若设定的每日旅游时间小于该组旅游景点耗费的总时间,并且差值大于设定值,说明该组旅游景点数量太过饱和,则减少该组内的旅游景点,例如,减少该组旅游景点中位于边缘的旅游景点,或减少知名度较低的旅游景点。其中,增加或减少的旅游景点数量根据每日旅游时间与该组旅游景点耗费的总时间的差值确定,如果该差值较大,则增加或减少的旅游景点数量可以较多,如果该差值较小,则增加或减少的旅游景点数量可以较少。
至此,对一组旅游景点的聚类结果进行优化的流程结束。
通过图5对应的优化处理,能够根据计划游玩时间对每组旅游景点的数量进行调整,以使最终推荐给用户的旅游线路与计划游玩时间相匹配,避免旅游线路太过饱和或太过宽松。
本申请实施例中,为了进一步提升向用户推荐的旅游线路与用户搜索条件的匹配度,在将旅游景点的聚类结果推荐给所述客户端之前,可以对搜索到的旅游景点执行设定次的聚类处理以及优化处理。
通过本申请实施例提供的上述技术方案,服务器能够根据用户提交的搜索条件,动态搜索符合用户的搜索条件的旅游景点,并且为了进一步提高搜索结果与用户搜索条件的匹配度,能够进一步对符合搜索条件的旅游景点进行聚类处理以及优化处理,从而能够智能化地根据用户的搜索条件反馈旅游景点的搜索结果,与现有技术相比,通过聚类处理提高了旅游景点之间的关联性,实现了零散旅游景点向关联旅游景点的转变,并且能够实现动态搜索,避免了旅游景点单一的问题。
实施例二
本申请实施例二提供了一种实现上述实施例一的具体实现方式。
图6示出了本申请实施例二提供的旅游线路推荐系统的逻辑结构示意图。该系统的架构图分成了3部分:动态链接库601,基础数据模块602,逻辑模块603。其中:
动态链接库601,可以用C++的方式维护了交通信息,如公交信息和自驾信息,用于确定旅游景点之间的距离;
基础数据模块602,可以进一步分为两部分,一部分通过JNI(Java Native Interface,JAVA本地调用)来调用动态链接库,如通过自驾接口调用自驾信息,通过交通接口调用交通信息。优选地,可以通过本地缓存的方式保存调用结果,以提高计算速度;该基础数据模块的另一部分为DB(数据库),用于维护旅游景点信息或优质的旅行线路(或卖家提供,或运营编辑)以供搜索符合用户搜索条件的旅游景点,优选地,可以对DB里保存的数据建立LUCENE索引,以提高搜索时的检索效率;
逻辑模块603,主要包括交通、自驾的行程获取模块603A、旅行线路查询模块603B以及算法模块603C,其中:
交通、自驾的行程获取模块603A,用于从基础数据模块602获取交通、自驾信息,以确定旅游景点之间的距离;
旅行线路查询模块603B,主要用于接收用户Caller基于HSF(淘宝服务框架)或HTTP(超文本传输协议),通过系统提供的Planner API(应用程序编程接口)提交的旅游线路搜索请求,旅行线路查询模块603B根据搜索请求中携带的搜索条件,从DB中搜索符合搜索条件的旅游景点,并提供给算法模块603C;
算法模块603C,大致分为3个子模块:即初始数据的整理分析子模块,数据的全局优化子模块,以及数据的局部优化子模块。具体地,初始数据的整理分析子模块,主要是筛除一些对算法有较大的影响的景点数据,比如重复的景点,需要多天才能够游玩的景点,以及基础数据不全的景点等,之后推算出一个合适的游玩时间;数据的全局优化子模块,主要用于完成上述实施例一中 对旅游景点进行聚类处理的过程,例如对上一步的景点全部带入改进的聚类算法中,计算各个组的相似度,根据相似度计算结果合并旅游景点组;数据的局部优化子模块,主要用于完成上述实施例一中对旅游景点的聚类结果进行优化处理的过程,例如对经优化后效果不理性的旅游景点组(或者是因相似度过高导致某一个组的景点过多,超出计划的游玩时间,或者说某个组过小,使得计划游玩时间过于充裕)进行局部的优化。
图6所示的系统架构中,各模块实现相应功能的具体实现方式,与上述实施例一种相应步骤对应,此处不再详细描述。
基于图6所述的系统架构,图7示出了算法模块603C对搜索结果进行处理的流程示意图,该具体实施方式中,算法模块603C对搜索结果进行处理,包括对搜索结果进行聚类处理以及优化处理。具体地,包括如下步骤:
步骤701、初始搜索结果整理。
其中,初始搜索结果整理即根据设定的筛选条件,从搜索到的与搜索条件匹配的旅游景点中,筛除一部分不好的旅游景点的过程,具体筛选条件以及筛选过程可参见上述实施例一的相应部分。
步骤702、同城市的景点归类,即一个城市的景点被划分为一组。
其中,同城市的景点归类的处理过程对应上述步骤201的处理过程,此处以设定范围为城市范围为例进行的具体说明。
步骤703、判断旅游天数是否大于划分得到的组数,若是,执行步骤704,若否,执行步骤705。
步骤704、根据各组旅游景点包括的旅游景点的描述信息,对相似的旅游景点组进行合并,将合并结果加入结果集。
该步骤与上述实施例一中的步骤203的具体执行过程一致,此处不再详细描述。
步骤705、针对每个旅游景点组,根据组内旅游景点的描述信息,确定出一条旅游线路,将果加入结果集。
上述步骤704以及步骤705为对搜索到的旅游景点进行聚类处理的过程。
步骤706、判断结果集中是否存在旅游景点组超出第一边界条件的组,若是,执行步骤707,若否,执行步骤708。
该步骤中,判断结果集中是否存在旅游景点组超出第一边界条件的组,即判断是否存在旅游景点组耗费的总时间大于该组旅游景点的计划旅游时间,且差值大于设定值的组。
步骤707、减少该组内的旅游景点,并将处理结果加入结果集。
步骤708、判断结果集中是否存在旅游景点组超出第二边界条件的组,若是,执行步骤709,若否,将处理结果加入结果集。
该步骤中,判断结果集中是否存在旅游景点组超出第二边界条件的组,即判断是否存在旅游景点组耗费的总时间大于该组旅游景点的计划旅游时间,且差值大于设定阈值的组。
步骤709、增加该组内的旅游景点,并将处理结果加入结果集。
上述步骤706至步骤709为对旅游景点的聚类处理结果进行优化处理的过程。
步骤710、判断对旅游景点组进行聚类处理以及优化处理的次数是否达到设定次数,若是,输出结果集推荐给用户,若否,返回步骤701。
至此,流程结束。
实施例三
与上述实施例一提供的旅游线路的推荐方法对应,本申请实施例三提供了一种旅游线路的推荐装置,该装置可以位于网络侧的服务器中,尤其适用于提供旅游服务或信息资源类的服务器中。用户可以根据自身的旅游需求,通过客户端向服务器提交旅游线路搜索请求,服务器基于该搜索请求,向用户推荐旅游线路。
图8示出了本实施例提供的旅游线路的推荐装置的结构示意图,具体地,该装置包括:
搜索请求接收单元801、搜索引擎单元802、搜索结果处理单元803以及搜索结果反馈单元804;
其中:
搜索请求接收单元801,用于接收客户端提交的旅游线路搜索请求;
搜索引擎单元802,用于根据搜索请求接收单元接收的搜索请求携带的搜索条件,搜索符合搜索条件的旅游景点;
搜索结果处理单元803,用于根据搜索引擎单元搜索到的各旅游景点的描述信息以及旅游天数,对旅游景点进行聚类处理;
搜索结果反馈单元804,用于将搜索结果处理单元处理后的旅游景点的聚类结果推荐给客户端。
作为本实施例三的一个优选实施例,图8中的搜索引擎单元802,进一步用于在搜索条件包括地理位置信息、旅游景点名称以及旅游景点的属性信息中的一个条件时,搜索符合该条件的旅游景点,以及在搜索条件包括地理位置信息、旅游景点名称以及旅游景点的属性信息中的至少两个条件时,根据搜索条件中包括的每个条件,分别搜索符合对应条件的旅游景点,并选择根据每个条件搜索到的旅游景点中的共有旅游景点。
作为本实施例三的一个优选实施例,图8中的搜索引擎单元,进一步用于在搜索条件包括地理位置信息条件时,搜索位于地理位置信息对应的地理位置的旅游景点;在搜索条件包括旅游景点的属性信息时,搜索对应的属性中包括属性信息对应的属性的旅游景点;以及在搜索条件包括旅游景点名称时,搜索旅游景点名称对应的旅游景点以及与该旅游景点关联的旅游景点;其中,与该旅游景点关联的旅游景点为地理位置与该旅游景点临近的旅游景点、或预设的包括该旅游景点的旅游线路中的旅游景点。
如图9所示,作为本实施例三的一个优选实施例,图8所示的装置还可以进一步包括:
旅游景点筛选单元805,用于在搜索结果处理单元803根据搜索到的各旅 游景点的描述信息以及旅游天数,对旅游景点进行聚类处理之前,按照设定的筛选条件,对搜索到的旅游景点进行筛选。
作为本实施例三的一个优选实施例,图9中的旅游景点筛选单元805,进一步用于从搜索到的旅游景点中筛除地理位置重复的旅游景点,或/和筛除缺少描述信息的旅游景点,或/和筛除景点滞留时间大于旅游天数的设定百分比的旅游景点。
如图10所示,作为本实施例三的一个优选实施例,图8中的搜索结果处理单元803,进一步包括:
分组模块803A,用于根据搜索到的各旅游景点的描述信息包括的景点地理位置,将地理位置位于设定范围内的旅游景点确定为一组;
聚类处理模块803B,用于在旅游景点的组数大于旅游天数时,根据各组旅游景点包括的旅游景点的描述信息,对相似的旅游景点组进行合并,直到旅游景点的组数不大于旅游天数,其中,合并后的一组旅游景点为一天的旅游线路;
旅游线路确定模块803C,用于在旅游景点的组数不大于旅游天数时,针对每个旅游景点组,根据组内旅游景点的描述信息,确定出一条旅游线路,其中,一组旅游景点为一天的旅游线路或至少连续两天的旅游线路。
图9中的搜索结果处理单元803也可以包括上述模块。
作为本实施例三的一个优选实施例,图10中的聚类处理模块803B,进一步用于根据各组旅游景点包括的旅游景点的描述信息,确定旅游景点组两两之间的相似度,并将相似度大于第一设定阈值的两个旅游景点组合并为一组。
作为本实施例三的一个优选实施例,图10中的聚类处理模块803B,进一步用于根据两组旅游景点包括的旅游景点的描述信息包括的景点地理位置,确定两组旅游景点之间的距离,若确定出的距离大于第二设定阈值,则确定该两组旅游景点之间的相似度为设定的最小相似度值,若确定出的距离不大于第二设定阈值,则根据两组旅游景点中各旅游景点的描述信息,计算该两组旅游景 点的相似度,其中,该描述信息包括景点地理位置,或包括景点地理位置和景点滞留时间。
作为本实施例三的一个优选实施例,图10中的聚类处理模块803B,进一步包括:
数量确定子模块,用于确定两组旅游景点中包括的旅游景点的总数量;
第一相似度计算子模块,用于在数量确定子模块确定出的数量小于第三设定阈值时,根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置,计算对应不同旅游景点组的旅游景点之间距离的相似度;
第二相似度计算子模块,用于在数量确定子模块确定出的数量大于第四设定阈值时,根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置和滞留时间,计算对应不同旅游景点组的旅游景点之间距离和滞留时间的相似度,并对该相似度乘以设定的小于1的系数;
第三相似度计算子模块,用于在数量确定子模块确定出的数量在第三设定阈值以及第四设定阈值以内,则根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置和滞留时间,计算对应不同旅游景点组的旅游景点之间距离和滞留时间的相似度;
其中,旅游景点之间的距离根据旅游景点的地理位置确定,第四设定阈值大于第三设定阈值。
作为本实施例三的一个优选实施例,上述的第一相似度计算子模块,具体用于通过如下公式计算对应不同旅游景点组的旅游景点之间距离的相似度:
Sim(ha,hb)=(Σi=1nΣj=1mdis[ha(i),hb(j)])2-factor2]]>
作为本实施例三的一个优选实施例,上述的第二相似度计算子模块以及第三相似度计算子模块,具体用于,具体用于通过如下公式计算对应不同旅游景点组的旅游景点之间距离和滞留时间的相似度:
Sim(ha,hb)=(Σi=1nΣj=1mdis[ha(i),hb(j)])2-{Σi=1ntimestay[ha(i)]+Σj=1mtimestay[hb(j)]}2-factor2]]>
其中:
ha与hb分别表示两组旅游景点,n为旅游景点组ha中包括的旅游景点数,m为旅游景点组hb中包括的旅游景点数;
dis[ha(i),hb(j)]表示游景点组ha中第i个旅游景点与旅游景点组hb中第j个旅游景点的距离,其中,i∈[1,n],j∈[1,m];
timestay[ha(i)]表示旅游景点组ha中第i个旅游景点的滞留时间;
timestay[hb(j)]表示旅游景点组hb中第j个旅游景点的滞留时间;
factor为0或设定值。
如图11所示,作为本实施例三的一个优选实施例,图10所示的装置还可以进一步包括处理结果优化单元806,用于将旅游景点的聚类结果推荐给客户端之前,针对每组旅游景点,确定完成该组旅游景点耗费的总时间,并根据该组旅游景点的计划旅游时间以及该组旅游景点耗费的总时间,对该组内的旅游景点进行优化处理,使该组旅游景点的计划旅游时间与该组旅游景点耗费的总时间的差值小于设定值。
作为本实施例三的一个优选实施例,图11中的处理结果优化单元806,进一步用于根据该组中各旅游景点的游玩顺序,确定相邻旅游景点之间的距离,根据各相邻旅游景点之间的距离以及对应的出行方式,确定耗费在相邻旅游景点路径上的时间,将耗费在各相邻旅游景点路径上的时间、各旅游景点的滞留时间的总和,确定为完成该组旅游景点耗费的总时间。
作为本实施例三的一个优选实施例,图11中的处理结果优化单元806,进一步用于在设定的每日旅游时间大于该组旅游景点耗费的总时间的差值大于设定值时,增加该组内的旅游景点;在设定的每日旅游时间小于该组旅游景点耗费的总时间的差值大于设定值时,减少该组内的旅游景点。
作为本实施例三的一个优选实施例,图11中的搜索结果反馈单元804,进一步用于将旅游景点的聚类结果推荐给客户端之前,确定搜索结果处理单元对搜索到的旅游景点执行聚类处理以及处理结果优化单元优化处理的次数达到 设定次。
上述各单元或模块的功能可对应于上述实施例一中相应流程的具体处理过程,在此不再赘述。
本申请的实施例所提供的旅游线路的推荐装置可通过计算机程序实现。本领域技术人员应该能够理解,上述的单元以及模块划分方式仅是众多划分方式中的一种,如果划分为其他单元或模块或不划分块,只要旅游线路的推荐装置具有上述功能,都应该在本申请的保护范围之内。
本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个 流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

一种旅游线路的推荐方法以及装置.pdf_第1页
第1页 / 共28页
一种旅游线路的推荐方法以及装置.pdf_第2页
第2页 / 共28页
一种旅游线路的推荐方法以及装置.pdf_第3页
第3页 / 共28页
点击查看更多>>
资源描述

《一种旅游线路的推荐方法以及装置.pdf》由会员分享,可在线阅读,更多相关《一种旅游线路的推荐方法以及装置.pdf(28页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103678429 A (43)申请公布日 2014.03.26 CN 103678429 A (21)申请号 201210365302.X (22)申请日 2012.09.26 G06F 17/30(2006.01) G06Q 50/14(2012.01) (71)申请人 阿里巴巴集团控股有限公司 地址 英属开曼群岛大开曼资本大厦一座四 层 847 号邮箱 (72)发明人 王鹏飞 (74)专利代理机构 北京润泽恒知识产权代理有 限公司 11319 代理人 苏培华 (54) 发明名称 一种旅游线路的推荐方法以及装置 (57) 摘要 本申请公开了一种旅游线路的推荐方法以。

2、及 装置, 用于解决现有的旅游推荐服务推荐的旅游 景点零散、 旅游线路单一的问题。提供的旅游线 路的推荐方法, 包括 : 服务器接收客户端提交的 旅游线路搜索请求 ; 根据搜索请求携带的搜索条 件, 搜索符合搜索条件的旅游景点 ; 根据搜索到 的各旅游景点的描述信息以及旅游天数, 对旅游 景点进行聚类处理 ; 并将旅游景点的聚类结果推 荐给客户端。 采用该技术方案, 能够智能化地根据 用户的搜索条件反馈旅游景点的搜索结果, 通过 聚类处理提高了旅游景点之间的关联性, 实现了 零散旅游景点向关联旅游景点的转变, 并且能够 实现动态搜索, 避免了旅游景点单一的问题。 (51)Int.Cl. 权利要。

3、求书 3 页 说明书 13 页 附图 11 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书3页 说明书13页 附图11页 (10)申请公布号 CN 103678429 A CN 103678429 A 1/3 页 2 1. 一种旅游线路的推荐方法, 其特征在于, 包括 : 服务器接收客户端提交的旅游线路搜索请求 ; 根据所述搜索请求携带的搜索条件, 搜索符合所述搜索条件的旅游景点 ; 根据搜索到的各旅游景点的描述信息以及旅游天数, 对所述旅游景点进行聚类处理 ; 并 将旅游景点的聚类结果推荐给所述客户端。 2. 如权利要求 1 所述的方法, 其特征在于, 所述搜索条。

4、件包括地理位置信息、 旅游景点 名称以及旅游景点的属性信息中的至少一个条件 ; 根据所述搜索请求携带的搜索条件, 搜索符合所述搜索条件的旅游景点, 包括 : 若所述搜索条件中包括一个条件, 则搜索符合该条件的旅游景点 ; 若所述搜索条件中包括两个以上的条件, 则根据所述搜索条件中包括的每个条件, 分 别搜索符合对应条件的旅游景点, 并选择根据每个条件搜索到的旅游景点中的共有旅游景 点。 3. 如权利要求 2 所述的方法, 其特征在于, 所述搜索条件包括地理位置信息条件时, 搜索符合该条件的旅游景点, 包括 : 搜索位于 所述地理位置信息对应的地理位置的旅游景点 ; 所述搜索条件包括旅游景点的属。

5、性信息时, 搜索符合该条件的旅游景点, 包括 : 搜索对 应的属性中包括所述属性信息对应的属性的旅游景点 ; 所述搜索条件包括旅游景点名称时, 搜索符合该条件的旅游景点, 包括 : 搜索所述旅游 景点名称对应的旅游景点以及与该旅游景点关联的旅游景点 ; 其中, 与该旅游景点关联的 旅游景点为地理位置与该旅游景点临近的旅游景点、 或预设的包括该旅游景点的旅游线路 中的旅游景点。 4. 如权利要求 1 所述的方法, 其特征在于, 根据搜索到的各旅游景点的描述信息以及 旅游天数, 对所述旅游景点进行聚类处理之前, 还包括 : 按照设定的筛选条件, 对搜索到的旅游景点进行筛选。 5. 如权利要求 4 。

6、所述的方法, 其特征在于, 所述筛选条件包括如下中的至少一个条件 : 筛除地理位置重复的旅游景点 ; 筛除缺少描述信息的旅游景点 ; 筛除景点滞留时间大于旅游天数的设定百分比的旅游景点。 6.如权利要求1或4所述的方法, 其特征在于, 根据搜索到的各旅游景点的描述信息以 及旅游天数, 对所述旅游景点进行聚类处理, 包括 : 根据搜索到的各旅游景点的描述信息包括的景点地理位置, 将地理位置位于设定范围 内的旅游景点确定为一组 ; 并 判断旅游景点的组数是否大于旅游天数 ; 若是, 则根据各组旅游景点包括的旅游景点的描述信息, 对相似的旅游景点组进行合 并, 直到旅游景点的组数不大于旅游天数, 其。

7、中, 合并后的一组旅游景点为一天的旅游线 路 ; 若否, 则针对每个旅游景点组, 根据组内旅游景点的描述信息, 确定出一条旅游线路, 其中, 一组旅游景点为一天的旅游线路或至少连续两天的旅游线路。 权 利 要 求 书 CN 103678429 A 2 2/3 页 3 7. 如权利要求 6 所述的方法, 其特征在于, 根据各组旅游景点包括的旅游景点的描述 信息, 对相似的旅游景点组进行合并, 包括 : 根据各组旅游景点包括的旅游景点的描述信息, 确定旅游景点组两两之间的相似度, 并将相似度大于第一设定阈值的两个旅游景点组合并为一组。 8. 如权利要求 7 所述的方法, 其特征在于, 根据两组旅游。

8、景点包括的旅游景点的描述 信息, 确定该两组旅游景点组之间的相似度, 包括 : 根据两组旅游景点包括的旅游景点的描述信息包括的景点地理位置, 确定两组旅游景 点之间的距离 ; 若确定出的距离大于第二设定阈值, 则确定该两组旅游景点之间的相似度为设定的最 小相似度值 ; 若确定出的距离不大于所述第二设定阈值, 则根据两组旅游景点中各旅游景点的描述 信息, 计算该两组旅游景点的相似度, 其中, 该描述信息包括景点地理位置, 或包括景点地 理位置和景点滞留时间。 9. 如权利要求 8 所述的方法, 其特征在于, 根据两组旅游景点中各旅游景点的描述信 息, 计算该两组旅游景点的相似度, 包括 : 确定。

9、所述两组旅游景点中包括的旅游景点的总数量 ; 若所述数量小于第三设定阈值, 则根据两组旅游景点中各旅游景点的描述信息包括的 景点地理位置, 计算对应不同旅游景点组的旅游景点之间距离的相似度 ; 若所述数量大于第四设定阈值, 则根据两组旅游景点中各旅游景点的描述信息包括的 景点地理位置和滞留时间, 计算对应不同旅游景点组的旅游景点之间距离和滞留时间的相 似度, 并对该相似度乘以设定的小于 1 的系数 ; 若所述数量在所述第三设定阈值以及所述第四设定阈值以内, 则根据两组旅游景点中 各旅游景点的描述信息包括的景点地理位置和滞留时间, 计算对应不同旅游景点组的旅游 景点之间距离和滞留时间的相似度 ;。

10、 其中, 旅游景点之间的距离根据旅游景点的地理位置确定, 所述第四设定阈值大于所 述第三设定阈值。 10. 如权利要求 9 所述的方法, 其特征在于, 根据两组旅游景点中各旅游景点的描述信 息包括的景点地理位置, 计算对应不同旅游景点组的旅游景点之间距离的相似度, 通过如 下公式 : 根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置和滞留时间, 计算对 应不同旅游景点组的旅游景点之间距离和滞留时间的相似度, 通过如下公式 : 其中 : ha与 hb分别表示两组旅游景点, n 为旅游景点组 ha中包括的旅游景点数, m 为旅游景 点组 hb中包括的旅游景点数 ; disha(i), hb。

11、(j) 表示游景点组 ha中第 i 个旅游景点与旅游景点组 hb中第 j 个旅游 权 利 要 求 书 CN 103678429 A 3 3/3 页 4 景点的距离, 其中, i 1, n, j 1, m ; timestayha(i) 表示旅游景点组 ha中第 i 个旅游景点的滞留时间 ; timestayhb(j) 表示旅游景点组 hb中第 j 个旅游景点的滞留时间 ; factor 为 0 或设定值。 11. 如权利要求 6 所述的方法, 其特征在于, 将旅游景点的聚类结果推荐给所述客户端 之前, 还包括 : 针对每组旅游景点, 确定完成该组旅游景点耗费的总时间 ; 并 根据该组旅游景点的。

12、计划旅游时间以及该组旅游景点耗费的总时间, 对该组内的旅游 景点进行优化处理, 使该组旅游景点的计划旅游时间与该组旅游景点耗费的总时间的差值 小于设定值。 12. 如权利要求 11 所述的方法, 其特征在于, 确定完成该组旅游景点耗费的总时间, 包 括 : 根据该组中各旅游景点的游玩顺序, 确定相邻旅游景点之间的距离 ; 根据各相邻旅游景点之间的距离以及对应的出行方式, 确定耗费在相邻旅游景点路径 上的时间 ; 将耗费在各相邻旅游景点路径上的时间、 各旅游景点的滞留时间的总和, 确定为完成 该组旅游景点耗费的总时间。 13. 如权利要求 11 所述的方法, 其特征在于, 根据设定的每日旅游时间。

13、以及该组旅游 景点耗费的总时间, 对该组内的旅游景点进行优化处理, 包括 : 若设定的每日旅游时间大于该组旅游景点耗费的总时间的差值大于所述设定值, 则增 加该组内的旅游景点 ; 若设定的每日旅游时间小于该组旅游景点耗费的总时间的差值大于所述设定值, 则减 少该组内的旅游景点。 14. 如权利要求 11 所述的方法, 其特征在于, 将旅游景点的聚类结果推荐给所述客户 端之前, 还包括 : 确定对搜索到的旅游景点执行所述聚类处理以及优化处理的次数达到设定次。 15. 一种旅游线路的推荐装置, 其特征在于, 包括 : 搜索请求接收单元, 用于接收客户端提交的旅游线路搜索请求 ; 搜索引擎单元, 用。

14、于根据所述搜索请求接收单元接收的搜索请求携带的搜索条件, 搜 索符合所述搜索条件的旅游景点 ; 搜索结果处理单元, 用于根据所述搜索引擎单元搜索到的各旅游景点的描述信息以及 旅游天数, 对所述旅游景点进行聚类处理 ; 搜索结果反馈单元, 用于将所述搜索结果处理单元处理后的旅游景点的聚类结果推荐 给所述客户端。 权 利 要 求 书 CN 103678429 A 4 1/13 页 5 一种旅游线路的推荐方法以及装置 技术领域 0001 本申请涉及互联网技术领域, 尤其涉及一种旅游线路的推荐方法以及装置。 背景技术 0002 随着人们生活质量的提高, 度假休闲等旅游需求急剧增加, 外出旅游人数增长较。

15、 快。 对于旅游人士来说, 如何找到贴切、 便捷的旅游出行指导、 线路导航服务, 如何实现知性 旅游是众多出行者考虑的问题。 0003 目前, 常见的旅游指导服务多是基于书籍、 地图、 网站介绍、 旅行社定制等, 这些旅 行方式存在如下问题 : 0004 无论书籍、 地图或是网站, 一般主要提供旅游景点介绍或推荐服务, 用户只能获得 一些零散的旅游景点信息, 如果用户希望游玩多个景点, 需要根据获得的零散的旅游景点 信息自行分析旅游线路。虽然目前也有一些网站或旅行社能够提供旅游线路推荐的服务, 但是这些旅游线路一般是由网站维护人员确定并导入, 旅游线路单一, 并且对于用户输入 的搜索条件也存在。

16、很大限制, 如果未保存包括用户输入的旅游景点的旅游线路, 则无法向 用户推荐旅游线路, 可能只能向用户反馈该旅游景点的相关信息。 0005 综上所述, 现有的旅游推荐服务存在推荐的旅游景点零散、 旅游线路单一的问题, 通常都不能满足用户的旅游需求, 用户可能需要反复搜索多次才能确定旅游线路, 因此, 亟 需一种智能化的旅游推荐系统。 发明内容 0006 有鉴于此, 本申请实施例提供一种旅游线路的推荐方法以及装置, 用于解决现有 的旅游推荐服务推荐的旅游景点零散、 旅游线路单一的问题。 0007 本申请实施例通过如下技术方案实现 : 0008 根据本申请实施例的一个方面, 提供了一种旅游线路的推。

17、荐方法, 包括 : 0009 服务器接收客户端提交的旅游线路搜索请求 ; 0010 根据所述搜索请求携带的搜索条件, 搜索符合所述搜索条件的旅游景点 ; 0011 根据搜索到的各旅游景点的描述信息以及旅游天数, 对所述旅游景点进行聚类处 理 ; 并 0012 将旅游景点的聚类结果推荐给所述客户端。 0013 根据本申请实施例的另一个方面, 还提供了一种旅游线路的推荐装置, 包括 : 0014 搜索请求接收单元, 用于接收客户端提交的旅游线路搜索请求 ; 0015 搜索引擎单元, 用于根据所述搜索请求接收单元接收的搜索请求携带的搜索条 件, 搜索符合所述搜索条件的旅游景点 ; 0016 搜索结果。

18、处理单元, 用于根据所述搜索引擎单元搜索到的各旅游景点的描述信息 以及旅游天数, 对所述旅游景点进行聚类处理 ; 0017 搜索结果反馈单元, 用于将所述搜索结果处理单元处理后的旅游景点的聚类结果 说 明 书 CN 103678429 A 5 2/13 页 6 推荐给所述客户端。 0018 通过本申请实施例提供的上述至少一个技术方案, 服务器能够根据用户提交的搜 索条件, 动态搜索符合用户的搜索条件的旅游景点, 并且为了进一步提高搜索结果与用户 搜索条件的匹配度, 能够进一步根据搜索到的旅游景点的描述信息以及旅游天数, 对符合 搜索条件的旅游景点进行聚类处理, 从而能够智能化地根据用户的搜索条。

19、件反馈旅游景点 的搜索结果, 与现有技术相比, 通过聚类处理提高了旅游景点之间的关联性, 实现了零散旅 游景点向关联旅游景点的转变, 并且能够实现动态搜索, 避免了旅游景点单一的问题。 0019 本申请的其它特征和优点将在随后的说明书中阐述, 并且, 部分地从说明书中变 得显而易见, 或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明 书、 权利要求书、 以及附图中所特别指出的结构来实现和获得。 附图说明 0020 附图用来提供对本申请的进一步理解, 并且构成说明书的一部分, 与本申请实施 例一起用于解释本申请, 并不构成对本申请的限制。在附图中 : 0021 图 1 为本申请。

20、实施例一提供的推荐旅游线路的流程示意图 ; 0022 图 2 为本申请实施例一提供的对搜索到的旅游景点进行聚类处理的流程示意图 ; 0023 图 3 为本申请实施例一提供的确定两组旅游景点之间的相似度的流程示意图 ; 0024 图 4 为本申请实施例一提供的计算两组旅游景点的相似度的流程示意图 ; 0025 图 5 为本申请实施例一提供的一组旅游景点组的聚类结果优化的流程示意图 ; 0026 图 6 为本申请实施例二提供的旅游线路推荐系统的逻辑结构示意图 ; 0027 图 7 为本申请实施例二提供的算法模块 603C 对搜索结果进行处理的流程示意 图 ; 0028 图 8 为本申请实施例三提供。

21、的旅游线路的推荐装置的一个结构示意图 ; 0029 图 9 为本申请实施例三提供的旅游线路的推荐装置的又一个结构示意图 ; 0030 图 10 为本申请实施例三提供的旅游线路的推荐装置的又一个结构示意图 ; 0031 图 11 为本申请实施例三提供的旅游线路的推荐装置的又一个结构示意图。 具体实施方式 0032 为了给出智能推荐旅游线路的实现方案, 本申请实施例提供了一种旅游线路的推 荐方法, 该技术方案可以应用于旅游线路搜索的过程。以下结合说明书附图对本申请的优 选实施例进行说明, 应当理解, 此处所描述的优选实施例仅用于说明和解释本申请, 并不用 于限定本申请。并且在不冲突的情况下, 本申。

22、请中的实施例及实施例中的特征可以相互组 合。 0033 实施例一 0034 本申请实施例一提供了一种旅游线路的推荐方法, 该推荐方法能够根据用户提交 的搜索请求智能化地为用户推荐旅游线路。该方法可以应用于网络侧的服务器中, 尤其适 用于提供旅游服务或信息资源类的服务器中。用户可以根据自身的旅游需求, 通过客户端 向服务器提交旅游线路搜索请求, 服务器基于该搜索请求, 向用户推荐旅游线路。 以下结合 图 1 示出的推荐旅游线路的流程示意图, 对服务器向用户推荐旅游线路的过程进行详细说 说 明 书 CN 103678429 A 6 3/13 页 7 明。 0035 如图 1 所示, 该旅游线路的推。

23、荐方法, 主要包括如下步骤 101 至步骤 104 : 0036 步骤 101、 服务器接收用户提交的旅游线路搜索请求。 0037 该步骤中, 接收的旅游线路搜索请求中携带搜索条件, 作为本申请的优选实施方 式, 用户可以在服务器提供的旅游推荐服务页面手动输入搜索条件, 该方式可以减少对用 户搜索条件的限制 ; 用户也可以在服务器提供的旅游推荐服务页面上选择页面上显示的搜 索条件, 该方式可以减少用户的输入操作, 为用户提供便利。 0038 步骤 102、 服务器根据该搜索请求携带的搜索条件, 搜索符合该搜索条件的旅游景 点。 0039 该步骤中, 搜索请求携带的搜索条件可以为一个或多个, 如。

24、果搜索请求中只包括 一个条件, 则搜索符合该条件的旅游景点即可, 如果搜索请求中包括两个以上的条件, 则可 以根据搜索条件中包括的每个条件, 分别搜索符合对应条件的旅游景点, 并进一步选择根 据每个条件搜索到的旅游景点中的共有旅游景点, 或在每个条件的搜索结果中出现至少两 次的旅游景点。 0040 步骤 103、 服务器根据搜索到的各旅游景点的描述信息以及旅游天数, 对旅游景点 进行聚类处理。 0041 该步骤中, 旅游景点的描述信息主要包括旅游景点的地理位置信息, 如旅游景点 的地址信息或 GPS(Global Positioning System, 全球定位系统 ) 信息, 还可以包括旅游。

25、景 点的滞留时间, 即游玩该旅游景点所需要的时间, 该时间通常可以根据旅游景点的大小确 定。当然, 旅游景点的描述信息还可以包括对旅游景点的介绍等信息, 此处不再一一列举。 0042 步骤 104、 服务器将旅游景点的聚类结果推荐给客户端。 0043 至此, 服务器向用户推荐旅游景点的流程结束。 0044 作为本申请优选实施例, 为了满足不同用户的不同需求, 本申请支持对不同搜索 条件的搜索, 即用户提交的旅游线路搜索请求中可以包括各类搜索条件, 并且搜索条件可 以为一个或多个, 例如, 该搜索条件包括地理位置信息、 旅游景点名称以及旅游景点的属性 信息中的至少一个条件。 更进一步地, 地理位。

26、置信息可以根据用户希望旅游的范围而确定, 例如, 可以为省份名称、 城市名称或区县名称, 当然也可以为国家名称。旅游景点的属性信 息可以为旅游景点的描述信息, 如旅游景点的类型, 也可以为用户为该旅游景点添加的标 签, 例如, 旅游景点 A 适合度蜜月, 则可以为该旅游景点添加标签 “蜜月景点” , 该标签可以 作为该旅游景点的属性信息。旅游景点 B 冬天气候温暖, 适合冬天旅游, 则可以为该旅游景 点添加标签 “冬日游景点” , 该标签可以作为该旅游景点的属性信息。 0045 为了进一步清楚地理解本申请实施例, 以下对搜索条件分别为地理位置信息、 旅 游景点名称、 旅游景点的属性信息时, 上。

27、述步骤 102 中服务器的搜索过程进行说明。 0046 当搜索条件包括地理位置信息条件时, 搜索符合该条件的旅游景点, 包括 : 搜索位 于地理位置信息对应的地理位置的旅游景点。 例如, 搜索条件为城市名 “北京” , 则可以搜索 位于 “北京” 的各旅游景点。 0047 当搜索条件包括旅游景点的属性信息时, 搜索符合该条件的旅游景点, 包括 : 搜索 对应的属性中包括属性信息对应的属性的旅游景点。 例如, 搜索条件为 “冬日游” , 则服务器 可以搜索带有 “冬日游” 属性的旅游景点, 该属性可以为旅游景点的描述信息, 也可以为用 说 明 书 CN 103678429 A 7 4/13 页 。

28、8 户添加的标签。 0048 当搜索条件包括旅游景点名称时, 搜索符合该条件的旅游景点, 包括 : 搜索该旅游 景点名称对应的旅游景点以及与该旅游景点关联的旅游景点 ; 其中, 与该旅游景点关联的 旅游景点为地理位置与该旅游景点临近的旅游景点、 或预设的包括该旅游景点的旅游线路 中的旅游景点。例如, 用户输入的搜索条件为 “故宫” , 则可以搜索 “故宫” 及其周边的景点, 如天安门、 颐和园等, 或者搜索包括故宫的旅游线路, 如包括故宫、 长城、 圆明园等景点的旅 游线路。 0049 作为本申请的优选实施方式, 能够上述步骤 102 搜索到的符合搜索条件的旅游景 点的数量进行优化, 例如, 。

29、当符合用户输入的搜索条件的旅游景点数量较为庞大时, 服务器 可以添加限制条件以限制搜索结果中旅游景点的数量, 该限制条件可以灵活设置, 例如可 以为旅游景点的数量限制、 也可以为游客访问量限制等 ; 当符合用户输入的搜索条件的旅 游景点数量较少时, 则可以自动填补与搜索到的旅游景点临近的旅游景点, 或知名度更高 的旅游景点。 0050 本申请实施例中, 服务器向用户推荐旅游线路的一个重要处理方式在于上述步骤 103, 即服务器对搜索到的旅游景点进行聚类处理的过程, 以下对此进行详细说明。 0051 作为本申请的优选实施方式, 为了提高聚类处理效率, 可以对步骤 102 的搜索结 果进行精简, 。

30、即在根据搜索到的各旅游景点的描述信息以及旅游天数, 对旅游景点进行聚 类处理之前, 按照设定的筛选条件, 对搜索到的旅游景点进行筛选。其中, 筛选条件可以灵 活设置, 例如, 筛选条件包括如下中的至少一个条件 : 0052 筛除地理位置重复的旅游景点, 即排除同一旅游景点对应不同名称的情况 ; 0053 筛除缺少描述信息的旅游景点, 即排除旅游景点不成熟的情况 ; 0054 筛除景点滞留时间大于旅游天数的设定百分比的旅游景点, 即排除需要耗费较多 时间游历的大景点。优选地, 该筛选条件可以由用户选择, 如果用户希望游历大景点, 则可 以不包括该筛选条件。 0055 实际应用中, 筛选条件还可以。

31、包括其他条件, 此处不再一一列举。并且, 筛选条件 可以由服务器定制, 也可以由用户定制, 具体地, 用户提交定制的筛选条件的过程和提交搜 索请求的过程类似, 此处不再详细说明。 0056 图 2 示出了上述步骤 103 中对搜索到的旅游景点进行聚类处理的流程示意图。具 体地, 根据搜索到的各旅游景点的描述信息以及旅游天数, 对步骤 102 搜索到的旅游景点 进行聚类处理, 主要包括如下步骤 201 至步骤 204 : 0057 步骤 201、 根据搜索到的各旅游景点的描述信息包括的景点地理位置, 将地理位置 位于设定范围内的旅游景点确定为一组。 0058 该步骤中, 设定范围可以灵活设置, 。

32、例如, 为便于区分, 该设定范围可以为城市范 围, 即将地理位置位于同一城市的旅游景点确定为一组。 实际应用中, 该设定范围的大小可 以根据一组旅游景点计划游玩的天数而确定, 例如, 如果一组旅游景点计划游玩一天, 则该 设定范围可以优选地为城市范围 ( 旅游景点较为稀疏的情况 ) 或区县范围 ( 旅游景点较为 密的情况 ) ; 如果一组旅游景点计划游玩两天, 则该设定范围可以优选地为省份范围。 0059 步骤 202、 判断旅游景点的组数是否大于旅游天数, 若是, 执行步骤 203, 若否, 执 行步骤 204。 说 明 书 CN 103678429 A 8 5/13 页 9 0060 该步。

33、骤中, 旅游天数信息可以由用户提交, 例如, 旅游天数信息包括在搜索请求中 作为搜索条件提交, 对于没有旅游天数计划的用户, 也可以由服务器确定, 服务器确定旅游 天数的方式可以有多种, 例如, 该旅游天数可以为默认天数 ; 该旅游天数也可以根据用户提 交的搜索条件动态确定, 如根据用户提交的搜索条件中的地理位置信息, 确定估计的游玩 该地理位置需要的天数 ; 该旅游天数还可以根据提交相同搜索请求的其他用户提交的旅游 天数确定。 0061 步骤 203、 根据各组旅游景点包括的旅游景点的描述信息, 对相似的旅游景点组进 行合并。 0062 该步骤中, 可以进行多次旅游景点组合并, 直到旅游景点。

34、的组数不大于旅游天数, 例如, 每次合并后再判断合并后的旅游景点组是否大于旅游天数, 如果大于, 则继续对相似 的旅游景点组进行合并。优选地, 合并后的一组旅游景点为一天的旅游线路。 0063 步骤 204、 针对每个旅游景点组, 根据组内旅游景点的描述信息, 确定出一条旅游 线路。 0064 其中, 一组旅游景点为一天的旅游线路或至少连续两天的旅游线路。 0065 至此, 服务器对根据搜索条件搜索到的旅游景点进行聚类处理的流程结束。 0066 上述步骤 203 中, 根据各组旅游景点包括的旅游景点的描述信息, 对相似的旅游 景点组进行合并, 可以有多种方式, 例如, 可以根据组内旅游景点所在。

35、的地理位置, 将地理 位置临近的旅游景点组合并, 或者, 可以根据旅游景点组内各旅游景点的描述信息, 将描述 信息有关联的旅游景点组合并。作为本申请的优选实施方式, 为了提高旅游景点组合并的 有效性, 根据各组旅游景点包括的旅游景点的描述信息, 对相似的旅游景点组进行合并, 可 以通过如下方式 : 0067 根据各组旅游景点包括的旅游景点的描述信息, 确定旅游景点组两两之间的相似 度, 并将相似度大于第一设定阈值的两个旅游景点组合并为一组。例如, 通过上述步骤 201 确定出了三组旅游景点组, 分别为 A、 B、 C, 则在该步骤 203 中, 可以分别确定 AB、 AC、 BC 两两 之间的。

36、相似度, 若其中 AB 的相似度大于第一设定阈值, 则可以将 AB 合并为一组。 0068 作为本申请一个更为具体的实施方式, 图 3 示出了确定两组旅游景点之间的相似 度的流程示意图, 具体地, 根据两组旅游景点包括的旅游景点的描述信息, 确定该两组旅游 景点组之间的相似度, 主要包括如下步骤 301 至步骤 304 : 0069 步骤 301、 根据两组旅游景点包括的旅游景点的描述信息包括的景点地理位置, 确 定两组旅游景点之间的距离。 0070 该步骤中, 确定旅游景点组之间的距离可以有多种方式, 例如, 可以确定两个旅游 景点组的中心位置之间的距离, 也可以确定两个旅游景点组中距离最近。

37、的两个旅游景点之 间的距离。 0071 步骤 302、 判断确定出的两组旅游景点之间的距离是否大于第二设定阈值, 若是, 执行步骤 303, 若否, 执行步骤 304。 0072 步骤 303、 确定该两组旅游景点之间的相似度为设定的最小相似度值。 0073 该步骤 303 中, 在确定两组旅游景点之间的距离大于第二设定阈值时, 表示该两 组旅游景点距离较远, 不适合进行合并处理, 因此, 直接设置该两组旅游景点之间的相似度 为最小值, 如 0 或负数。其中, 第二设定阈值可以根据经验值设定, 例如, 设置为跨城市或跨 说 明 书 CN 103678429 A 9 6/13 页 10 区县的距。

38、离值, 具体可以根据实际情况灵活设定。 0074 步骤 304、 根据两组旅游景点中各旅游景点的描述信息, 计算该两组旅游景点的相 似度。 0075 该步骤中, 计算相似度使用的描述信息可以视情况只包括景点地理位置, 也可以 包括景点地理位置和景点滞留时间。 0076 至此, 确定两组旅游景点组之间的相似度的流程结束。 0077 作为本申请一个更为具体的实施方式, 图 4 示出了上述步骤 304 中计算两组旅游 景点的相似度的流程示意图, 具体地, 根据两组旅游景点中各旅游景点的描述信息, 计算该 两组旅游景点的相似度, 主要包括如下步骤 401 至步骤 405 : 0078 步骤 401、 。

39、确定该两组旅游景点中包括的旅游景点的总数量。 0079 步骤 402、 判断确定出的总数量与设定的阈值范围的关系, 若总数量小于第三设定 阈值, 则执行步骤 403, 若总数量大于第四设定阈值, 则执行步骤 404, 若确定出的总数量在 第三设定阈值以及第四设定阈值以内, 则执行步骤 405。 0080 该步骤中, 第四设定阈值为阈值范围的上限, 第三设定阈值为阈值范围的下限。 对 于小组 ( 即总数量小于第三设定阈值 ), 比较适合合并, 可以不考虑滞留时间的影响, 只计 算距离的相似度, 尽量将距离近的景点合并为一组 ; 对于大组 ( 即总数量大于第四设定阈 值 ), 不太适合继续合并, 。

40、可以计算距离和时间的相似度, 并乘以设定的小于 1 的限制因子 以调低相似度值 ; 对于比较适中的组 ( 即总数量大于等于第三设定阈值且小于等于第四设 定阈值 ), 可以计算距离和时间的相似度。 0081 步骤 403、 根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置, 计算 对应不同旅游景点组的旅游景点之间距离的相似度。 0082 步骤 404、 根据两组旅游景点中各旅游景点的描述信息包括的景点地理位置和滞 留时间, 计算对应不同旅游景点组的旅游景点之间距离和滞留时间的相似度, 并对该相似 度乘以设定的小于 1 的系数 ; 0083 步骤 405、 根据两组旅游景点中各旅游景点的描。

41、述信息包括的景点地理位置和滞 留时间, 计算对应不同旅游景点组的旅游景点之间距离和滞留时间的相似度。 0084 至此, 计算两组旅游景点的相似度的流程结束。 0085 更为具体地, 在图4对应的流程包括的步骤403中, 根据两组旅游景点中各旅游景 点的描述信息包括的景点地理位置, 计算对应不同旅游景点组的旅游景点之间距离的相似 度, 可以通过如下公式 : 0086 0087 在图 4 对应的流程包括的步骤 404 和步骤 405 中, 根据两组旅游景点中各旅游景 点的描述信息包括的景点地理位置和滞留时间, 计算对应不同旅游景点组的旅游景点之间 距离和滞留时间的相似度, 可以通过如下公式 : 0。

42、088 说 明 书 CN 103678429 A 10 7/13 页 11 0089 其中 : 0090 ha与 hb分别表示两组旅游景点, n 为旅游景点组 ha中包括的旅游景点数, m 为旅 游景点组 hb中包括的旅游景点数 ; 0091 disha(i), hb(j) 表示游景点组 ha中第 i 个旅游景点与旅游景点组 hb中第 j 个 旅游景点的距离, 其中, i 1, n, j 1, m ; 0092 timestayha(i) 表示旅游景点组 ha中第 i 个旅游景点的滞留时间 ; 0093 timestayhb(j) 表示旅游景点组 hb中第 j 个旅游景点的滞留时间 ; 009。

43、4 factor 为 0 或设定值, 当 factor 为设定值时, 可以为理想状态下分组结果的均方 差, 该值为经验值。 0095 上述步骤 403 至 405 中, 两个旅游景点之间的距离可以根据旅游景点的地理位置 确定, 具体地, 可以调用地图, 在地图上根据旅游景点的地理位置定位出旅游景点, 并采用 地图的现有功能确定出定位点之间的距离。 确定旅游景点之间的距离也可以调用交通信息 数据库, 根据旅游景点的地理位置, 确定位于该地理位置之间的路径以及出行方式, 结合交 通信息确定出旅游景点之间的距离。 例如, 两个旅游景点位于不同城市时, 可能在市内采用 公交或自驾的方式, 在城市之间采。

44、用火车出行的方式, 则可以根据公交或自驾的线路以及 火车的线路, 确定两个旅游点之间的距离。 0096 进一步地, 作为本申请的优选实施例, 在对搜索的旅游景点进行聚类处理后, 可以 进一步对聚类结果进行优化处理, 即在执行上述步骤103之后以及执行上述步骤104之前, 进一步对旅游景点的聚类结果进行优化处理。具体地, 可以分别对每组聚类处理后的旅游 景点进行优化, 图 5 示出了对一组旅游景点组的聚类结果优化的流程示意图, 具体地, 包括 如下步骤 501 以及步骤 502 : 0097 步骤 501、 确定完成该组旅游景点耗费的总时间。 0098 该步骤中, 该组旅游景点耗费的总时间, 即。

45、旅游景点的滞留时间与耗费在路上的 时间总和, 具体地, 可以根据该组中各旅游景点的游玩顺序, 确定相邻旅游景点之间的距 离, 并根据各相邻旅游景点之间的距离以及对应的出行方式, 确定耗费在相邻旅游景点路 径上的时间, 并进一步将耗费在各相邻旅游景点路径上的时间、 各旅游景点的滞留时间的 总和, 确定为完成该组旅游景点耗费的总时间。 0099 步骤 502、 根据该组旅游景点的计划旅游时间以及该组旅游景点耗费的总时间, 对 该组内的旅游景点进行优化处理, 使该组旅游景点的计划旅游时间与该组旅游景点耗费的 总时间的差值小于设定值。 0100 该步骤中, 若设定的每日旅游时间大于该组旅游景点耗费的总。

46、时间, 并且差值大 于设定值, 说明该组旅游景点数量不足, 则增加该组内的旅游景点, 例如, 增加和该组旅游 景点距离临近的旅游景点或知名度高的旅游景点 ; 若设定的每日旅游时间小于该组旅游 景点耗费的总时间, 并且差值大于设定值, 说明该组旅游景点数量太过饱和, 则减少该组内 的旅游景点, 例如, 减少该组旅游景点中位于边缘的旅游景点, 或减少知名度较低的旅游景 点。其中, 增加或减少的旅游景点数量根据每日旅游时间与该组旅游景点耗费的总时间的 差值确定, 如果该差值较大, 则增加或减少的旅游景点数量可以较多, 如果该差值较小, 则 增加或减少的旅游景点数量可以较少。 0101 至此, 对一组。

47、旅游景点的聚类结果进行优化的流程结束。 说 明 书 CN 103678429 A 11 8/13 页 12 0102 通过图 5 对应的优化处理, 能够根据计划游玩时间对每组旅游景点的数量进行调 整, 以使最终推荐给用户的旅游线路与计划游玩时间相匹配, 避免旅游线路太过饱和或太 过宽松。 0103 本申请实施例中, 为了进一步提升向用户推荐的旅游线路与用户搜索条件的匹配 度, 在将旅游景点的聚类结果推荐给所述客户端之前, 可以对搜索到的旅游景点执行设定 次的聚类处理以及优化处理。 0104 通过本申请实施例提供的上述技术方案, 服务器能够根据用户提交的搜索条件, 动态搜索符合用户的搜索条件的旅。

48、游景点, 并且为了进一步提高搜索结果与用户搜索条件 的匹配度, 能够进一步对符合搜索条件的旅游景点进行聚类处理以及优化处理, 从而能够 智能化地根据用户的搜索条件反馈旅游景点的搜索结果, 与现有技术相比, 通过聚类处理 提高了旅游景点之间的关联性, 实现了零散旅游景点向关联旅游景点的转变, 并且能够实 现动态搜索, 避免了旅游景点单一的问题。 0105 实施例二 0106 本申请实施例二提供了一种实现上述实施例一的具体实现方式。 0107 图 6 示出了本申请实施例二提供的旅游线路推荐系统的逻辑结构示意图。该系统 的架构图分成了 3 部分 : 动态链接库 601, 基础数据模块 602, 逻辑。

49、模块 603。其中 : 0108 动态链接库 601, 可以用 C+ 的方式维护了交通信息, 如公交信息和自驾信息, 用 于确定旅游景点之间的距离 ; 0109 基础数据模块 602, 可以进一步分为两部分, 一部分通过 JNI(Java Native Interface, JAVA 本地调用 ) 来调用动态链接库, 如通过自驾接口调用自驾信息, 通过交通 接口调用交通信息。优选地, 可以通过本地缓存的方式保存调用结果, 以提高计算速度 ; 该 基础数据模块的另一部分为DB(数据库), 用于维护旅游景点信息或优质的旅行线路(或卖 家提供, 或运营编辑)以供搜索符合用户搜索条件的旅游景点, 优选地, 可以对DB里保存的 数据建立 LUCENE 索引, 以提高搜索时的检索效率 ; 0110 逻辑模。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1