《基于用户行为分析的路径倒排表建立、匹配方法及系统.pdf》由会员分享,可在线阅读,更多相关《基于用户行为分析的路径倒排表建立、匹配方法及系统.pdf(16页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103124273 A(43)申请公布日 2013.05.29CN103124273A*CN103124273A*(21)申请号 201110366510.7(22)申请日 2011.11.17H04L 29/08(2006.01)G06F 17/30(2006.01)(71)申请人阿里巴巴集团控股有限公司地址英属开曼群岛大开曼资本大厦一座四层847号邮箱(72)发明人黄明(74)专利代理机构北京润泽恒知识产权代理有限公司 11319代理人苏培华(54) 发明名称基于用户行为分析的路径倒排表建立、匹配方法及系统(57) 摘要本申请提供了基于用户行为分析的路径匹配方法及。
2、系统。所述的方法包括:读取路径倒排表和用户轨迹,其中,所述路径倒排表中包括原子路径、路径标识和跳转的页面节点,所述用户轨迹由页面节点构成;根据页面节点对用户轨迹进行切分得到对应用户轨迹的原子轨迹;将所述用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配,得到用户轨迹的原子轨迹对应路径标识和跳转的页面节点;将用户轨迹的第一个页面节点与所述用户轨迹的原子轨迹逐个进行匹配,并添加匹配的用户轨迹的原子轨迹对应路径标识和跳转的页面节点,得到最终输出的组合路径。通过对页面节点的拆分、组合可以快速的得到匹配结果,匹配的效率非常高,节省路径匹配的时间。(51)Int.Cl.权利要求书2页 说明书10页 附图3。
3、页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书2页 说明书10页 附图3页(10)申请公布号 CN 103124273 ACN 103124273 A1/2页21.基于用户行为分析的路径倒排表建立方法,其特征在于,包括:将页面节点路径图中的路径拆分为由两个页面节点构成的原子路径,所述原子路径包括两个相邻页面节点组合的强路径和两个相隔页面节点组合的弱路径;根据所述原子路径对所述页面节点路径图中的路径进行切分,得到所述原子路径在该路径中跳转的页面节点;建立包含原子路径、路径标识和跳转的页面节点的路径倒排表。2.根据权利要求1所述的方法,其特征在于,根据所述原子路径对所述页面节。
4、点路径图中的路径进行切分,得到所述原子路径在该路径中跳转的页面节点,包括:设原子路径中的第一个页面节点为首节点,第二个页面节点为次节点;将原子路径中的首节点和次节点,按照前后顺序分别与路径中的页面节点进行匹配;对于匹配的情况,将与次节点匹配的页面节点在路径中跳转的页面节点,作为原子路径在该路径中跳转的页面节点。3.基于用户行为分析的路径匹配方法,其特征在于,包括:权利要求1或2任一所述的路径倒排表,其中,读取路径倒排表和用户轨迹,其中,所述用户轨迹由页面节点构成;根据页面节点两两组合对用户轨迹进行拆分,得到对应用户轨迹的原子轨迹;将用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配,得到用户轨。
5、迹的原子轨迹对应路径标识和跳转的页面节点;将用户轨迹的第一个页面节点与所述用户轨迹的原子轨迹逐个进行匹配,并添加匹配的原子轨迹对应路径标识和跳转的页面节点,得到最终输出的组合路径。4.根据权利要求3所述的方法,其特征在于,所述将用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配,得到用户轨迹的原子轨迹对应路径标识和跳转的页面节点,包括:将所述用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配;若匹配,则将路径倒排表中的原子路径对应的路径标识和跳转的页面节点添加到所述用户轨迹的原子轨迹中,得到用户轨迹的原子轨迹对应路径标识和跳转的页面节点。5.根据权利要求3所述的方法,其特征在于,所述将用户轨迹。
6、的第一个页面节点与所述用户轨迹的原子轨迹逐个进行匹配,并添加匹配的原子轨迹对应路径标识和跳转的页面节点,得到最终输出的组合路径,包括:将用户轨迹的第一个页面节点与用户轨迹的原子轨迹逐个进行匹配;若匹配,则添加所述用户轨迹的原子轨迹对应路径标识和跳转的页面节点,到所述用户轨迹的第一个页面节点中;若所有用户轨迹的原子轨迹都匹配完成,则得到最终的组合路径并输出。6.基于用户行为分析的路径倒排表建立系统,其特征在于,包括:拆分原子路径模块,用于将页面节点路径图中的路径拆分为由两个页面节点构成的原子路径,所述原子路径包括两个相邻页面节点组合的强路径和两个相隔页面节点组合的弱路径;切分路径模块,用于根据所。
7、述原子路径对所述页面节点路径图中的路径进行切分,得到所述原子路径在该路径中跳转的页面节点,其中,所述路径由路径标识唯一确定;权 利 要 求 书CN 103124273 A2/2页3建立路径倒排表模块,用于建立包含原子路径、路径标识和跳转的页面节点的路径倒排表;其中,两个相邻页面节点的组合为强路径,两个相隔页面节点的组合为弱路径。7.根据权利要求6所述的方法,其特征在于,所述切分路径模块,包括:预设子模块,用于设原子路径中的第一个页面节点为首节点,第二个页面节点为次节点;匹配子模块,用于将原子路径中的首节点和次节点,按照前后顺序分别与路径中的页面节点进行匹配;添加子模块,用于对于匹配的情况,将与。
8、次节点匹配的页面节点在路径中跳转的页面节点,作为原子路径在该路径中跳转的页面节点。8.基于用户行为分析的路径匹配系统,其特征在于,包括:读取模块,用于读取路径倒排表和用户轨迹,其中,所述用户轨迹由页面节点构成;拆分模块,用于根据页面节点两两组合对用户轨迹进行拆分,得到对应用户轨迹的原子轨迹;匹配原子路径模块,用于将用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配,得到用户轨迹的原子轨迹对应路径标识和跳转的页面节点;匹配、添加并输出模块,用于将用户轨迹的第一个页面节点与所述用户轨迹的原子轨迹逐个进行匹配,并添加匹配的原子轨迹对应路径标识和跳转的页面节点,得到最终输出的组合路径。9.根据权利要求。
9、8所述的系统,其特征在于,所述匹配原子路径模块,包括:匹配子模块,用于将所述用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配;添加子模块,用于若匹配,则将路径倒排表中的原子路径对应的路径标识和跳转的页面节点添加到所述用户轨迹的原子轨迹中,得到用户轨迹的原子轨迹对应路径标识和跳转的页面节点。10.根据权利要求9所述的方法,其特征在于,匹配、添加并输出模块,包括:匹配原子轨迹子模块,用于将用户轨迹的第一个页面节点与用户轨迹的原子轨迹逐个进行匹配;添加原子轨迹子模块,用于若匹配,则添加所述用户轨迹的原子轨迹对应路径标识和跳转的页面节点,到所述用户轨迹的第一个页面节点中;输出组合路径子模块,用于若所。
10、有用户轨迹的原子轨迹都匹配完成,则得到最终的组合路径并输出。权 利 要 求 书CN 103124273 A1/10页4基于用户行为分析的路径倒排表建立、 匹配方法及系统技术领域0001 本申请涉及网络技术,特别是涉及基于用户行为分析的路径倒排表建立、匹配方法及系统。背景技术0002 在获得网站访问量基本数据的情况下,对有关数据进行统计、分析,从中发现用户访问网站的规律就是用户行为分析。0003 用户行为分析可以根据用户的浏览轨迹来分析用户的行为,在这种方法中将每个页面看作一个页面节点。用户浏览网站时会查看网站中的网页,通过网页页面中的链接地址可以从一个页面跳转到另一个页面,因此页面间的跳转就可。
11、以看作是页面节点间的跳转,那么用户通过链接地址对页面的访问、浏览轨迹,就是多个页面节点间的跳转的运行轨迹。通过对页面节点路径的分析可以了解到用户的访问轨迹,进而了解到用户最常访问的页面以及有可能会访问的页面,以分析用户的行为。0004 上述通过网页页面中的链接地址,可以由一个页面可以跳转到另一个页面,也就是由一个页面节点连接到另一个页面节点,那么在一个网站中通过链接地址实现页面之间的跳转,就可以构成由页面节点连接而成的页面节点路径图。现有技术在路径匹配时,是将每一个轨迹和所述页面节点路径图进行顺序匹配。例如,假设用户轨迹为:(k)A+B+E,页面节点路径图中定义的路径为:(n)P1:A+B+E。
12、+F+H;P2:A+B+E+G+M,那么顺序匹配的结果为:P1,F;P2,G,其中,字母A、B、E、F、G、H和M分别表示一个页面节点,P1和P2为路径标识。根据用户的轨迹来匹配路径,可以得到用户可能的访问路径,用户接下来可能访问页面节点F或页面节点G。0005 由上述可知,此种算法只要顺着路径的页面节点一个一个的进行匹配即可,但是在一些大型的网站中,拥有非常多的页面,一个页面可以通过链接地址跳转到很多其他的页面上,其他的页面又可以跳转到另一些页面上,这样就形成一幅非常庞大的页面节点路径图。由此组成的路径的规模通常是千级别的,若算法的时间复杂度为O(n)的话(n一般为1000),那么在亿级别的。
13、用户轨迹(k)下,匹配的效率就非常低。发明内容0006 本申请提供了基于用户行为分析的路径倒排表建立、匹配方法及系统,以解决原有路径匹配方法效率较低的问题。0007 为了解决上述问题,本申请公开了基于用户行为分析的路径倒排表建立方法,包括:0008 将页面节点路径图中的路径拆分为由两个页面节点构成的原子路径,所述原子路径包括两个相邻页面节点组合的强路径和两个相隔页面节点组合的弱路径;0009 根据所述原子路径对所述页面节点路径图中的路径进行切分,得到所述原子路径在该路径中跳转的页面节点,其中,所述路径由路径标识唯一确定;说 明 书CN 103124273 A2/10页50010 建立包含原子路。
14、径、路径标识和跳转的页面节点的路径倒排表。0011 优选的,根据所述原子路径对所述页面节点路径图中的路径进行切分,得到所述原子路径在该路径中跳转的页面节点,包括:0012 设原子路径中的第一个页面节点为首节点,第二个页面节点为次节点;0013 将原子路径中的首节点和次节点,按照前后顺序分别与路径中的页面节点进行匹配;0014 对于匹配的情况,将与次节点匹配的页面节点在路径中跳转的页面节点,作为原子路径在该路径中跳转的页面节点。0015 同时,本申请还公开了基于用户行为分析的路径匹配方法,包括:0016 读取路径倒排表和用户轨迹,其中,所述用户轨迹由页面节点构成;0017 根据页面节点两两组合对。
15、用户轨迹进行拆分,得到对应用户轨迹的原子轨迹;0018 将所述用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配,得到用户轨迹的原子轨迹对应路径标识和跳转的页面节点;0019 将用户轨迹的第一个页面节点与所述用户轨迹的原子轨迹逐个进行匹配,并添加匹配的原子轨迹对应路径标识和跳转的页面节点,得到最终输出的组合路径。0020 优选的,所述将用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配,得到用户轨迹的原子轨迹对应路径标识和跳转的页面节点,包括:0021 将所述用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配;0022 若匹配,则将路径倒排表中的原子路径对应的路径标识和跳转的页面节点添加到所述。
16、用户轨迹的原子轨迹中,得到用户轨迹的原子轨迹对应路径标识和跳转的页面节点;0023 优选的,所述将用户轨迹的第一个页面节点与所述用户轨迹的原子轨迹逐个进行匹配,并添加匹配的原子轨迹对应路径标识和跳转的页面节点,得到最终输出的组合路径,包括:0024 将用户轨迹的第一个页面节点与所述用户轨迹的原子轨迹逐个进行匹配;0025 若匹配,则添加所述用户轨迹的原子轨迹对应路径标识和跳转的页面节点,到所述用户轨迹的第一个页面节点中;0026 若所有用户轨迹的原子轨迹都匹配完成,则得到最终的组合路径并输出。0027 相应的,本申请还公开了基于用户行为分析的路径倒排表建立系统,包括:0028 拆分原子路径模块。
17、,用于将页面节点路径图中的路径拆分为由两个页面节点构成的原子路径,所述原子路径包括两个相邻页面节点组合的强路径和两个相隔页面节点组合弱路径;0029 切分路径模块,用于根据所述原子路径对所述页面节点路径图中的路径进行切分,得到所述原子路径在该路径中跳转的页面节点,其中,所述路径由路径标识唯一确定;0030 建立路径倒排表模块,用于建立包含原子路径、路径标识和跳转的页面节点的路径倒排表。0031 优选的,所述切分路径模块,包括:0032 预设子模块,用于设原子路径中的第一个页面节点为首节点,第二个页面节点为次节点;0033 匹配子模块,用于将原子路径中的首节点和次节点,按照前后顺序分别与路径中说。
18、 明 书CN 103124273 A3/10页6的页面节点进行匹配;0034 添加子模块,用于对于匹配的情况,将与次节点匹配的页面节点在路径中跳转的页面节点,作为原子路径在该路径中跳转的页面节点。0035 相应的,本申请还公开了基于用户行为分析的路径匹配系统,包括:0036 读取模块,用于读取路径倒排表和用户轨迹,其中,所述用户轨迹由页面节点构成;0037 拆分模块,用于根据页面节点两两组合对用户轨迹进行拆分,得到对应的原子轨迹;0038 匹配原子路径模块,用于将所述用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配,得到用户轨迹的原子轨迹对应路径标识和跳转的页面节点;0039 匹配、添加并输。
19、出模块,用于将用户轨迹的第一个页面节点与所述用户轨迹的原子轨迹逐个进行匹配,并添加匹配的原子轨迹对应路径标识和跳转的页面节点,得到最终输出的组合路径。0040 优选的,所述匹配原子路径模块,包括:0041 匹配子模块,用于将所述用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配;0042 添加子模块,用于若匹配,则将路径倒排表中的原子路径对应的路径标识和跳转的页面节点添加到所述用户轨迹的原子轨迹中,得到用户轨迹的原子轨迹对应路径标识和跳转的页面节点。0043 优选的,所述匹配、添加并输出模块,包括:0044 匹配原子轨迹子模块,用于将用户轨迹的第一个页面节点与所述用户轨迹的原子轨迹逐个进行匹配。
20、;0045 添加原子轨迹子模块,用于若匹配,则添加所述用户轨迹的原子轨迹对应路径标识和跳转的页面节点,到所述用户轨迹的第一个页面节点中;0046 输出组合路径子模块,用于若所有用户轨迹的原子轨迹都匹配完成,则得到最终的组合路径并输出。0047 与现有技术相比,本申请包括以下优点:0048 在本申请所述的方法及系统中,首先读取预先建立的路径倒排表和用户轨迹,其中,所述路径倒排表中包括原子路径、路径标识和跳转的页面节点,所述用户轨迹由页面节点构成。再根据页面节点对用户轨迹进行切分得到对应用户轨迹的原子轨迹,将所述用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配,得到用户轨迹的原子轨迹对应路径标识。
21、和跳转的页面节点,将用户轨迹的第一个页面节点与所述用户轨迹的原子轨迹逐个进行匹配,并添加匹配的原子轨迹对应路径标识和跳转的页面节点,得到最终输出的组合轨迹。不需要分别顺着每一条路径的页面节点一个一个的进行匹配,通过对页面节点的拆分、组合可以快速的得到匹配结果,匹配的效率非常高,节省路径匹配的时间。0049 其次,将轨迹和路径切分成两两页面节点间组合,两个相邻点可以构成强路径,两个不相邻的接点可以构成弱路径,最大范围的覆盖了路径。从而可以同时实现多条路径的模糊匹配和精确匹配,进一步提高匹配的效率,并且能够得到更多的匹配结果,提高用户行为分析结果的精度和广度。说 明 书CN 103124273 A。
22、4/10页7附图说明0050 图1是本申请实施例所述基于用户行为分析的路径倒排表建立方法流程图;0051 图2是本申请实施例所述基于用户行为分析的路径匹配方法流程图;0052 图3是本申请实施例所述基于用户行为分析的路径匹配方法中匹配、添加并输出组合路径流程图;0053 图4是本申请优选实施例所述基于用户行为分析的路径匹配方法流程图,0054 图5是本申请实施例所述基于用户行为分析的路径倒排表建立系统结构图;0055 图6是本申请实施例所述基于用户行为分析的路径匹配系统结构图。具体实施方式0056 为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细。
23、的说明。0057 本申请提供基于用户行为分析的路径倒排表建立、匹配方法及系统,以解决原有路径匹配方法效率较低的问题。通过对页面节点的拆分、组合可以快速的得到匹配结果,匹配的效率非常高,节省路径匹配的时间。0058 参照图1,其给出了本申请实施例所述基于用户行为分析的路径倒排表建立方法流程图。0059 步骤11,将页面节点路径图中的路径拆分为由两个页面节点构成的原子路径,所述原子路径包括两个相邻页面节点组合的强路径和两个相隔页面节点组合的弱路径;0060 若页面节点路径图中的路径为P1:A+B+C+D+.,P2:A-C+E+.,P3:A+B+C+F+.,.,将页面节点两两组合作为原子路径,即将两。
24、个相邻页面节点和两个相隔页面节点组合构成原子路径,则所述原子路径为:A+B,B+C,C+D,C+F,A-C,C+E,A-D,A-E,A-F,.;0061 假设所述页面节点路径图中的路径包括:P1:A+B+C+D+.,P2:A-C+E+.,P3:A+B+C+F+.,.。0062 其中,P1、P2和P3为路径标识,所述路径由路径标识唯一确定;A、B、C、D、E和F为页面节点;+为直接跳转的页面节点,中间不可以包含其他的页面节点,可以看作强路径;-为间接跳转的页面节点,中间可以包含其他页面节点,可以看作弱路径。0063 以P2:A-C+E+.为例,具体论述各个符号代表的意义。所述P2:A-C+E+.。
25、为路径P2是由页面节点A经过一系列页面节点跳转到页面节点C,即由页面节点A间接跳转到页面节点C,再由页面节点C直接跳转到页面节点E.。0064 将所述页面节点两两组合作为原子路径,则所述原子路径为A+B,B+C,C+D,C+F,A-C,C+E,A-D,A-E,A-F,.。0065 步骤12,根据所述原子路径对所述页面节点路径中的路径进行切分,得到所述原子路径在该路径中的跳转的页面节点;0066 具体的,设原子路径中的第一个页面节点为首节点,第二个页面节点为次节点;0067 例如,原子路径为A+B,则A为首节点,B为次节点。0068 将原子路径中的首节点和次节点,按照前后顺序分别与路径中的页面节。
26、点进行匹说 明 书CN 103124273 A5/10页8配;0069 将原子路径A+B与路径P1:A+B+C+D+.进行匹配,则首节点A与P1中的页面节点A匹配,次节点B与P1中的页面节点B匹配。将原子路径A+B与路径P2:A-C+E+.匹配,则首节点A与P1中的页面节点A匹配,次节点B与P2中的页面节点不匹配。若原子路径为C+A,虽然首节点C与P2的页面节点C匹配,次节点A与P2的页面节点A匹配,但P2中页面节点的前后顺序与原子路径C+A不符,不能视为是匹配的情况。0070 对于匹配的情况,将与次节点匹配的页面节点在路径中跳转的页面节点,作为原子路径在该路径中跳转的页面节点。0071 根据。
27、上述原子路径可以对所述页面节点路径图中的路径进行切分,切分后可以得到所述原子路径在该路径中的跳转的页面节点为A+B:,.,B+C:,.,C+D:,.,C+F:,.,A-C:,.,C+E:,.,.。0072 上述匹配中,路径P1与原子路径A+B的次节点B匹配的页面节点,在路径P1中的跳转的页面节点为C,则原子路径A+B在路径P1中的跳转的页面节点为C,可以表示为A+B:。0073 以A+B:,.为例,具体论述各个符号所代表的意义。A+B:,指原子路径A+B可以通过路径P1跳转到页面节点C,也可以通过路径P3跳转到页面节点C。其中,因为路径中可以包含很多页面节点,因此用省略号表示,则-1指没有跳转。
28、的页面节点或某一跳转的页面节点,如C+E:指原子路径C+E在路径P2跳转结束,即没有任何跳转的页面节点,或跳转到E后面的一个页面节点。0074 步骤13,建立包含原子路径、路径标识和跳转的页面节点的路径倒排表;0075 建立包含原子路径、路径标识和跳转的页面节点的路径倒排表,可以将所述路径倒排表存储到存储空间中。其中,所述路径倒排表中的一行可以是原子路径,所述原子路径对应的路径标识,和在该路径中的跳转的页面节点,例如A+B:,.。当然这只是具体路径倒排表的一种构建形式,此处不应理解为是对本申请的限制。0076 其中,路径倒排表的格式可以为HashMap0077 0078 A+B:P1,C P3。
29、,C.0079 .0080 0081 这样的数据格式,可以通过哈希查找,以算法复杂度为O(1),查找到一个路径对应的所有原子路径。0082 相应的,本申请还公开了基于用户行为分析的路径匹配方法。0083 参照图2,其给出了本申请实施例所述基于用户行为分析的路径匹配方法流程图。0084 步骤21,读取路径倒排表和用户轨迹;0085 其中,所述路径倒排表中包括原子路径、路径标识和跳转的页面节点,所述用户轨迹由页面节点构成,是用户浏览网页时在网页间跳转而形成的页面节点跳转轨迹。0086 读取预置的路径倒排表,和某一用户的用户轨迹,假设用户轨迹为A+B+C+.。0087 步骤22,根据页面节点两两组合。
30、对用户轨迹进行拆分,得到对应用户轨迹的原子说 明 书CN 103124273 A6/10页9轨迹;0088 若某一用户的用户轨迹是A+B+C+.,即用户访问页面时,由页面节点A直接跳转到页面节点B,再由页面节点B直接跳转到页面节点C.。0089 将用户轨迹中的页面节点两两组合对用户轨迹进行切分。则可以得到对应的切分结果为A+B,B+C,A-C,.,分别为由页面节点A直接跳转到页面节点B,由页面节点B直接跳转到页面节点C,由页面节点A间接跳转到页面节点C。0090 将所述切分结果作为用户轨迹的原子轨迹,则对上述用户轨迹拆分得到的原子轨迹A+B,B+C,A-C,.。其中,页面节点两两组合如上文论述。
31、,包括两个相邻页面节点的组合和两个相隔页面节点的组合。0091 步骤23,将所述用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配,得到用户轨迹的原子轨迹对应路径标识和跳转的页面节点;0092 将上述用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配,对于匹配的情况,可以将所述路径倒排表中的原子路径所对应的用户访问路径的路径标识,和在该路径中跳转的页面节点添加到用户轨迹的原子轨迹中,得到用户轨迹的原子轨迹对应路径标识和跳转的页面节点。若不匹配,则不进行任何处理。0093 步骤23具体可以包括:0094 首先,将所述用户轨迹的原子轨迹与路径倒排表中的原子路径进行匹配;0095 将上述用户轨迹的原。
32、子轨迹A+B,B+C,A-C,.,与路径倒排表中的原子路径A+B,B+C,C+D,C+F,A-C,C+E,.进行匹配,所述匹配可以指路径倒排表中的原子路径与用户轨迹的原子轨迹相同。则路径倒排表中匹配的原子路径为A+B,B+C,A-C,.。0096 其次,若匹配,则将路径倒排表中匹配的原子路径对应的路径标识和跳转的页面节点添加到所述用户轨迹的原子轨迹中,得到用户轨迹的原子轨迹对应路径标识和跳转的页面节点;0097 上述路径倒排表中的原子路径包含有对应的路径标识和在该路径中的跳转的页面节点,则对于匹配的情况,可以将路径倒排表中的原子路径对应的路径标识和在该路径中跳转的页面节点添加到用户轨迹的原子轨。
33、迹中。使得用户轨迹的原子轨迹可以对应具体路径的路径标识,和在该路径中的跳转的页面节点。0098 所述用户轨迹的原子轨迹对应路径标识和跳转的页面节点为:0099 A+B:P1,P3,.;0100 B+C:P1,P3,.;0101 A-C:P2,.;0102 .。0103 例如,A+B:P1,P3指用户轨迹的原子轨迹A+B可以通过路径P1跳转到页面节点C,也可以通过路径P3跳转到页面节点C。0104 步骤24,将用户轨迹的第一个页面节点与所述用户轨迹的原子轨迹逐个进行匹配,并添加匹配的用户轨迹的原子轨迹对应路径标识和跳转的页面节点,得到最终输出的组合路径。0105 将用户轨迹的第一个页面节点与所述。
34、用户轨迹的原子轨迹逐个进行匹配,若匹配,则添加匹配的用户轨迹的原子轨迹对应路径标识和跳转的页面节点,到用户轨迹的第说 明 书CN 103124273 A7/10页10一个页面节点中。然后继续与其他用户轨迹的原子轨迹进行匹配,期间若遇到不匹配的情况,则此不匹配的用户轨迹的原子轨迹不做考虑,不执行任何操作,继续与其他用户轨迹的原子轨迹进行匹配,直到所有用户轨迹的原子轨迹都匹配完成,得到最终的组合路径并输出。0106 在匹配时,优先添加与用户轨迹相同的页面节点,在用户轨迹中的页面节点都匹配完成后,继续添加匹配的用户轨迹的原子轨迹中跳转的页面节点。0107 参照图3,其给出了本申请实施例所述基于用户行。
35、为分析的路径匹配方法中匹配、添加并输出组合路径流程图。0108 优选的,上述步骤24具体可以包括:0109 步骤241,将用户轨迹的第一个页面节点与所述用户轨迹的原子轨迹逐个进行匹配,则匹配的原子轨迹为A+B,A-C,.;0110 将用户轨迹的第一个页面节点A,与所述用户轨迹的原子轨迹A+B,B+C,A-C,.逐个进行匹配。如用户轨迹的原子轨迹A+B,A-C,.中第一个页面节点都为A,则可以认为与用户轨迹的第一个页面节点匹配。因此匹配的原子轨迹为A+B,A-C,.。0111 若匹配,则执行步骤242,若不匹配,则继续与其他用户轨迹的原子轨迹进行匹配。0112 步骤242,添加所述用户轨迹的原子。
36、轨迹对应路径标识和跳转的页面节点,到所述用户轨迹的第一个页面节点中;0113 执行上述步骤23后,使得用户轨迹的原子轨迹可以对应具体路径的路径标识,和在该路径中的跳转的页面节点,因此对于上述步骤241中匹配的情况,可以添加用户轨迹的原子轨迹对应具体路径的路径标识,和在该路径中的跳转的页面节点到所述用户轨迹的第一个页面节点中。0114 得到相应的结果如A+B:P1,P3,.,A-C:P2,.,.,。0115 步骤243,若所有用户轨迹的原子轨迹都匹配完成,则得到最终的组合路径并输出;0116 在上述步骤241中进行匹配,匹配后执行步骤242进行添加,如此不断的逐个与用户轨迹的原子轨迹进行匹配,直。
37、到最终所有用户轨迹的原子轨迹都匹配并添加完成后,可以得到最终的组合路径,然后输出。0117 所述最终的组合路径为A+B+C:P1,P3,.,A-C:P2,.,.。0118 例如,A+B+C:P1,P3,.指A+B可以由路径P1跳转到页面节点C,然后跳转到页面节点D.,或由路径P3跳转到页面节点C,然后跳转到页面节点F.。其中页面节点C是路径P1和路径P3都可以到达的,因此可以直接在组合路径中表示出来。0119 综上所述,在本申请所述的方法中,首先读取预先建立的路径倒排表和用户轨迹,其中,所述路径倒排表中包括原子路径、路径标识和跳转的页面节点,所述用户轨迹由页面节点构成。再根据页面节点对用户轨迹进行切分得到对应用户轨迹的原子轨迹,将所述用户轨迹的原子轨迹不断的与路径倒排表中的原子路径进行匹配,得到用户轨迹的原子轨迹说 明 书CN 103124273 A10。