《应用程序的排名欺诈检测方法和排名欺诈检测系统.pdf》由会员分享,可在线阅读,更多相关《应用程序的排名欺诈检测方法和排名欺诈检测系统.pdf(35页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103559208 A (43)申请公布日 2014.02.05 CN 103559208 A (21)申请号 201310469985.8 (22)申请日 2013.10.10 G06F 17/30(2006.01) (71)申请人 北京智谷睿拓技术服务有限公司 地址 100085 北京市海淀区小营西路33号1 层 1F05 室 (72)发明人 祝恒书 于魁飞 (54) 发明名称 应用程序的排名欺诈检测方法和排名欺诈检 测系统 (57) 摘要 本发明提供了一种应用程序的排名欺诈检测 方法和排名欺诈检测系统。所述方法包括 : 活跃 期检测步骤, 基于历史排名信息检测所。
2、述应用程 序的活跃期 ; 排名欺诈检测步骤, 基于至少一个 证据对所述活跃期进行检测, 得到排名欺诈检测 结果。本发明的方法及系统能够自动地识别出与 应用程序有关的排名欺诈行为, 从而使应用程序 用户获得真实的应用程序排名信息。 (51)Int.Cl. 权利要求书 9 页 说明书 21 页 附图 4 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书9页 说明书21页 附图4页 (10)申请公布号 CN 103559208 A CN 103559208 A 1/9 页 2 1. 一种应用程序的排名欺诈检测方法, 其特征在于, 所述方法包括 : 活跃期检测步骤, 基于历史。
3、排名信息检测所述应用程序的活跃期 ; 排名欺诈检测步骤, 基于至少一个证据对所述活跃期进行检测, 得到排名欺诈检测结 果。 2. 根据权利要求 1 所述的方法, 其特征在于, 所述排名欺诈检测步骤进一步包括 : 证据验证步骤, 基于至少一个证据对所述活跃期进行验证并得到一欺诈参数。 3. 根据权利要求 2 所述的方法, 其特征在于, 所述排名欺诈检测步骤进一步包括 : 活跃事件分析步骤, 识别所述活跃期中至少一个活跃事件的上升阶段、 保持阶段和下 降阶段。 4. 根据权利要求 3 所述的方法, 其特征在于, 在所述活跃事件分析步骤中, 确定所述活 跃事件中所述应用程序的排名在一峰值范围 R 内。
4、的第一个时间和最后一个时间, 将所述 第一个时间和所述最后一个时间之间的时间段识别为所述保持阶段, 将所述活跃事件中在 保持阶段之前的时间段识别为所述上升阶段, 将所述活跃事件中在保持阶段之后的时间段 识别为所述下降阶段。 5. 根据权利要求 3 所述的方法, 其特征在于, 所述证据基于所述活跃期内的活跃事件 中的上升阶段和 / 或下降阶段构成。 6. 根据权利要求 5 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内所有活跃事件的所述上升阶段的时间范围的平均值, 或 所述活跃期内所有活跃事件的所述下降阶段的时间范围的平均值, 或所述活跃期内所有活 跃事件的所述上升阶段的时间范围和下降阶。
5、段的时间范围的和的平均值。 7. 根据权利要求 5 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内所有活跃事件的所述上升阶段的曲线与时间轴相交所 形成的锐角的角度的平均值, 或所有活跃事件的所述下降阶段的曲线与时间轴相交所形成 的锐角的角度的平均值, 或所有活跃事件的所述上升阶段的曲线和所述下降阶段的曲线与 时间轴相交所形成的锐角的角度和的平均值。 8. 根据权利要求 3 所述的方法, 其特征在于, 所述证据基于所述活跃期内的活跃事件中的保持阶段构成。 9. 根据权利要求 8 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内所有活跃事件的所述保持阶段的时间范围的平均值。 10. 。
6、根据权利要求 8 所述的方法, 其特征在于, 基于所有活跃事件的所述保持阶段中所 述应用程序的平均排名和所述保持阶段的时间范围来计算所述欺诈参数。 11. 根据权利要求 2 所述的方法, 其特征在于, 所述证据基于所述活跃期内活跃事件的数量构成。 12. 根据权利要求 11 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内活跃事件的数量。 13. 根据权利要求 2 所述的方法, 其特征在于, 所述证据基于所述活跃期内的平均评价 和历史平均评价构成。 14. 根据权利要求 13 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内的平均评价和历史平均评价的差值或比值。 权 利 要 求 书。
7、 CN 103559208 A 2 2/9 页 3 15. 根据权利要求 13 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内的平均评价和历史平均评价的差值与历史平均评价的 比值。 16. 根据权利要求 2 所述的方法, 其特征在于, 所述证据基于应用程序在所述活跃期内的评价等级的分布和历史评价信息中评价等 级的分布构成。 17. 根据权利要求 16 所述的方法, 其特征在于, 所述欺诈参数是应用程序在所述活跃期内的评价等级的分布和历史评价信息中评价 等级的分布之间的差值。 18. 根据权利要求 17 所述的方法, 其特征在于, 通过计算应用程序在所述活跃期内的 评价等级的分布和历史评。
8、价信息中评价等级的分布之间的余弦距离来计算它们之间的差 值。 19. 根据权利要求 2 所述的方法, 其特征在于, 所述证据基于所述活跃期内用户评论间 的相似程度构成。 20. 根据权利要求 19 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内用户评论间的平均相似度。 21. 根据权利要求 20 所述的方法, 其特征在于, 所述证据验证步骤进一步包括 : 对所述活跃期内的所有用户评论进行标准化处理 ; 为所述活跃期内的每一条用户评论构建标准化词汇向量 ; 基于所述标准化词汇向量计算所述活跃期内用户评论间的平均相似度。 22. 根据权利要求 2 所述的方法, 其特征在于, 所述证据基于应。
9、用程序在所述活跃期内用户评论的主题分布和历史评论信息中用户 评论的主题分布构成。 23. 根据权利要求 22 所述的方法, 其特征在于, 所述欺诈参数是应用程序在所述活跃期内用户评论的主题分布和历史评论信息中用 户评论的主题分布之间的差值。 24. 根据权利要求 23 所述的方法, 其特征在于, 通过计算应用程序在所述活跃期内用 户评论的主题分布和历史评论信息中用户评论的主题分布之间的余弦距离来计算它们之 间的差值。 25. 根据权利要求 2 所述的方法, 其特征在于, 所述证据基于所述应用程序的活跃用户 平均信誉度和所述应用程序的历史用户平均信誉度构成。 26. 根据权利要求 25 所述的方。
10、法, 其特征在于, 所述欺诈参数是所述应用程序的历史用户平均信誉度和所述应用程序的活跃用户平 均信誉度的差值或比值。 27. 根据权利要求 2 所述的方法, 其特征在于, 所述证据基于所述应用程序的活跃用户 平均信誉度和应用程序排行榜中所有应用程序的历史用户平均信誉度构成。 28. 根据权利要求 27 所述的方法, 其特征在于, 所述欺诈参数是应用程序排行榜中所有应用程序的历史用户平均信誉度和所述应用 权 利 要 求 书 CN 103559208 A 3 3/9 页 4 程序的活跃用户平均信誉度的差值或比值。 29. 根据权利要求 2 所述的方法, 其特征在于, 所述证据基于所述应用程序的活跃。
11、用户信誉度分布和所述应用程序的历史用户信誉 度分布构成。 30. 根据权利要求 29 所述的方法, 其特征在于, 所述欺诈参数是所述应用程序的历史用户信誉度分布和所述应用程序的活跃用户信 誉度分布之间的差值。 31. 根据权利要求 30 所述的方法, 其特征在于, 通过计算所述应用程序的历史用户信 誉度分布和所述应用程序的活跃用户信誉度分布之间的余弦距离来计算它们之间的差值。 32. 根据权利要求 2 所述的方法, 其特征在于, 所述证据基于所述应用程序的活跃用户信誉度分布和应用程序排行榜中所有应用程 序的历史用户信誉度分布构成。 33. 根据权利要求 32 所述的方法, 其特征在于, 所述欺。
12、诈参数是应用程序排行榜中所有应用程序的历史用户信誉度分布和所述应用 程序的活跃用户信誉度分布之间的差值。 34. 根据权利要求 33 所述的方法, 其特征在于, 通过计算应用程序排行榜中所有应用 程序的历史用户信誉度分布和所述应用程序的活跃用户信誉度分布之间的余弦距离来计 算它们之间的差值。 35. 根据权利要求 2 所述的方法, 其特征在于, 在所述证据验证步骤中, 综合考虑所述 至少一个证据, 将基于所述至少一个证据验证得到的对应欺诈参数进行加权计算, 从而得 到所述欺诈参数。 36. 根据权利要求 2-35 中任一项所述的方法, 其特征在于, 所述排名欺诈检测步骤进 一步包括 : 欺诈参。
13、数判断步骤, 将所述欺诈参数与一阈值进行比较, 从而判断所述应用程序是否 存在排名欺诈。 37. 根据权利要求 1 所述的方法, 其特征在于, 所述方法还包括 : 历史排名信息获取步骤, 获取所述应用程序在应用程序排行榜上的所述历史排名信 息。 38. 根据权利要求 37 所述的方法, 其特征在于, 在所述历史排名信息获取步骤中, 从应 用程序商店运营商获取所述历史排名信息, 或从应用程序商店发布的数据中抽取所述历史 排名信息。 39. 根据权利要求 1 所述的方法, 其特征在于, 所述历史排名信息包括表示为一个与离 散时间序列对应的排名序列, 所述排名序列中的每个元素对应于所述时间序列中的一。
14、个离 散时间点, 表示所述应用程序在所述离散时间点时的排名。 40. 根据权利要求 1 所述的方法, 其特征在于, 所述历史排名信息包括历史各时间段中 所述应用程序的用户对该应用程序做出的评价信息。 41. 根据权利要求 1 所述的方法, 其特征在于, 所述历史排名信息包括历史各时间段中 所述应用程序的用户对所述应用程序做出的用户评论。 42. 根据权利要求 1 所述的方法, 其特征在于, 所述历史排名信息包括历史各时间段中 权 利 要 求 书 CN 103559208 A 4 4/9 页 5 所述应用程序的用户信誉度或历史各时间段中应用程序排行榜中所有应用程序的用户信 誉度。 43. 根据权。
15、利要求 1 所述的方法, 其特征在于, 所述方法还包括 : 将所检测出的所述应 用程序的所述活跃期发送给应用程序开发者、 应用程序商店运营商、 应用程序用户中的至 少一个。 44. 根据权利要求 1 所述的方法, 其特征在于, 所述方法还包括 : 将所检测出的所述排 名欺诈检测结果发送给应用程序商店运营商、 应用程序用户中的至少一个。 45. 一种应用程序的排名欺诈检测系统, 其特征在于, 所述系统包括 : 活跃期检测单元, 用于基于历史排名信息检测所述应用程序的活跃期 ; 排名欺诈检测单元, 用于基于至少一个证据对所述活跃期进行检测, 得到排名欺诈检 测结果。 46. 根据权利要求 45 所。
16、述的系统, 其特征在于, 所述排名欺诈检测单元进一步包括 : 证据验证模块, 用于基于至少一个证据对所述活跃期进行验证并得到一欺诈参数。 47. 根据权利要求 46 所述的系统, 其特征在于, 所述排名欺诈检测单元进一步包括 : 活跃事件分析模块, 用于识别所述活跃期中至少一个活跃事件的上升阶段、 保持阶段 和下降阶段。 48. 根据权利要求 47 所述的系统, 其特征在于, 所述活跃事件分析模块, 用于确定所述 活跃事件中所述应用程序的排名在一峰值范围 R 内的第一个时间和最后一个时间, 将所 述第一个时间和所述最后一个时间之间的时间段识别为所述保持阶段, 将所述活跃事件中 在保持阶段之前的。
17、时间段识别为所述上升阶段, 将所述活跃事件中在保持阶段之后的时间 段识别为所述下降阶段。 49. 根据权利要求 47 所述的系统, 其特征在于, 所述证据基于所述活跃期内的活跃事 件中的上升阶段和 / 或下降阶段构成。 50. 根据权利要求 47 所述的系统, 其特征在于, 所述证据基于所述活跃期内的活跃事 件中的保持阶段构成。 51. 根据权利要求 46 所述的系统, 其特征在于, 所述证据基于所述活跃期内活跃事件的数量构成。 52. 根据权利要求 46 所述的系统, 其特征在于, 所述证据基于所述活跃期内的平均评 价和历史平均评价构成。 53. 根据权利要求 46 所述的系统, 其特征在于。
18、, 所述证据基于应用程序在所述活跃期 内的评价等级的分布和历史评价信息中评价等级的分布构成。 54. 根据权利要求 46 所述的系统, 其特征在于, 所述证据基于所述活跃期内用户评论 间的相似程度构成。 55. 根据权利要求 46 所述的系统, 其特征在于, 所述证据基于应用程序在所述活跃期 内用户评论的主题分布和历史评论信息中用户评论的主题分布构成。 56. 根据权利要求 46 所述的系统, 其特征在于, 所述证据基于所述应用程序的活跃用 户平均信誉度和所述应用程序的历史用户平均信誉度构成。 57. 根据权利要求 46 所述的系统, 其特征在于, 所述证据基于所述应用程序的活跃用 户平均信誉。
19、度和应用程序排行榜中所有应用程序的历史用户平均信誉度构成。 权 利 要 求 书 CN 103559208 A 5 5/9 页 6 58. 根据权利要求 46 所述的系统, 其特征在于, 所述证据基于所述应用程序的活跃用 户信誉度分布和所述应用程序的历史用户信誉度分布构成。 59. 根据权利要求 46 所述的系统, 其特征在于, 所述证据基于所述应用程序的活跃用 户信誉度分布和应用程序排行榜中所有应用程序的历史用户信誉度分布构成。 60. 根据权利要求 46 所述的系统, 其特征在于, 所述证据验证模块, 用于综合考虑所述 至少一个证据, 将基于所述至少一个证据验证得到的对应欺诈参数进行加权计算。
20、, 从而得 到所述欺诈参数。 61. 根据权利要求 46-60 中任一项所述的系统, 其特征在于, 所述排名欺诈检测单元进 一步包括 : 欺诈参数判断模块, 用于将所述欺诈参数与一阈值进行比较, 从而判断所述应用程序 是否存在排名欺诈。 62. 根据权利要求 45 所述的系统, 其特征在于, 所述系统还包括 : 历史排名信息获取单元, 用于获取所述应用程序在应用程序排行榜上的所述历史排名 信息。 63. 根据权利要求 62 所述的系统, 其特征在于, 所述历史排名信息获取单元, 用于从应 用程序商店运营商获取所述历史排名信息, 或从应用程序商店发布的数据中抽取所述历史 排名信息。 64. 根据。
21、权利要求 45 所述的系统, 其特征在于, 所述系统还包括一活跃期发送单元, 用于将所检测出的所述应用程序的所述活跃期发送给应用程序开发者、 应用程序商店运营 商、 应用程序用户中的至少一个。 65. 根据权利要求 45 所述的系统, 其特征在于, 所述系统还包括一排名欺诈检测结果 发送单元, 用于将所检测出的所述排名欺诈检测结果发送给应用程序商店运营商、 应用程 序用户中的至少一个。 66. 一种应用程序的排名欺诈检测方法, 其特征在于, 所述方法包括 : 基于至少一个证据对应用程序的活跃期进行检测, 得到排名欺诈检测结果。 67. 根据权利要求 66 所述的方法, 其特征在于, 所述方法进。
22、一步包括 : 证据验证步骤, 基于至少一个证据对所述活跃期进行验证并得到一欺诈参数。 68. 根据权利要求 67 所述的方法, 其特征在于, 所述方法进一步包括 : 活跃事件分析步骤, 识别所述活跃期中至少一个活跃事件的上升阶段、 保持阶段和下 降阶段。 69. 根据权利要求 68 所述的方法, 其特征在于, 在所述活跃事件分析步骤中, 确定所述 活跃事件中所述应用程序的排名在一峰值范围 R 内的第一个时间和最后一个时间, 将所 述第一个时间和所述最后一个时间之间的时间段识别为所述保持阶段, 将所述活跃事件中 在保持阶段之前的时间段识别为所述上升阶段, 将所述活跃事件中在保持阶段之后的时间 段。
23、识别为所述下降阶段。 70. 根据权利要求 68 所述的方法, 其特征在于, 所述证据基于所述活跃期内的活跃事 件中的上升阶段和 / 或下降阶段构成。 71. 根据权利要求 70 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内所有活跃事件的所述上升阶段的时间范围的平均值, 或 权 利 要 求 书 CN 103559208 A 6 6/9 页 7 所述活跃期内所有活跃事件的所述下降阶段的时间范围的平均值, 或所述活跃期内所有活 跃事件的所述上升阶段的时间范围和下降阶段的时间范围的和的平均值。 72. 根据权利要求 70 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内所有活跃事件的。
24、所述上升阶段的曲线与时间轴相交所 形成的锐角的角度的平均值, 或所有活跃事件的所述下降阶段的曲线与时间轴相交所形成 的锐角的角度的平均值, 或所有活跃事件的所述上升阶段的曲线和所述下降阶段的曲线与 时间轴相交所形成的锐角的角度和的平均值。 73. 根据权利要求 68 所述的方法, 其特征在于, 所述证据基于所述活跃期内的活跃事件中的保持阶段构成。 74. 根据权利要求 73 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内所有活跃事件的所述保持阶段的时间范围的平均值。 75. 根据权利要求 73 所述的方法, 其特征在于, 基于所有活跃事件的所述保持阶段中 所述应用程序的平均排名和所述保。
25、持阶段的时间范围来计算所述欺诈参数。 76. 根据权利要求 67 所述的方法, 其特征在于, 所述证据基于所述活跃期内活跃事件的数量构成。 77. 根据权利要求 76 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内活跃事件的数量。 78. 根据权利要求 67 所述的方法, 其特征在于, 所述证据基于所述活跃期内的平均评 价和历史平均评价构成。 79. 根据权利要求 78 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内的平均评价和历史平均评价的差值或比值。 80. 根据权利要求 78 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内的平均评价和历史平均评价的差值与历史平均评。
26、价的 比值。 81. 根据权利要求 67 所述的方法, 其特征在于, 所述证据基于应用程序在所述活跃期内的评价等级的分布和历史评价信息中评价等 级的分布构成。 82. 根据权利要求 81 所述的方法, 其特征在于, 所述欺诈参数是应用程序在所述活跃期内的评价等级的分布和历史评价信息中评价 等级的分布之间的差值。 83. 根据权利要求 82 所述的方法, 其特征在于, 通过计算应用程序在所述活跃期内的 评价等级的分布和历史评价信息中评价等级的分布之间的余弦距离来计算它们之间的差 值。 84. 根据权利要求 67 所述的方法, 其特征在于, 所述证据基于所述活跃期内用户评论 间的相似程度构成。 8。
27、5. 根据权利要求 84 所述的方法, 其特征在于, 所述欺诈参数是所述活跃期内用户评论间的平均相似度。 86. 根据权利要求 85 所述的方法, 其特征在于, 所述证据验证步骤进一步包括 : 权 利 要 求 书 CN 103559208 A 7 7/9 页 8 对所述活跃期内的所有用户评论进行标准化处理 ; 为所述活跃期内的每一条用户评论构建标准化词汇向量 ; 基于所述标准化词汇向量计算所述活跃期内用户评论间的平均相似度。 87. 根据权利要求 67 所述的方法, 其特征在于, 所述证据基于应用程序在所述活跃期内用户评论的主题分布和历史评论信息中用户 评论的主题分布构成。 88. 根据权利要。
28、求 87 所述的方法, 其特征在于, 所述欺诈参数是应用程序在所述活跃期内用户评论的主题分布和历史评论信息中用 户评论的主题分布之间的差值。 89. 根据权利要求 88 所述的方法, 其特征在于, 通过计算应用程序在所述活跃期内用 户评论的主题分布和历史评论信息中用户评论的主题分布之间的余弦距离来计算它们之 间的差值。 90. 根据权利要求 67 所述的方法, 其特征在于, 所述证据基于所述应用程序的活跃用 户平均信誉度和所述应用程序的历史用户平均信誉度构成。 91. 根据权利要求 90 所述的方法, 其特征在于, 所述欺诈参数是所述应用程序的历史用户平均信誉度和所述应用程序的活跃用户平 均信。
29、誉度的差值或比值。 92. 根据权利要求 67 所述的方法, 其特征在于, 所述证据基于所述应用程序的活跃用 户平均信誉度和应用程序排行榜中所有应用程序的历史用户平均信誉度构成。 93. 根据权利要求 92 所述的方法, 其特征在于, 所述欺诈参数是应用程序排行榜中所有应用程序的历史用户平均信誉度和所述应用 程序的活跃用户平均信誉度的差值或比值。 94. 根据权利要求 67 所述的方法, 其特征在于, 所述证据基于所述应用程序的活跃用户信誉度分布和所述应用程序的历史用户信誉 度分布构成。 95. 根据权利要求 94 所述的方法, 其特征在于, 所述欺诈参数是所述应用程序的历史用户信誉度分布和所。
30、述应用程序的活跃用户信 誉度分布之间的差值。 96. 根据权利要求 95 所述的方法, 其特征在于, 通过计算所述应用程序的历史用户信 誉度分布和所述应用程序的活跃用户信誉度分布之间的余弦距离来计算它们之间的差值。 97. 根据权利要求 67 所述的方法, 其特征在于, 所述证据基于所述应用程序的活跃用户信誉度分布和应用程序排行榜中所有应用程 序的历史用户信誉度分布构成。 98. 根据权利要求 97 所述的方法, 其特征在于, 所述欺诈参数是应用程序排行榜中所有应用程序的历史用户信誉度分布和所述应用 程序的活跃用户信誉度分布之间的差值。 99. 根据权利要求 98 所述的方法, 其特征在于, 。
31、通过计算应用程序排行榜中所有应用 程序的历史用户信誉度分布和所述应用程序的活跃用户信誉度分布之间的余弦距离来计 算它们之间的差值。 权 利 要 求 书 CN 103559208 A 8 8/9 页 9 100. 根据权利要求 67 所述的方法, 其特征在于, 在所述证据验证步骤中, 综合考虑所 述至少一个证据, 将基于所述至少一个证据验证得到的对应欺诈参数进行加权计算, 从而 得到所述欺诈参数。 101. 根据权利要求 67-100 中任一项所述的方法, 其特征在于, 所述方法进一步包括 : 欺诈参数判断步骤, 将所述欺诈参数与一阈值进行比较, 从而判断所述应用程序是否 存在排名欺诈。 102。
32、. 根据权利要求 66 所述的方法, 其特征在于, 所述方法还包括 : 将所检测出的所述 排名欺诈检测结果发送给应用程序商店运营商、 应用程序用户中的至少一个。 103. 一种应用程序的排名欺诈检测系统, 其特征在于, 所述系统包括 : 排名欺诈检测单元, 用于基于至少一个证据对应用程序的活跃期进行检测, 得到排名 欺诈检测结果。 104. 根据权利要求 104 所述的系统, 其特征在于, 所述排名欺诈检测单元进一步包括 : 证据验证模块, 用于基于至少一个证据对所述活跃期进行验证并得到一欺诈参数。 105. 根据权利要求 104 所述的系统, 其特征在于, 所述排名欺诈检测单元进一步包括 :。
33、 活跃事件分析模块, 用于识别所述活跃期中至少一个活跃事件的上升阶段、 保持阶段 和下降阶段。 106. 根据权利要求 105 所述的系统, 其特征在于, 所述活跃事件分析模块, 用于确定所 述活跃事件中所述应用程序的排名在一峰值范围 R 内的第一个时间和最后一个时间, 将 所述第一个时间和所述最后一个时间之间的时间段识别为所述保持阶段, 将所述活跃事件 中在保持阶段之前的时间段识别为所述上升阶段, 将所述活跃事件中在保持阶段之后的时 间段识别为所述下降阶段。 107. 根据权利要求 105 所述的系统, 其特征在于, 所述证据基于所述活跃期内的活跃 事件中的上升阶段和 / 或下降阶段构成。 。
34、108. 根据权利要求 105 所述的系统, 其特征在于, 所述证据基于所述活跃期内的活跃 事件中的保持阶段构成。 109. 根据权利要求 104 所述的系统, 其特征在于, 所述证据基于所述活跃期内活跃事件的数量构成。 110. 根据权利要求 104 所述的系统, 其特征在于, 所述证据基于所述活跃期内的平均 评价和历史平均评价构成。 111. 根据权利要求 104 所述的系统, 其特征在于, 所述证据基于应用程序在所述活跃 期内的评价等级的分布和历史评价信息中评价等级的分布构成。 112. 根据权利要求 104 所述的系统, 其特征在于, 所述证据基于所述活跃期内用户评 论间的相似程度构成。
35、。 113. 根据权利要求 104 所述的系统, 其特征在于, 所述证据基于应用程序在所述活跃 期内用户评论的主题分布和历史评论信息中用户评论的主题分布构成。 114. 根据权利要求 104 所述的系统, 其特征在于, 所述证据基于所述应用程序的活跃 用户平均信誉度和所述应用程序的历史用户平均信誉度构成。 115. 根据权利要求 104 所述的系统, 其特征在于, 所述证据基于所述应用程序的活跃 用户平均信誉度和应用程序排行榜中所有应用程序的历史用户平均信誉度构成。 权 利 要 求 书 CN 103559208 A 9 9/9 页 10 116. 根据权利要求 104 所述的系统, 其特征在于。
36、, 所述证据基于所述应用程序的活跃 用户信誉度分布和所述应用程序的历史用户信誉度分布构成。 117. 根据权利要求 104 所述的系统, 其特征在于, 所述证据基于所述应用程序的活跃 用户信誉度分布和应用程序排行榜中所有应用程序的历史用户信誉度分布构成。 118. 根据权利要求 104 所述的系统, 其特征在于, 所述证据验证模块, 用于综合考虑所 述至少一个证据, 将基于所述至少一个证据验证得到的对应欺诈参数进行加权计算, 从而 得到所述欺诈参数。 119. 根据权利要求 104-118 中任一项所述的系统, 其特征在于, 所述排名欺诈检测单 元进一步包括 : 欺诈参数判断模块, 用于将所述。
37、欺诈参数与一阈值进行比较, 从而判断所述应用程序 是否存在排名欺诈。 120. 根据权利要求 103 所述的系统, 其特征在于, 所述系统还包括一排名欺诈检测结 果发送单元, 用于将所检测出的所述排名欺诈检测结果发送给应用程序商店运营商、 应用 程序用户中的至少一个。 权 利 要 求 书 CN 103559208 A 10 1/21 页 11 应用程序的排名欺诈检测方法和排名欺诈检测系统 技术领域 0001 本发明涉及网络领域, 尤其涉及一种应用程序的排名欺诈检测方法和排名欺诈检 测系统。 背景技术 0002 用户应用程序, 尤其是安装并运行于移动终端的移动应用程序近年来发展迅速。 为了方便用。
38、户选择并安装应用程序, 很多应用程序网站或应用程序商店会集中地提供应用 程序的查询、 下载、 用户评价或评论等服务, 同时还会定期地, 例如每日, 发布应用程序排行 榜 (Application Leaderboard) 以体现一些当前受用户欢迎的应用程序。事实上, 该排行 榜是促销应用程序的最重要手段之一, 应用程序在排行榜上很高的排名通常会刺激用户大 量下载该应用程序, 并为应用程序开发者带来巨大的经济收益。 因此, 应用程序开发者非常 希望其应用程序在排行榜上占据更高的排名。 0003 应用程序的排名欺诈 (Ranking Fraud) 是指目的在于提高应用程序在应用程序排 行榜上的排名。
39、而进行的欺骗行为。事实上, 不同于依赖传统的市场手段来提高应用程序排 名, 应用程序开发者通过夸大其产品销量或发布虚假的产品评价来实施排名欺诈的行为已 经越来越普遍, 例如雇佣 “水军 (human water armies) ” 来在短时间内提升应用程序的下载 量和评价次数等。 0004 业界已经意识到防止排名欺诈以使应用程序用户获得真实的应用程序排名信息 的重要性。为了防止应用程序的排名欺诈, 现有的办法是根据一天内应用程序排名上升的 程度来推断排名欺诈行为的存在, 并在判断出现排名欺诈的时候直接锁定整个应用程序的 排名, 这种方式过于简单粗暴, 难以准确判断排名欺诈行为而且伤害了正常应用。
40、程序的排 名上升。 可见, 本领域对于应用程序的排名欺诈检测问题的理解和研究还非常有限, 至今还 不存在有效检测应用程序的排名欺诈的相关技术。 发明内容 0005 本发明的目的在于提供一种应用程序的排名欺诈的检测技术, 从而自动地有效识 别出与应用程序有关的排名欺诈行为, 以使应用程序用户获得真实的应用程序排名信息。 0006 为解决上述技术问题, 根据本发明的一个方面, 提供一种应用程序的排名欺诈检 测方法, 所述方法包括 : 0007 活跃期检测步骤, 基于历史排名信息检测所述应用程序的活跃期 ; 0008 排名欺诈检测步骤, 基于至少一个证据对所述活跃期进行检测, 得到排名欺诈检 测结果。
41、。 0009 根据本发明的另一个方面, 还提供一种应用程序的排名欺诈检测系统, 所述系统 包括 : 0010 活跃期检测单元, 用于基于历史排名信息检测所述应用程序的活跃期 ; 0011 排名欺诈检测单元, 用于基于至少一个证据对所述活跃期进行检测, 得到排名欺 说 明 书 CN 103559208 A 11 2/21 页 12 诈检测结果。 0012 根据本发明的另一个方面, 还提供一种应用程序的排名欺诈检测方法, 所述方法 包括 : 0013 基于至少一个证据对应用程序的活跃期进行检测, 得到排名欺诈检测结果。 0014 根据本发明的另一个方面, 还提供一种应用程序的排名欺诈检测系统, 所。
42、述系统 包括 : 0015 排名欺诈检测单元, 用于基于至少一个证据对应用程序的活跃期进行检测, 得到 排名欺诈检测结果。 0016 本发明的方法及系统能够自动地有效识别出与应用程序有关的排名欺诈行为, 从 而使应用程序用户获得真实的应用程序排名信息。 附图说明 0017 图 1 是本发明具体实施方式中应用程序的活跃期检测方法的流程图 ; 0018 图 2a 是在应用程序排行榜中活跃事件的一个示例 ; 0019 图 2b 是在应用程序排行榜中活跃期的一个示例 ; 0020 图 3 是应用程序的一个活跃事件中不同排名阶段的示意图 ; 0021 图 4a 是一个疑似存在排名欺诈的应用程序的排名记录。
43、示意图 ; 0022 图 4b 是一个正常应用程序的排名记录示意图 ; 0023 图 5 是本发明具体实施方式中应用程序的排名欺诈检测系统的系统结构图 ; 0024 图 6 是本发明另一实施例中应用程序的排名欺诈检测系统的结构示意图。 具体实施方式 0025 下面结合附图和实施例, 对本发明的具体实施方式作进一步详细说明。以下实施 例用于说明本发明, 但不用来限制本发明的范围。 0026 本发明针对与应用程序排名相关的技术问题进行研究, 因此本领域技术人员对本 发明中的 “应用程序” 应做广义理解, 其包括可发布于互联网并可供用户下载、 评价、 执行的 各种程序或文件, 即包括运行于个人电脑中。
44、的传统应用程序、 运行于移动终端的移动应用 程序, 也包括可下载并播放的图片、 音频、 视频等多媒体文件等。 0027 在检测应用程序的排名欺诈时, 有几个需要解决的重要问题。 首先, 在应用程序的 整个生命周期中并不会总出现排名欺诈, 因此首先需要检测可能出现排名欺诈的时间 ; 第 二, 由于应用程序数量巨大, 很难手工地为每个出现排名欺诈的应用程序进行标定, 因此需 要提供一种自动检测排名欺诈的技术 ; 第三, 现有技术中并不确定可基于何种依据来检测 排名欺诈的存在。 0028 本发明的一个具体实施方式对应用程序的排名欺诈行为进行了整体性的分析和 研究, 提供了一种可检测应用程序的排名欺诈。
45、的技术, 其可通过对应用程序的历史排名信 息的分析来检测应用程序的 “活跃期” , 针对活跃期中应用程序的特定特征 (包括排名特征、 用户评价特征、 用户评论特征、 活跃用户信誉度特征等) , 基于至少一个证据来进行排名欺 诈的检测。 0029 根据发明人的分析发现, 存在排名欺诈的应用程序并不会长期在排名榜上占据很 说 明 书 CN 103559208 A 12 3/21 页 13 高的排名, 排名较高的情况仅是作为一些独立事件集中发生在一段相对较短的时期内, 这 表明排名欺诈行为正是发生在这段时期内。在本发明中, 可将应用程序持续排名较高的时 期称为应用程序的 “活跃事件 (Leading。
46、 Event) ” , 可将频繁发生活跃事件的时期称为应用 程序的 “活跃期 (Leading Session) ” 。因此, 对于排名欺诈的检测首先需要检测每个应用 程序有可能存在排名欺诈的该活跃事件和该活跃期。 0030 应用程序商店运营商处拥有应用程序的历史排名信息, 从应用程序商店运营商处 直接获取, 或通过对应用程序商店运营商在一段较长历史时期内持续发布的应用程序排行 榜信息进行分析和处理, 也可以获得应用程序的历史排名信息。由于应用程序的该历史排 名信息记载了有关应用程序排名的历史信息、 有关应用程序的用户评价的历史信息、 有关 应用程序的用户评论的历史信息和有关应用程序的用户信誉。
47、度的历史信息等多种信息, 因 此在本发明具体实施方式中, 可以基于该历史排名信息来进行每个应用程序的活跃事件和 活跃期的检测, 并进而实现对排名欺诈的检测。 通过分析应用程序的排名行为发现, 相比于 正常的应用程序而言, 存在排名欺诈的应用程序在活跃事件和活跃期内会呈现成不同的特 定特征。 因此, 有可能从应用程序的历史排名信息中抽取出一些用于判定排名欺诈的证据, 并获取这些证据, 从而实现对排名欺诈的检测。 0031 如图 1 所示, 本发明的一个具体实施方式中提供了一种应用程序的排名欺诈检测 方法, 所述方法包括 : 0032 活跃期检测步骤 S10, 基于历史排名信息检测所述应用程序的活。
48、跃期 ; 排名欺诈 检测步骤 S20, 基于至少一个证据来对所述活跃期进行检测, 得到排名欺诈检测结果。 0033 下面, 结合附图来说明本发明具体实施方式中上述排名欺诈检测方法的各步骤流 程和功能。 0034 由于历史排名信息是本发明中检测应用程序的排名欺诈的数据基础, 因此作为本 发明的一个优选实施方式, 该排名欺诈检测方法还可包括一历史排名信息获取步骤, 获取 所述应用程序在应用程序排行榜上的历史排名信息。 0035 应用程序排行榜通常可显示受欢迎的排名前 K 位的应用程序, 例如前 1000 位等。 而且, 应用程序排行榜通常会定期更新, 例如每日进行更新。因此, 对于每个应用程序 a。
49、 而 言都有其历史排名信息, 该历史排名信息可以包括表示为一个与离散时间序列对应的排名 序列 Ra r1a,.,ria,.,rna, 该离散时间序列中的时间点之间的间隔固定, 即应用程序 排行榜的更新周期。 其中, ria是该应用程序a在时间ti时的排名, ria1,.,K.,+, +表示应用程序a不在排行榜排名前K位之列 ; n表示所有历史排名信息所对应的时间点 总数。例如, 在排行榜每天更新的情况下, ti就表示该段历史中的第 i 天, n 就是历史排名 信息所对应的总天数。可以看出, ria的值越小, 说明应用程序 a 第 i 天在排行榜上的排名 越高。 0036 在一个应用程序被发布后, 任何用户都可以对其进行评价。 实际上, 用户评价对于 应用程序推广而言是最重要的特征之一。 具有越高评价的应用程序就会吸引越多的用户来 购买或下载它, 并导致该应用程序在排行榜上的更高排名。 因而在历史排名信息中, 可以包 括历史评价信息, 即历史各时间段中应用程序的用户对该应用程序做出的评价信息。 0037 同样, 在一个应用程序被发布后, 任何用户都可以对其进行文字性的评论。实际 上, 用户评论对于应用程序推广而言是。