《一种可信行为识别的方法和装置.pdf》由会员分享,可在线阅读,更多相关《一种可信行为识别的方法和装置.pdf(20页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103593609 A (43)申请公布日 2014.02.19 CN 103593609 A (21)申请号 201210293487.8 (22)申请日 2012.08.16 G06F 21/55(2013.01) G06F 17/30(2006.01) (71)申请人 阿里巴巴集团控股有限公司 地址 英属开曼群岛大开曼资本大厦一座四 层 847 号邮箱 (72)发明人 李剑 (74)专利代理机构 北京润泽恒知识产权代理有 限公司 11319 代理人 赵娟 (54) 发明名称 一种可信行为识别的方法和装置 (57) 摘要 本申请提供了一种可信行为识别的方法和装 置。
2、, 其中所述方法包括 : 预置可信行为数据集合 以及不可信行为数据集合 ; 获取特定行为的目标 页面焦点行为数据 ; 判断所述目标页面焦点行为 数据归属于可信行为数据集合或不可信行为数 据集合 ; 若归属于可信行为数据集合, 则允许所 述特定行为的执行 ; 若归属于不可信行为数据集 合, 则中止所述特定行为的执行。 本申请的一种可 信行为识别的方法和装置, 用以准确检测出网上 的不可信行为, 提高对可信行为识别的准确性, 尤 其是可信支付行为的准确性, 从而提高用户网上 操作的安全性。 (51)Int.Cl. 权利要求书 4 页 说明书 14 页 附图 1 页 (19)中华人民共和国国家知识产。
3、权局 (12)发明专利申请 权利要求书4页 说明书14页 附图1页 (10)申请公布号 CN 103593609 A CN 103593609 A 1/4 页 2 1. 一种可信行为识别的方法, 其特征在于, 包括 : 预置可信行为数据集合以及不可信行为数据集合 ; 获取特定行为的目标页面焦点行为数据 ; 判断所述目标页面焦点行为数据归属于可信行为数据集合或不可信行为数据集合 ; 若归属于可信行为数据集合, 则允许所述特定行为的执行 ; 若归属于不可信行为数据集合, 则中止所述特定行为的执行。 2. 根据权利要求 1 所述的方法, 其特征在于, 所述预置可信行为数据集合以及不可信 行为数据集合。
4、的步骤包括 : 采集历史的页面焦点行为数据 ; 将所述历史的页面焦点行为数据按指定格式转换为样本数据 ; 对所述样本数据进行聚类, 形成多个相似样本数据的集合 ; 分别确定所述多个相似样本数据的集合的类别, 所述类别为可信行为类别或不可信行 为类别 ; 将可信行为类别的相似样本数据集合组织为可信行为数据集合, 将不可信行为类别的 相似样本数据集合组织为不可信行为数据集合。 3. 根据权利要求 1 或 2 所述的方法, 其特征在于, 所述页面焦点行为数据包括 : 在 web 页面上的焦点行为对象 ; 失去 / 获得焦点行为对象的动作 ; 失去 / 获得焦点行为对象的时间 ; 焦点行为对象的特征信。
5、息, 其中, 所述特征信息包括 : 焦点行为对象在 web 页面上的位 置 ; 焦点行为对象的 src 属性以及 herf 属性 ; 焦点行为对象的宽和高。 4. 根据权利要求 3 所述的方法, 其特征在于, 所述预置可信行为数据集合以及不可信 行为数据集合的步骤还包括 ; 将所采集的历史页面焦点行为数据中的无效数据进行删除 ; 从删除过无效数据的历史页面焦点行为数据中抽样出预设数量的历史页面焦点行为 数据。 5. 根据权利要求 4 所述的方法, 其特征在于, 所述每条样本数据包括如下数据内容 : 焦点移动最小距离 a1 : 是指两两焦点行为对象操作移动距离的最小值 ; 焦点移动最大距离 a2。
6、 : 是指两两焦点行为对象操作移动距离的最大值 ; 焦点移动平均距离 a3 : 是指两两焦点行为对象操作移动距离的平均值 ; 焦点移动最小速度 a4 : 是指两两焦点行为对象操作移动速度的最小值 ; 焦点移动最大速度 a5 : 是指两两焦点行为对象操作移动速度的最大值 ; 焦点移动平均速度 a6 : 是指两两焦点行为对象操作移动速度的平均值 ; 焦点移动总距离 a7 : 是指所有两两焦点行为对象操作移动距离的总和。 6. 根据权利要求 5 所述的方法, 其特征在于, 所述对样本数据进行聚类, 形成多个相似 样本数据的集合的步骤进一步包括 : 若样本数据的集合为 D X1, X2, ., Xn,。
7、 样本数据的容量为 nXi, i 1, n 为某 一样本数据, X a1, a2, ., aJ ; 使用聚类算法对所述样本数据的集合进行聚类, 假设 k 表示聚类的样本数据的数目, 权 利 要 求 书 CN 103593609 A 2 2/4 页 3 Cj, j 1, k 表示第 j 个相似样本数据集合, 则聚类后的类别相似样本数据集合为 : H C1, C2, ., Ck ; 其中, 所述聚类算法为 : 假设 mj为聚类 Cj, j 1, k 的聚类中心, Similar(Xi, mj) 为 Xi和 mj的相似度, 即某 条样本数据 Xi和某个相似样本数据集合 Cj的相似度 ; 定义 Sim。
8、ilarmin为类别最小相似度, Similar(Xi, mj) Similarmin, 且 Similar(Xi, mj) 是 Xi和所有类别聚类中心的最大相似度, 为 Xi属于某个相似样本数据集合 Cj的充分必要 条件, 其中, 所述相似度采用欧式距离取倒数的计算方法。 7. 根据权利要求 6 所述的方法, 其特征在于, 所述分别确定多个相似样本数据的集合 的类别的步骤进一步包括 : 获取所述相似样本数据集合中样本数据的 IP 地址 ; 统计所述相似样本数据集合中各 IP 地址所占百分比的均值, 若高于第一预设阈值, 则 判定当前相似样本数据集合的类别为不可信行为类别 ; 若低于第一预设阈。
9、值, 则判定当前 相似样本数据集合的类别为可信行为类别。 8. 根据权利要求 6 所述的方法, 其特征在于, 所述分别确定多个相似样本数据的集合 的类别的步骤进一步包括 : 获取所述相似样本数据集合中样本数据的 IP 地址和 / 或 MAC 地址 ; 统计所述相似样本数据集合中 IP 地址和 / 或 MAC 地址出现在黑名单中的比率和出现 在白名单中的比率 ; 若出现在黑名单中的比率高于第二预设阈值, 且出现在白名单中的比率低于第三预设 阈值, 则判定当前相似样本数据集合的类别为不可信行为类别 ; 若出现在白名单中的比率高于第三预设阈值, 且出现在黑名单中的比率低于第二预设 阈值, 则判定当前。
10、相似样本数据集合的类别为可信行为类别 ; 若出现在白名单中的比率低于第三预设阈值, 且出现在黑名单中的比率低于第二预设 阈值, 或者, 若出现在白名单中的比率高于第三预设阈值, 且出现在黑名单中的比率高于第 二预设阈值, 则统计所述相似样本数据集合中各 IP 地址所占百分比的均值, 若高于第一预 设阈值, 则判定当前相似样本数据集合的类别为不可信行为类别 ; 若低于第一预设阈值, 则 判定当前相似样本数据集合的类别为可信行为类别。 9. 根据权利要求 1 或 2 或 3 或 5 或 6 或 7 或 8 所述的方法, 其特征在于, 还包括 : 定期更新所述可信行为数据集合以及不可信行为数据集合。。
11、 10. 根据权利要求 9 所述的方法, 其特征在于, 所述目标页面焦点行为数据包括 : 在 web 页面上的焦点行为对象 ; 失去 / 获得焦点行为对象的动作 ; 失去 / 获得焦点行为对象的时间 ; 焦点行为对象的特征信息, 其中, 所述特征信息包括 : 焦点行为对象在 web 页面上的位 置 ; 焦点行为对象的 src 属性以及 herf 属性 ; 焦点行为对象的宽和高。 11. 根据权利要求 2 或 4 或 5 或 6 或 7 或 8 所述的方法, 其特征在于, 所述判断目标页 面焦点行为数据归属于可信行为数据集合或不可信行为数据集合的步骤包括 : 将所述目标页面焦点行为数据中的无效数。
12、据进行删除 ; 权 利 要 求 书 CN 103593609 A 3 3/4 页 4 将删除过无效数据的目标页面焦点行为数据, 转化为所述样本数据的指定格式 ; 根据所述指定格式的目标页面焦点行为数据与可信行为数据集合中相似样本数据集 合的相似度, 以及, 所述指定格式的目标页面焦点行为数据与不可信行为数据集合中相似 样本数据集合的相似度, 判定所述目标页面焦点行为数据归属于可信行为数据集合或不可 信行为数据集合。 12. 根据权利要求 11 所述的方法, 其特征在于, 所述根据指定格式的目标页面焦点行 为数据与可信行为数据集合中相似样本数据集合的相似度, 以及, 所述指定格式的目标页 面焦点。
13、行为数据与不可信行为数据集合中相似样本数据集合的相似度, 判定所述目标页面 焦点行为数据归属于可信行为数据集合或不可信行为数据集合的步骤进一步包括 : 分别计算所述指定格式的目标页面焦点行为数据 X, 与可信行为数据集合中 k1个 相似样本数据集合, 以及, 与不可信行为数据集合中 k2个相似样本数据集合的相似 度 :Similar(X, mj), j 1, k ; 其中, k k1+k2; 从所述 k 个相似度中提取相似度最大值 max(Similar(X, mj), j 1, k ; 假设当 j jr时, Similar(X, mj), j 1, k 获得最大值, 则 : 如果 Simil。
14、ar(X, mj) Similarmn(j jr) , 并且 Cj(j jr) 为可信行为类别的相似 样本数据集合, 则判定当前目标页面焦点行为数据支付行归属于可信行为数据集合 ; 如果 Similar(X, mj) Simlarmn(j jr) , 并且 Cj(j jr) 为不可信行为类别的相似 样本数据集合, 则判定当前目标页面焦点行为数据支付行归属于不可信行为数据集合 ; 如果 Similar(Xmj) Similarmin(j jr) , 则判定当前目标页面焦点行为数据支付行 归属于不可信行为数据集合。 13. 一种可信行为识别的装置, 其特征在于, 包括 : 聚类模块, 用于预置可信。
15、行为数据集合以及不可信行为数据集合 ; 行为焦点数据获取模块, 用于获取特定行为的目标页面焦点行为数据 ; 可信行为判断模块, 用于判断所述目标页面焦点行为数据归属于可信行为数据集合或 不可信行为数据集合 ; 可信行为处理模块, 用于在判定所述目标页面焦点行为数据归属于可信行为数据集合 时, 允许所述特定行为的执行 ; 不可信行为处理模块, 用于在判定所述目标页面焦点行为数据归属于可信行为数据集 合时, 中止所述特定行为的执行。 14. 根据权利要求 13 所述的装置, 其特征在于, 所述聚类模块包括 : 历史数据采集子模块, 用于采集历史的页面焦点行为数据 ; 样本生成子模块, 用于将所述历。
16、史的页面焦点行为数据按指定格式转换为样本数据 ; 聚类处理子模块, 用于对所述样本数据进行聚类, 形成多个相似样本数据的集合 ; 类别确定子模块, 用于分别确定所述多个相似样本数据的集合的类别, 所述类别为可 信行为类别或不可信行为类别 ; 数据集合组织子模块, 用于将可信行为类别的相似样本数据集合组织为可信行为数据 集合, 将不可信行为类别的相似样本数据集合组织为不可信行为数据集合。 15. 根据权利要求 13 或 14 所述的装置, 其特征在于, 所述页面焦点行为数据包括 : 权 利 要 求 书 CN 103593609 A 4 4/4 页 5 在 web 页面上的焦点行为对象 ; 失去 。
17、/ 获得焦点行为对象的动作 ; 失去 / 获得焦点行为对象的时间 ; 焦点行为对象的特征信息, 其中, 所述特征信息包括 : 焦点行为对象在 web 页面上的位 置 ; 焦点行为对象的 src 属性以及 herf 属性 ; 焦点行为对象的宽和高。 16. 根据权利要求 15 所述的装置, 其特征在于, 所述聚类模块还包括 ; 无效数据删除子模块, 与历史数据采集子模块连接, 用于将所采集的历史页面焦点行 为数据中的无效数据进行删除 ; 抽样子模块, 用于从删除过无效数据的历史页面焦点行为数据中抽样出预设数量的历 史页面焦点行为数据, 并传输至样本生成子模块。 17. 根据权利要求 16 所述的。
18、装置, 其特征在于, 所述每条样本数据包括如下数据内容 : 焦点移动最小距离 a1 : 是指两两焦点行为对象操作移动距离的最小值 ; 焦点移动最大距离 a2 : 是指两两焦点行为对象操作移动距离的最大值 ; 焦点移动平均距离 a3 : 是指两两焦点行为对象操作移动距离的平均值 ; 焦点移动最小速度 a4 : 是指两两焦点行为对象操作移动速度的最小值 ; 焦点移动最大速度 a5 : 是指两两焦点行为对象操作移动速度的最大值 ; 焦点移动平均速度 a6 : 是指两两焦点行为对象操作移动速度的平均值 ; 焦点移动总距离 a7 : 是指所有两两焦点行为对象操作移动距离的总和。 18. 根据权利要求 1。
19、3 或 14 或 16 或 17 所述的装置, 其特征在于, 还包括 : 更新模块, 用于定期更新所述可信行为数据集合以及不可信行为数据集合。 19. 根据权利要求 18 所述的装置, 其特征在于, 所述目标页面焦点行为数据包括 : 在 web 页面上的焦点行为对象 ; 失去 / 获得焦点行为对象的动作 ; 失去 / 获得焦点行为对象的时间 ; 焦点行为对象的特征信息, 其中, 所述特征信息包括 : 焦点行为对象在 web 页面上的位 置 ; 焦点行为对象的 src 属性以及 herf 属性 ; 焦点行为对象的宽和高。 20. 根据权利要求 13 或 14 或 16 或 17 或 18 或 1。
20、9 所述的装置, 其特征在于, 所述可信 行为判断模块包括 : 数据清洗子模块, 用于将所述目标页面焦点行为数据中的无效数据进行删除 ; 格式转换子模块, 用于将删除过无效数据的目标页面焦点行为数据, 转化为所述样本 数据的指定格式 ; 相似度判定子模块, 用于根据所述指定格式的目标页面焦点行为数据与可信行为数据 集合中相似样本数据集合的相似度, 以及, 所述指定格式的目标页面焦点行为数据与不可 信行为数据集合中相似样本数据集合的相似度, 判定所述目标页面焦点行为数据归属于可 信行为数据集合或不可信行为数据集合。 权 利 要 求 书 CN 103593609 A 5 1/14 页 6 一种可信。
21、行为识别的方法和装置 技术领域 0001 本申请涉及可信计算的技术领域, 特别是涉及一种可信行为识别的方法和一种可 信行为识别的装置。 背景技术 0002 随着网络技术和应用的飞速发展, 互联网日益呈现出复杂、 异构等特点, 当前的网 络体系已经暴露出严重的不足, 网络正面临着严峻的安全和服务质量保证问题等重大挑 战。例如, 在网络支付中, 用户账户存在大量风险。如 : 账户盗用、 账户欺诈。账户欺诈又包 含很多种形式, 如用户被网络钓鱼、 客户端中木马、 被虚假客服欺诈等等。这些威胁严重影 响了用户账户的资金安全、 信息安全。 0003 目前, 网络可信问题已得到全世界的重视, 保障网络的可。
22、信成为网络进一步发展 的迫切需求。 可信计算是研究网络可信的关键, 尽管目前尚没有一个明确的定义, 但人们对 可信计算的目的都有统一的认识 : 提高网络和服务的安全性。 在可信计算中, 可信信息的来 源包括直接经验、 推荐信息和用户的历史行为数据。 其中, 用户的历史行为数据是一个最客 观的重要信息来源, 其真实地反映了用户的行为变化, 但要从庞杂的用户历史行为数据中 提取出有用的信息是非常困难的。 0004 以网络支付中的可信行为识别为例, 现有技术中, 用户的行为风险分析是根据用 户的业务行为进行判断的, 如针对用户支付过程中, 每个业务操作的行为 : 用户登录 - 用 户浏览商品页面 -。
23、 用户下单购买 - 用户确认支付进行如下分析 : 0005 1) 用户在以上整个支付环节中操作环境的可信度 (如是否为异地登陆) ; 0006 2) 黑白名单可信度判断 (如 : 付款 IP 地址是否在黑名单内) ; 0007 3) 创建交易的 IP 地址是否频率很快等。 0008 这种现有技术往往会出现以下问题 : 0009 a) 批量 CC (ChallengeCollapsar) 攻击引起的异常支付行为, 特别是一些速率较慢 的攻击方式, 如 : 批量创建交易、 炒作信用的行为, 这些异常交易由于完全在攻击者控制之 下进行, 攻击者即是账户的所有者, 基于用户支付行为的可信分析方法无法检。
24、测出异常 ; 0010 b) 在正常用户电脑中木马, 木马在用户电脑上自动创建交易、 自动付款。比如 : 用 户在中木马时, 木马会在用户电脑上自动创建付款交易, 如果用户没有使用安全认证产品、 仅仅使用了数字证书, 或者使用U盾且U盾正好插在电脑上的时候, 就会被木马远程自动创 建交易, 造成用户资金损失。 0011 c) 基于黑白名单、 异地登陆等技术判断支付过程是否可信, 往往会造成较大误杀。 0012 d) 第三方支付平台还会遇到批量盗用的事件。 黑客利用各种方式获取用户认证信 息, 并且, 使用机器爬虫进行批量登录, 批量付款, 批量销赃, 造成支付平台用户大量资金损 失和信息泄露。。
25、 0013 以上只是列举了一些场景, 在这些场景中, 由于在用户登录 - 用户浏览商品页 面 - 用户确认购买 - 用户确认支付的过程中, 用户业务行为都是正常的, 无法检测出不可 说 明 书 CN 103593609 A 6 2/14 页 7 信的支付行为。即采用现有技术很难对可信行为进行准确识别, 尤其是很难对可信支付行 为进行准确识别。 0014 因此, 目前需要本领域技术人员迫切解决的一个技术问题就是 : 提出一种可信行 为识别的机制, 用以准确检测出网上的不可信行为, 提高对可信行为识别的准确性, 尤其是 可信支付行为的准确性, 从而提高用户网上操作的安全性。 发明内容 0015 本。
26、申请的目的是提供一种可信行为识别的方法和装置, 用以准确检测出网上的不 可信行为, 提高对可信行为识别的准确性, 尤其是可信支付行为的准确性, 从而提高用户网 上操作的安全性。 0016 为了解决上述问题, 本申请公开了一种可信行为识别的方法, 包括 : 0017 预置可信行为数据集合以及不可信行为数据集合 ; 0018 获取特定行为的目标页面焦点行为数据 ; 0019 判断所述目标页面焦点行为数据归属于可信行为数据集合或不可信行为数据集 合 ; 0020 若归属于可信行为数据集合, 则允许所述特定行为的执行 ; 0021 若归属于不可信行为数据集合, 则中止所述特定行为的执行。 0022 优。
27、选地, 所述预置可信行为数据集合以及不可信行为数据集合的步骤包括 : 0023 采集历史的页面焦点行为数据 ; 0024 将所述历史的页面焦点行为数据按指定格式转换为样本数据 ; 0025 对所述样本数据进行聚类, 形成多个相似样本数据的集合 ; 0026 分别确定所述多个相似样本数据的集合的类别, 所述类别为可信行为类别或不可 信行为类别 ; 0027 将可信行为类别的相似样本数据集合组织为可信行为数据集合, 将不可信行为类 别的相似样本数据集合组织为不可信行为数据集合。 0028 优选地, 所述页面焦点行为数据包括 : 0029 在 web 页面上的焦点行为对象 ; 0030 失去 / 获。
28、得焦点行为对象的动作 ; 0031 失去 / 获得焦点行为对象的时间 ; 0032 焦点行为对象的特征信息, 其中, 所述特征信息包括 : 焦点行为对象在 web 页面上 的位置 ; 焦点行为对象的 src 属性以及 herf 属性 ; 焦点行为对象的宽和高。 0033 优选地, 所述预置可信行为数据集合以及不可信行为数据集合的步骤还包括 ; 0034 将所采集的历史页面焦点行为数据中的无效数据进行删除 ; 0035 从删除过无效数据的历史页面焦点行为数据中抽样出预设数量的历史页面焦点 行为数据。 0036 优选地, 所述每条样本数据包括如下数据内容 : 0037 焦点移动最小距离 a1 : 。
29、是指两两焦点行为对象操作移动距离的最小值 ; 0038 焦点移动最大距离 a2 : 是指两两焦点行为对象操作移动距离的最大值 ; 0039 焦点移动平均距离 a3 : 是指两两焦点行为对象操作移动距离的平均值 ; 说 明 书 CN 103593609 A 7 3/14 页 8 0040 焦点移动最小速度 a4 : 是指两两焦点行为对象操作移动速度的最小值 ; 0041 焦点移动最大速度 a5 : 是指两两焦点行为对象操作移动速度的最大值 ; 0042 焦点移动平均速度 a6 : 是指两两焦点行为对象操作移动速度的平均值 ; 0043 焦点移动总距离 a7 : 是指所有两两焦点行为对象操作移动距。
30、离的总和。 0044 优选地, 所述对样本数据进行聚类, 形成多个相似样本数据的集合的步骤进一步 包括 : 0045 若样本数据的集合为 D X1, X2, ., Xn, 样本数据的容量为 nXi, i 1, n 为某一样本数据, X a1, a2, ., aJ ; 0046 使用聚类算法对所述样本数据的集合进行聚类, 假设 k 表示聚类的样本数据的数 目, Cj, j 1, k 表示第 j 个相似样本数据集合, 则聚类后的类别相似样本数据集合为 : H C1, C2, ., Ck ; 0047 其中, 所述聚类算法为 : 0048 假设 mj为聚类 Cj, j 1, k 的聚类中心, Sim。
31、ilar(Xi, mj) 为 Xi和 mj的相似度, 即某条样本数据 Xi和某个相似样本数据集合 Cj的相似度 ; 0049 定义 Similarmin为类别最小相似度, Similar(Xi, mj) Similarmin, 且 Similar(Xi, mj) 是 Xi和所有类别聚类中心的最大相似度, 为 Xi属于某个相似样本数据集合 Cj的充分必 要条件, 其中, 所述相似度采用欧式距离取倒数的计算方法。 0050 优选地, 所述分别确定多个相似样本数据的集合的类别的步骤进一步包括 : 0051 获取所述相似样本数据集合中样本数据的 IP 地址 ; 0052 统计所述相似样本数据集合中各 。
32、IP 地址所占百分比的均值, 若高于第一预设阈 值, 则判定当前相似样本数据集合的类别为不可信行为类别 ; 若低于第一预设阈值, 则判定 当前相似样本数据集合的类别为可信行为类别。 0053 优选地, 所述分别确定多个相似样本数据的集合的类别的步骤进一步包括 : 0054 获取所述相似样本数据集合中样本数据的 IP 地址和 / 或 MAC 地址 ; 0055 统计所述相似样本数据集合中 IP 地址和 / 或 MAC 地址出现在黑名单中的比率和 出现在白名单中的比率 ; 0056 若出现在黑名单中的比率高于第二预设阈值, 且出现在白名单中的比率低于第三 预设阈值, 则判定当前相似样本数据集合的类。
33、别为不可信行为类别 ; 0057 若出现在白名单中的比率高于第三预设阈值, 且出现在黑名单中的比率低于第二 预设阈值, 则判定当前相似样本数据集合的类别为可信行为类别 ; 0058 若出现在白名单中的比率低于第三预设阈值, 且出现在黑名单中的比率低于第二 预设阈值, 或者, 若出现在白名单中的比率高于第三预设阈值, 且出现在黑名单中的比率高 于第二预设阈值, 则统计所述相似样本数据集合中各 IP 地址所占百分比的均值, 若高于第 一预设阈值, 则判定当前相似样本数据集合的类别为不可信行为类别 ; 若低于第一预设阈 值, 则判定当前相似样本数据集合的类别为可信行为类别。 0059 优选地, 所述。
34、方法, 还包括 : 0060 定期更新所述可信行为数据集合以及不可信行为数据集合。 0061 优选地, 所述目标页面焦点行为数据包括 : 0062 在 web 页面上的焦点行为对象 ; 说 明 书 CN 103593609 A 8 4/14 页 9 0063 失去 / 获得焦点行为对象的动作 ; 0064 失去 / 获得焦点行为对象的时间 ; 0065 焦点行为对象的特征信息, 其中, 所述特征信息包括 : 焦点行为对象在 web 页面上 的位置 ; 焦点行为对象的 src 属性以及 herf 属性 ; 焦点行为对象的宽和高。 0066 优选地, 所述判断目标页面焦点行为数据归属于可信行为数据。
35、集合或不可信行为 数据集合的步骤包括 : 0067 将所述目标页面焦点行为数据中的无效数据进行删除 ; 0068 将删除过无效数据的目标页面焦点行为数据, 转化为所述样本数据的指定格式 ; 0069 根据所述指定格式的目标页面焦点行为数据与可信行为数据集合中相似样本数 据集合的相似度, 以及, 所述指定格式的目标页面焦点行为数据与不可信行为数据集合中 相似样本数据集合的相似度, 判定所述目标页面焦点行为数据归属于可信行为数据集合或 不可信行为数据集合。 0070 优选地, 所述根据指定格式的目标页面焦点行为数据与可信行为数据集合中相似 样本数据集合的相似度, 以及, 所述指定格式的目标页面焦点。
36、行为数据与不可信行为数据 集合中相似样本数据集合的相似度, 判定所述目标页面焦点行为数据归属于可信行为数据 集合或不可信行为数据集合的步骤进一步包括 : 0071 分别计算所述指定格式的目标页面焦点行为数据 X, 与可信行为数据集合中 k1 个相似样本数据集合, 以及, 与不可信行为数据集合中 k2个相似样本数据集合的相似 度 :Similar(X, mj), j 1, k ; 0072 其中, k k1+k2; 0073 从所述 k 个相似度中提取相似度最大值 max(Similar(X, mj), j 1, k ; 0074 假设当 j jr时, Similar(X, mj), j 1, 。
37、k 获得最大值, 则 : 0075 如果 Similar(X, mj) Similarmn(j jr) , 并且 Cj(j jr) 为可信行为类别的 相似样本数据集合, 则判定当前目标页面焦点行为数据支付行归属于可信行为数据集合 ; 0076 如果 Similar(X, mj) Simlarmn(j jr) , 并且 Cj(j jr) 为不可信行为类别 的相似样本数据集合, 则判定当前目标页面焦点行为数据支付行归属于不可信行为数据集 合 ; 0077 如果 Similar(Xmj) Similarmin(j jr) , 则判定当前目标页面焦点行为数据支 付行归属于不可信行为数据集合。 0078。
38、 本申请实施例还公开了一种可信行为识别的装置, 包括 : 0079 聚类模块, 用于预置可信行为数据集合以及不可信行为数据集合 ; 0080 行为焦点数据获取模块, 用于获取特定行为的目标页面焦点行为数据 ; 0081 可信行为判断模块, 用于判断所述目标页面焦点行为数据归属于可信行为数据集 合或不可信行为数据集合 ; 0082 可信行为处理模块, 用于在判定所述目标页面焦点行为数据归属于可信行为数据 集合时, 允许所述特定行为的执行 ; 0083 不可信行为处理模块, 用于在判定所述目标页面焦点行为数据归属于可信行为数 据集合时, 中止所述特定行为的执行。 0084 优选地, 所述聚类模块包。
39、括 : 说 明 书 CN 103593609 A 9 5/14 页 10 0085 历史数据采集子模块, 用于采集历史的页面焦点行为数据 ; 0086 样本生成子模块, 用于将所述历史的页面焦点行为数据按指定格式转换为样本数 据 ; 0087 聚类处理子模块, 用于对所述样本数据进行聚类, 形成多个相似样本数据的集 合 ; 0088 类别确定子模块, 用于分别确定所述多个相似样本数据的集合的类别, 所述类别 为可信行为类别或不可信行为类别 ; 0089 数据集合组织子模块, 用于将可信行为类别的相似样本数据集合组织为可信行为 数据集合, 将不可信行为类别的相似样本数据集合组织为不可信行为数据集。
40、合。 0090 优选地, 所述页面焦点行为数据包括 : 0091 在 web 页面上的焦点行为对象 ; 0092 失去 / 获得焦点行为对象的动作 ; 0093 失去 / 获得焦点行为对象的时间 ; 0094 焦点行为对象的特征信息, 其中, 所述特征信息包括 : 焦点行为对象在 web 页面上 的位置 ; 焦点行为对象的 src 属性以及 herf 属性 ; 焦点行为对象的宽和高。 0095 优选地, 所述聚类模块还包括 ; 0096 无效数据删除子模块, 与历史数据采集子模块连接, 用于将所采集的历史页面焦 点行为数据中的无效数据进行删除 ; 0097 抽样子模块, 用于从删除过无效数据的。
41、历史页面焦点行为数据中抽样出预设数量 的历史页面焦点行为数据, 并传输至样本生成子模块。 0098 优选地, 所述每条样本数据包括如下数据内容 : 0099 焦点移动最小距离 a1 : 是指两两焦点行为对象操作移动距离的最小值 ; 0100 焦点移动最大距离 a2 : 是指两两焦点行为对象操作移动距离的最大值 ; 0101 焦点移动平均距离 a3 : 是指两两焦点行为对象操作移动距离的平均值 ; 0102 焦点移动最小速度 a4 : 是指两两焦点行为对象操作移动速度的最小值 ; 0103 焦点移动最大速度 a5 : 是指两两焦点行为对象操作移动速度的最大值 ; 0104 焦点移动平均速度 a6。
42、 : 是指两两焦点行为对象操作移动速度的平均值 ; 0105 焦点移动总距离 a7 : 是指所有两两焦点行为对象操作移动距离的总和。 0106 优选地, 所述装置, 还包括 : 0107 更新模块, 用于定期更新所述可信行为数据集合以及不可信行为数据集合。 0108 优选地, 所述目标页面焦点行为数据包括 : 0109 在 web 页面上的焦点行为对象 ; 0110 失去 / 获得焦点行为对象的动作 ; 0111 失去 / 获得焦点行为对象的时间 ; 0112 焦点行为对象的特征信息, 其中, 所述特征信息包括 : 焦点行为对象在 web 页面上 的位置 ; 焦点行为对象的 src 属性以及 。
43、herf 属性 ; 焦点行为对象的宽和高。 0113 优选地, 所述可信行为判断模块包括 : 0114 数据清洗子模块, 用于将所述目标页面焦点行为数据中的无效数据进行删除 ; 0115 格式转换子模块, 用于将删除过无效数据的目标页面焦点行为数据, 转化为所述 说 明 书 CN 103593609 A 10 6/14 页 11 样本数据的指定格式 ; 0116 相似度判定子模块, 用于根据所述指定格式的目标页面焦点行为数据与可信行为 数据集合中相似样本数据集合的相似度, 以及, 所述指定格式的目标页面焦点行为数据与 不可信行为数据集合中相似样本数据集合的相似度, 判定所述目标页面焦点行为数据。
44、归属 于可信行为数据集合或不可信行为数据集合 0117 与现有技术相比, 本申请包括以下优点 : 0118 现有技术中, 面对真实环境中的海量数据, 没有很好的手段能够将用户行为进行 分类 (分类要求用户类别已知、 用户每一类别的特征已知) , 而本申请通过采集用户的历史 页面焦点行为数据, 进行建模分析, 将用户行为聚类成不同类别, 并标记出可信类别和非可 信类别。 然后在用户特定行为过程中, 基于页面焦点行为数据进行可信支付行为分析, 通过 实时采集用户操作数据, 与预置的聚类类别进行对比, 从而实现对用户的特定行为实时地 可信判断。本申请能够更加细致、 精确地描述用户的特定行为, 对于不。
45、可信的行为, 能够更 准确的被发现, 并会对不可信行为发起验证或阻断该特定行为的继续执行, 从而可以有效 提高用户网上操作的安全性。 附图说明 0119 图 1 是本申请的一种可信行为识别的方法实施例的步骤流程图 ; 0120 图 2 是本申请的一种可信行为识别的装置实施例的结构框图。 具体实施方式 0121 为使本申请的上述目的、 特征和优点能够更加明显易懂, 下面结合附图和具体实 施方式对本申请作进一步详细的说明。 0122 本申请实施例的核心构思之一在于, 采用基于页面焦点行为的可信分析机制对用 户的特定行为进行可信识别, 具体而言, 即通过采集用户在特定业务过程中 (如网络支付业 务过。
46、程中) 的页面焦点行为, 使用页面焦点行为数据对用户行为进行刻画, 对历史行为进行 建模聚类, 并对用户的特定行为进行实时的可信支付判断。 若为可信行为, 则允许该特定行 为继续执行, 若为不可信行为, 则向用户发起验证或阻断该特定行为的继续执行。 0123 参照图 1, 其示出了本申请的一种可信行为识别的方法实施例 1 的步骤流程图, 具 体可以包括如下步骤 : 0124 步骤 101, 预置可信行为数据集合以及不可信行为数据集合 ; 0125 在本申请的一种优选实施例中, 所述可信行为数据集合以及不可信行为数据集合 可以通过对历史的页面焦点行为数据进行建模聚类生成, 具体可以包括如下子步骤。
47、 : 0126 子步骤 S11, 采集历史的页面焦点行为数据 ; 0127 页面焦点行为数据是指在 web 页面中, 用户正在操作的对象的相关数据。比如, 用 户正在输入用户名, 页面焦点行为对象就是页面的用户名输入框 ; 用户正在输入密码, 页面 焦点行为对象就是页面的密码输入框。页面焦点行为描述了用户在页面上操作的轨迹, 可 以用于刻画用户的行为。 0128 页面焦点行为可以包括页面对象获得焦点和失去焦点两种行为。 在本申请实施例 中, 所述页面焦点行为数据可以包括 : 说 明 书 CN 103593609 A 11 7/14 页 12 0129 在 web 页面上的焦点行为对象 ; 01。
48、30 失去 / 获得焦点行为对象的动作 ; 0131 失去 / 获得焦点行为对象的时间 ; 0132 焦点行为对象的特征信息, 其中, 所述特征信息包括 : 焦点行为对象在 web 页面上 的位置 ; 焦点行为对象的 src 属性以及 herf 属性 ; 焦点行为对象的宽和高。 0133 例如, 假设所采集的历史页面焦点行为数据包括如下数据分组 : 0134 y:118,x:182,type:1,target:username,time:125, src= www. , 0135 y:118,x:182,type:0,target:username,time:225, src= www. , 0136 y:356,x:678,type:1,target:password,time:525, herf www. , 0137 y:356,x:678,type:0,targe。