基于核心网侧的无线个性化精准信息主动推送系统及方法.pdf

上传人:000****221 文档编号:4295251 上传时间:2018-09-13 格式:PDF 页数:22 大小:716.28KB
返回 下载 相关 举报
摘要
申请专利号:

CN201110406878.1

申请日:

2011.12.08

公开号:

CN102523274A

公开日:

2012.06.27

当前法律状态:

终止

有效性:

无权

法律详情:

未缴年费专利权终止IPC(主分类):H04L 29/08申请日:20111208授权公告日:20151007终止日期:20161208|||专利权人的姓名或者名称、地址的变更IPC(主分类):H04L 29/08变更事项:专利权人变更前:北京亿赞普网络技术有限公司变更后:亿赞普(中国)网络技术有限公司变更事项:地址变更前:100081 北京市海淀区中关村南大街甲18号院2号楼1607变更后:100081 北京市海淀区中关村南大街甲18号院2号楼1607|||授权|||公开

IPC分类号:

H04L29/08

主分类号:

H04L29/08

申请人:

北京亿赞普网络技术有限公司

发明人:

刘生; 罗峰; 黄苏支; 李娜

地址:

100081 北京市海淀区中关村南大街甲18号院2号楼1607

优先权:

2011.06.28 CN 201110176700.2

专利代理机构:

北京润泽恒知识产权代理有限公司 11319

代理人:

赵娟

PDF下载: PDF下载
内容摘要

本申请提供了一种基于核心网侧的无线个性化精准信息主动推送系统及方法,其中,所述方法包括:步骤S11、接收用户提交的3G无线网络连接请求,所述连接请求中包括用户身份信息;步骤S12、判断是否存在所述用户身份信息对应的个性化信息记录;若是,则执行步骤S13;步骤S13、判断所述个性化信息记录是否满足预置规则,若是,则执行步骤S14;步骤S14、根据所述个性化信息记录,向该用户推送个性化页面。本申请可以针对用户提供精准的个性化服务,并提升用户的3G业务使用的易操作性,减少流量的使用。

权利要求书

1: 一种基于核心网侧的无线个性化精准信息主动推送系统, 其特征在于 : 包括搭载在 核心网上接受无线用户请求信息的核心网设备, 所述核心网设备将无线用户请求信息分光 或镜像给核心网上的用户识别分析导航模块, 所述核心网络将用户请求发送给搭载在互联 网上的能提供用户 ID 识别和精确识别、 提供精确个性化页面并对用户个性化修改进行保 存的用户精准化个性 WEB 服务器。2: 根据权利要求 1 所述的基于核心网侧的无线个性化精准信息主动推送系统, 其特征 在于 : 所述用户识别分享导航模块上搭载有对用户进行行为分析和个性化业务挖掘的用户 行为分析引擎和用户识别引擎。3: 根据权利要求 1 或 2 所述的基于核心网侧的无线个性化精准信息主动推送系统, 其 特征在于 : 所述用户识别分析导航模块将精确分析后的数据反馈给核心网络设备, 通过核 心网络设备对用户精确访问精确化主页进行引导。4: 一种基于核心网侧的无线个性化精准信息主动推送方法, 其特征在于, 包括 : 步骤 S11、 接收用户提交的 3G 无线网络连接请求, 所述连接请求中包括用户身份信息 ; 步骤 S12、 判断是否存在所述用户身份信息对应的个性化信息记录 ; 若是, 则执行步骤 S13 ; 步骤 S13、 判断所述个性化信息记录是否满足预置规则, 若是, 则执行步骤 S14 ; 步骤 S14、 根据所述个性化信息记录, 向该用户推送个性化页面。5: 根据权利要求 4 所述的方法, 其特征在于, 还包括 : 步骤 S15、 若不存在所述用户身份信息对应的个性化信息记录, 则生成用户当次连接请 求对应的 IP 信息, 并建立所述用户身份信息与 IP 信息的关联 ; 步骤 S16、 收集用户基于当前 IP 信息提交的 3G 无线网络的操作信息, 生成对应的个性 化信息记录 ; 并建立所述用户身份信息与个性化信息记录的关联 ; 转步骤 S13。6: 根据权利要求 5 所述的方法, 其特征在于, 还包括 : 若所述个性化信息记录不满足预置规则, 则返回步骤 S16。7: 根据权利要求 4 或 5 或 6 所述的方法, 其特征在于, 所述个性化信息记录包括所述用 户的 3G 无线网络操作行为信息, 和 / 或, 针对所述用户的 3G 无线网络操作生成的网络数据 报文, 所述判断个性化信息记录是否满足预置规则的步骤包括 : 对所述用户的 3G 无线网络操作行为信息进行行为分析, 和 / 或, 对所述针对用户的 3G 无线网络操作生成的网络数据报文进行数据挖掘, 获得用户行为的特征参数 ; 判断所述用户行为的特征参数是否满足预设阈值。8: 根据权利要求 7 所述的方法, 其特征在于, 所述根据个性化信息记录, 向该用户推送 个性化页面的步骤包括 : 根据所述个性化信息记录生成当前用户的个性化标识 ; 根据所述个性化标识生成匹配的页面导航, 由所述页面导航以重定向的方式向用户推 送对应的个性化页面。9: 根据权利要求 8 所述的方法, 其特征在于, 还包括 : 步骤 S17、 接收用户在对应个性化页面上的修改, 并保存所述修改。10: 根据权利要求 8 或 9 所述的方法, 其特征在于, 所述步骤 S11、 步骤 S12、 步骤 S13、 步骤 S15、 步骤 S16 在核心网侧执行 ; 所述步骤 S14、 步骤 S17 在互联网侧执行。 211: 一种基于核心网侧的无线个性化精准信息主动推送装置, 其特征在于, 包括 : 连接模块, 用于接收用户提交的 3G 无线网络连接请求, 所述连接请求中包括用户身份 信息 ; 用户个性化记录判断模块, 用于判断是否存在所述用户身份信息对应的个性化信息记 录; 若是, 则调用预置规则判断模块 ; 预置规则判断模块, 用于判断所述个性化信息记录是否满足预置规则 ; 若是, 则调用个 性化页面推送模块 ; 个性化页面推送模块, 用于根据所述个性化信息记录, 向该用户推送个性化页面。12: 根据权利要求 11 所述的装置, 其特征在于, 还包括 : IP 信息生成模块, 用于在不存在所述用户身份信息对应的个性化信息记录时, 生成用 户当次连接请求对应的 IP 信息, 并建立所述用户身份信息与 IP 信息的关联 ; 个性化信息记录模块, 用于收集用户基于当前 IP 信息提交的 3G 无线网络的操作信息, 生成对应的个性化信息记录 ; 并建立所述用户身份信息与个性化信息记录的关联 ; 所述个 性化信息记录模块与预置规则判断模块相连。13: 根据权利要求 12 所述的装置, 其特征在于, 若所述预置规则判断模块判断所述个 性化信息记录不满足预置规则, 则调用个性化信息记录模块。14: 根据权利要求 11 或 12 或 13 所述的装置, 其特征在于, 所述个性化信息记录包括所 述用户的 3G 无线网络操作行为信息, 和 / 或, 针对所述用户的 3G 无线网络操作生成的网络 数据报文, 所述预置规则判断模块包括 : 用户行为特征参数获取子模块, 用于对所述用户的 3G 无线网络操作行为信息进行行 为分析, 和 / 或, 对所述针对用户的 3G 无线网络操作生成的网络数据报文进行数据挖掘, 获 得用户行为的特征参数 ; 阈值判断子模块, 用于判断所述用户行为的特征参数是否满足预设阈值。15: 根据权利要求 14 所述的装置, 其特征在于, 所述个性化页面推送模块包括 : 个性化标识生成子模块, 用于根据所述个性化信息记录生成当前用户的个性化标识 ; 页面重定向子模块, 用于根据所述个性化标识生成匹配的页面导航, 由所述页面导航 以重定向的方式向用户推送对应的个性化页面。16: 根据权利要求 15 所述的装置, 其特征在于, 所述连接模块、 用户个性化记录判断模 块、 预置规则判断模块、 IP 信息生成模块、 个性化信息记录模块位于核心网侧 ; 所述个性化 页面推送模块位于互联网侧。

说明书


基于核心网侧的无线个性化精准信息主动推送系统及方法

    技术领域 本申请涉及移动通信的技术领域, 特别是涉及一种基于核心网侧的无线个性化精 准信息主动推送系统, 一种基于核心网侧的无线个性化精准信息主动推送方法, 以及, 一种 基于核心网侧的无线个性化精准信息主动推送装置。
     背景技术
     人们对信息的即时性和个性化的需求, 推动着 3G 移动网络的快速发展。然而无线 3G 的应用与互联网的应用有着巨大的差别 :
     其一, 终端类型多样化, 且终端显示尺寸远远小于互联网终端 (PC 机等 ), 而且无 线终端的使用没有多少辅助硬件 ( 键盘、 鼠标等 ), 操作易用性远远不如互联网 ;
     其二, 互联网已经非常普及, 固网的费用多采用包月的方式, 因此人们不会太在意 流量的消耗, 但 3G 无线网络刚刚兴起, 运营商的网络硬件成本导致了无线上网时对流量的 关注。
     为提升用户的无线 3G 应用的体验, 现有技术中, 国内的各移动通信运营商相继推 出了各自的 3G 无线门户, 如联通的 “沃门户” 、 移动的 “移动梦网” 、 电信的 “天翼空间” , 然 而, 此类无线门户是针对所有移动用户推出的大众化服务, 尽管提供了用户登录业务、 查询 个人资费信息等个性化服务, 由于需要逐步逐页面地由用户选择及输入, 以搜索和查找其 所需的个性化信息, 操作十分复杂, 繁琐, 并且十分耗费流量。
     因此, 目前需要本领域技术人员迫切解决的一个技术问题就是 : 提出一种基于核 心网侧的无线个性化精准信息主动推送机制, 用以针对用户提供精准的个性化服务, 并提 升用户的 3G 业务使用的易操作性, 减少流量的使用。 发明内容
     本申请的目的是, 提供一种基于核心网侧的无线个性化精准信息主动推送方法, 针对用户提供精准的个性化服务, 并提升用户的 3G 业务使用的易操作性, 减少流量的使 用。
     相应的, 本申请还提供了一种基于核心网侧的无线个性化精准信息主动推送系 统, 以及, 一种基于核心网侧的无线个性化精准信息主动推送装置, 用以保证上述方法在实 际中的实现和应用。
     为了解决上述问题, 本申请公开了一种基于核心网侧的无线个性化精准信息主动 推送系统, 包括搭载在核心网上接受无线用户请求信息的核心网设备, 所述核心网设备将 无线用户请求信息分光或镜像给核心网上的用户识别分析导航模块, 所述核心网络将用户 请求发送给搭载在互联网上的能提供用户 ID 识别和精确识别、 提供精确个性化页面并对 用户个性化修改进行保存的用户精准化个性 WEB 服务器。
     优选的, 所述用户识别分享导航模块上搭载有对用户进行行为分析和个性化业务 挖掘的用户行为分析引擎和用户识别引擎。优选的, 所述用户识别分析导航模块将精确分析后的数据反馈给核心网络设备, 通过核心网络设备对用户精确访问精确化主页进行引导。
     本申请实施例还公开了一种基于核心网侧的无线个性化精准信息主动推送方法, 包括 :
     步骤 S11、 接收用户提交的 3G 无线网络连接请求, 所述连接请求中包括用户身份 信息 ;
     步骤 S12、 判断是否存在所述用户身份信息对应的个性化信息记录 ; 若是, 则执行 步骤 S13 ;
     步骤 S13、 判断所述个性化信息记录是否满足预置规则, 若是, 则执行步骤 S14 ;
     步骤 S14、 根据所述个性化信息记录, 向该用户推送个性化页面。
     优选的, 所述的方法, 还包括 :
     步骤 S15、 若不存在所述用户身份信息对应的个性化信息记录, 则生成用户当次连 接请求对应的 IP 信息, 并建立所述用户身份信息与 IP 信息的关联 ;
     步骤 S16、 收集用户基于当前 IP 信息提交的 3G 无线网络的操作信息, 生成对应的 个性化信息记录 ; 并建立所述用户身份信息与个性化信息记录的关联 ; 转步骤 S13。 优选的, 所述的方法, 还包括 :
     若所述个性化信息记录不满足预置规则, 则返回步骤 S16。
     优选的, 所述个性化信息记录包括所述用户的 3G 无线网络操作行为信息, 和 / 或, 针对所述用户的 3G 无线网络操作生成的网络数据报文, 所述判断个性化信息记录是否满 足预置规则的步骤包括 :
     对所述用户的 3G 无线网络操作行为信息进行行为分析, 和 / 或, 对所述针对用户 的 3G 无线网络操作生成的网络数据报文进行数据挖掘, 获得用户行为的特征参数 ;
     判断所述用户行为的特征参数是否满足预设阈值。
     优选的, 所述根据个性化信息记录, 向该用户推送个性化页面的步骤包括 :
     根据所述个性化信息记录生成当前用户的个性化标识 ;
     根据所述个性化标识生成匹配的页面导航, 由所述页面导航以重定向的方式向用 户推送对应的个性化页面。
     优选的, 所述的方法, 还包括 :
     步骤 S17、 接收用户在对应个性化页面上的修改, 并保存所述修改。
     优选的, 所述步骤 S11、 步骤 S12、 步骤 S13、 步骤 S15、 步骤 S16 在核心网侧执行 ; 所 述步骤 S14、 步骤 S17 在互联网侧执行。
     本申请实施例还公开了一种基于核心网侧的无线个性化精准信息主动推送装置, 包括 :
     连接模块, 用于接收用户提交的 3G 无线网络连接请求, 所述连接请求中包括用户 身份信息 ;
     用户个性化记录判断模块, 用于判断是否存在所述用户身份信息对应的个性化信 息记录 ; 若是, 则调用预置规则判断模块 ;
     预置规则判断模块, 用于判断所述个性化信息记录是否满足预置规则 ; 若是, 则调 用个性化页面推送模块 ;
     个性化页面推送模块, 用于根据所述个性化信息记录, 向该用户推送个性化页面。
     优选的, 所述的装置, 还包括 :
     IP 信息生成模块, 用于在不存在所述用户身份信息对应的个性化信息记录时, 生 成用户当次连接请求对应的 IP 信息, 并建立所述用户身份信息与 IP 信息的关联 ;
     个性化信息记录模块, 用于收集用户基于当前 IP 信息提交的 3G 无线网络的操作 信息, 生成对应的个性化信息记录 ; 并建立所述用户身份信息与个性化信息记录的关联 ; 所述个性化信息记录模块与预置规则判断模块相连。
     优选的, 若所述预置规则判断模块判断所述个性化信息记录不满足预置规则, 则 调用个性化信息记录模块。
     优选的, 所述个性化信息记录包括所述用户的 3G 无线网络操作行为信息, 和 / 或, 针对所述用户的 3G 无线网络操作生成的网络数据报文, 所述预置规则判断模块包括 :
     用户行为特征参数获取子模块, 用于对所述用户的 3G 无线网络操作行为信息进 行行为分析, 和 / 或, 对所述针对用户的 3G 无线网络操作生成的网络数据报文进行数据挖 掘, 获得用户行为的特征参数 ;
     阈值判断子模块, 用于判断所述用户行为的特征参数是否满足预设阈值。
     优选的, 所述个性化页面推送模块包括 :
     个性化标识生成子模块, 用于根据所述个性化信息记录生成当前用户的个性化标 识;
     页面重定向子模块, 用于根据所述个性化标识生成匹配的页面导航, 由所述页面 导航以重定向的方式向用户推送对应的个性化页面。
     优选的, 所述连接模块、 用户个性化记录判断模块、 预置规则判断模块、 IP 信息生 成模块、 个性化信息记录模块位于核心网侧 ; 所述个性化页面推送模块位于互联网侧。
     与现有技术相比, 本申请包括以下优点 :
     通过核心网侧对用户进行识别, 然后对用户进行长期的网络行为进行分析, 挖掘 出用户的爱好及个性化习惯, 在用户使用 3G 无线网络时, 对用户提供精准个性化信息主 页, 通过精准个性化页面的调度, 提升用户的 3G 业务使用的易操作性, 并减少用户对个性 化信息的搜索及查找, 从而减少用户流量的使用。 附图说明 图 1 为本发明所述基于核心网侧的无线个性化精准信息主动推送系统示意图 ;
     图 2 为本发明所述基于核心网侧的无线个性化精准信息主动推送系统流程图 ;
     图 3 是本申请的一种基于核心网侧的无线个性化精准信息主动推送方法实施例 1 的步骤流程图 ;
     图 4 是本申请的一种用户行为分析方法示例的流程图 ;
     图 5 为根据本申请第一实施例的网络用户分类方法的聚类图模型示意图 ;
     图 6 是本申请的另一种用户行为分析方法示例的流程图 ;
     图 7 是本申请的一种基于核心网侧的无线个性化精准信息主动推送方法实施例 2 的步骤流程图 ;
     图 8 是本申请的一种基于核心网侧的无线个性化精准信息主动推送装置实施例
     的结构框图。 具体实施方式
     为使本申请的上述目的、 特征和优点能够更加明显易懂, 下面结合附图和具体实 施方式对本申请作进一步详细的说明。
     现结合说明书附图 1 和图 2 介绍本申请所述的基于核心网侧的无线个性化精准 信息主动推送系统具体实施方式 : 包括搭载在核心网上接受无线用户请求信息的核心网 设备, 所述核心网设备将无线用户请求信息分光或镜像给核心网上的用户识别分析导航模 块, 所述分光或镜像就是把用户上网信息镜像 ( 复制 ) 出一份给用户识别分析导航模块。 所述核心网络将用户搜索、 访问、 下载请求发送给搭载在互联网上的能提供用户 ID 识别和 精确识别、 提供精确个性化页面并对用户个性化修改进行保存的用户精准化个性 WEB 服务 器。
     所述用户识别分享导航模块上搭载有对用户进行行为分析和个性化业务挖掘的 用户行为分析引擎和用户识别引擎。
     所述用户识别分析导航模块将精确分析后的数据反馈给核心网络设备, 通过核心 网络设备对用户精确访问精确化主页进行引导。 本申请系统通过核心网侧的流量分光 / 镜像平台环境, 对用户进行唯一性识别 ; 通过用户的浏览、 搜索、 下载等行为, 对用户信息进行数据挖掘, 得出用户的精准信息及个 性化潜在需求 ; 通过核心网侧, 对用户进行精准信息及个性化导航服务调度 ; 根据用户对 精准个性化导航页的修改进行保存 ; 当用户再次使用无线时, 对用户进行精准个性化信息 调度。
     本申请系统业务序列 :
     1、 无线用户对使用无线服务权限进行验证, 这些信息中携带手机号码、 IMEI、 IMSI 等用户唯一 ID。
     2、 核心网设备将这些信息分光 / 镜像给用户识别分析导航模块, 用户识别分析导 航模块根据此信息对用户进行唯一识别。
     3、 用户使用无线服务, 进行搜索、 内容访问或下载。
     4、 核心网数据报文分光 / 镜像给用户识别分析导航模块, 用户识别分析导航模块 对用户进行行为分析和个性化业务挖掘。
     5、 用户使用无线服务时, 核心网将数据包分光 / 镜像给用户识别分析导航模块, 如果达到精准个性化页面调度条件, 对用户进行精准个性化页面调度引导 ( 使用重定向技 术 )。
     6、 用户根据引导报文访问精准个性化页面, 精准个性化页面根据与用户识别分析 导航模块的私有协商协议中携带的用户唯一标识和精准个性化标识, 对用户提供精准个性 化页面。
     7、 用户可能会对精准个性化页面进行定制修改, 精准个性化页面将对这些修改进 行保存, 下次用户访问时, 将对展示修改保存生效的精准个性化页面。
     本申请的核心构思之一在于, 通过核心网侧对用户进行识别, 然后对用户长期网 络行为进行分析, 挖掘出用户的爱好及个性化习惯, 在用户使用 3G 无线网络时, 对用户提
     供精准个性化信息主页, 通过精准个性化页面的调度, 提升用户的 3G 业务使用的易操作 性, 并减少用户对个性化信息的搜索及查找, 从而减少用户流量的使用。
     参照图 3, 其示出了本申请的一种基于核心网侧的无线个性化精准信息主动推送 方法实施例 1 的步骤流程图, 具体可以包括如下步骤 :
     步骤 301、 接收用户提交的 3G 无线网络连接请求, 所述连接请求中包括用户身份 信息 ;
     在具体应用中, 当用户访问 3G 无线网络时, 会提交 3G 无线网络连接请求, 所述请 求的报文中会携带用户的身份信息, 如手机号码、 IMEI(International Mobile Equipment Identity, 国际移动设备身份码 )、 IMSI(International Mobile SubscriberIdentity, 国 际移动用户识别码 ) 等用户唯一标识信息。
     步骤 302、 判断是否存在所述用户身份信息对应的个性化信息记录 ; 若否, 则执行 步骤 303 ; 若是, 则执行步骤 305 ;
     步骤 303、 生成用户当次连接请求对应的 IP 信息, 并建立所述用户身份信息与 IP 信息的关联 ; 转步骤 304 ;
     对于用户每次提交的 3G 无线网络连接请求, 都会生成一个对应的临时 IP 信息, 用 户在 3G 无线网络连接之后的网络操作均会携带此临时 IP 信息。通过建立所述用户身份信 息与该临时 IP 信息的关联, 如将所述用户身份信息与该临时 IP 信息进行绑定, 则可以通过 该临时 IP 信息找到对应的用户身份信息, 以实现对用户的唯一识别。 步骤 304、 收集用户基于当前 IP 信息提交的 3G 无线网络的操作信息, 生成对应的 个性化信息记录 ; 并建立所述用户身份信息与个性化信息记录的关联 ; 转步骤 305 ;
     用户在连接 3G 无线网络后, 使用无线服务, 如进行搜索、 内容访问或下载等 3G 无 线网络的操作, 均会携带所述 IP 信息。在实际中, 可以根据所述用户身份信息和 IP 信息创 建对应的个性化信息记录表, 在该表中根据用户的 3G 无线网络的操作信息实时记录对应 的个性化信息。
     在本申请的一种优选实施例中, 所述个性化信息记录可以包括 : 所述用户的 3G 无 线网络操作行为信息, 和 / 或, 针对所述用户的 3G 无线网络操作生成的网络数据报文。其 中, 所述用户的 3G 无线网络操作行为信息可以进一步包括, 用户访问网页的行为信息, 用 户搜索的行为信息, 用户点击的行为信息等。
     步骤 305、 判断所述个性化信息记录是否满足预置规则, 若否, 则返回步骤 304 ; 若 是, 则执行步骤 306 ;
     在本申请的一种优选实施例中, 可以通过以下子步骤 51 和子步骤 S52 判断所述个 性化信息记录是否满足预置规则 :
     子步骤 S51、 对所述用户的 3G 无线网络操作行为信息进行行为分析, 和 / 或, 对所 述针对用户的 3G 无线网络操作生成的网络数据报文进行数据挖掘, 获得用户行为的特征 参数 ;
     为使本领域技术人员更好地理解本申请, 以下提供两种对用户的 3G 无线网络操 作行为信息进行行为分析的示例 :
     示例 1 :
     参照图 4, 其示出了本申请的一种用户行为分析方法示例的流程, 具体可以包括以
     下步骤 :
     子步骤 110, 预先确定多个 ( 对应于第二设定数量 ) 网页类别。
     基于第一设定数量的网页, 来预先确定第二设定数量的网页类别。其中, 每个网 页类别由多个主题构成, 例如, 网页类别为社交网站可以表示为 “社交网站 : 校园、 活动、 旅 游” , 其中, “校园” 、 “活动” 、 “旅游” 为所属网页类别为社交网站的各个主题。首先将第一设 定数量的网页进行主题分类, 然后根据与主题相关联的网页类别来确定第一设定数量的网 页所属的网页类别。例如, 人人网所属的主题为 “校园” , 而 “校园” 与社交网站具有关联性, 则可将人人网的网页类别确定为社交网站。
     具体地, 可以对设定数量 ( 对应于第一设定数量 ) 的网页进行人工分类, 例如, 可 针对现有百万个网页中的几万个或几十万个典型的网页进行人工分类, 得到网页类别, 例 如, 京东网属性为电子商务网站, 人人网属性为社交网站, 美团网为团购网站。
     还可以应用网页自动分类技术将设定数量的网页进行分类得到网页分类。 例如应 用统计学习法, 通过分析经过人工分类的网页, 从中挖掘关键词和类之间的联系, 再利用关 键词和类之间的联系, 对第一设定数量的网页进行分类, 该统计学习法为现有技术, 在此不 再赘述。 子步骤 120, 基于用户的网络行为生成用户的行为特征向量。
     具体地, 可以先获取用户的网络行为, 将用户的网络行为进行预处理, 以获得用户 的行为特征向量。
     预处理过程是整个网络用户分类的基础, 一般包括使用记录预处理、 内容信息预 处理和结构信息预处理, 通过对所获得的用户网络行为进行预处理、 去除冗余信息、 模糊信 息以及无意义信息, 得到精确表征用户网络行为的数据。
     在本申请实施例中, 用于生成用户的行为特征向量的网络行为可以包括网络访问 行为和搜索行为。例如, 可将网络访问行为所访问的网址 ( 本申请中, 将 IP 地址、 网站的中 / 英域名等统称为网址 ) 和搜索行为所涉及的搜索关键词等词汇确定为用户的行为特征向 量的元素, 例如用户进行了京东网、 人人网和美团网的访问行为, 则将所访问的网址中所包 含的词汇 “京东” 、 “人人” 以及 “美团” 等词汇确定为用户的行为特征向量的元素 ; 用户的搜 索行为所涉及的搜索关键词, 例如 “京东” 、 “人人” 以及 “美团” 等词汇确定为用户的行为特 征向量的元素。
     可将用户的行为特征向量 W 表示如下 :
     WUserId = {w1, w2, ..., wn, ...}
     其中, UserId 用以标识用户, wn 是根据用户的网络访问行为或搜索行为所生成的第 n 个特征 ( 亦称词汇 ), 包括用户的网络访问行为和搜索行为。
     举例而言, 某用户访问了 3 个网址并且搜索了 5 个关键字, 则在此用户访问了 3 个 网址的情况下, 这 3 个网址分别表示 3 个特征 ( 词汇 ), 则关于该用户的网络访问行为的用 户行为特征可以用 w1, w 2, w3 来表示, 其中, w1, w2, w3 分别表示用户访问这 3 个网址的次数 ; 而该用户还搜索了 5 个关键字, 则在此用户搜索 5 个关键字的情况下, 可将这 5 个关键字作 为 5 个特征, 则关于该用户的搜索行为的用户行为特征可以 w3+1, w3+2..., w3+5 来表示, 其中 w3+1, w3+2..., w3+5 分别表示用户基于第 1, 2, ..., 5 个关键字进行搜索的次数, 基于以上所述, 则该用户的用户行为特征向量 W 可表示为 WUserId = {w1, w2, w3, w3+1, w3+2..., w3+5}。
     子步骤 130, 基于各用户的行为特征向量进行聚类, 以构建用户 - 主题矩阵 M, 其 中, 用户 - 主题矩阵 M 的各元素值分别表征各用户与各主题之间的关联度, 更具体地, M的 j 第 d 行第 j 列 Md, j 表示第 d 个用户属于第 j 个主题的概率即 θd 。
     主题为经聚类所得到的一个以上特征或赋权特征的集合, 例如, 主题可表示为 “0.1 书包 ; 0.2 校服 ; 0.3 早操 ; 0.4 作业本” , 其中 “书包” 、 “校服” 、 “早操” 、 “作业本” 为特 征, 而它们前面的系数为权重, 将相似的特征聚合为同一主题, 将包含有上述特征的主题设 定为校园, 有利于对用户的网络行为习惯进行分析, 从而便于达到对其进行分类的目的。
     优选地, 可利用主题模型 (Topic Model) 来进行聚类。将各用户的行为特征向量 作为主题模型中特征层的特征向量, 以构建用户主题模型 ( 简称 UTM 模型 ), 并利用该用户 主题模型来实现对用户所进行的聚类, 本实施例的用户主题模型通过采用 Dirichlet 分布 对用户的行为特征向量进行建模。
     图 5 为根据本申请第一实施例的网络用户分类方法的聚类图模型示例。如图 5 所 示, 聚类的图模型具有清晰的层次结构, 每一层由相应的参数或随机变量来表征, 包含特征 层、 主题层和用户层三层结构。图 2 中空心点表示隐含变量, 实心点表示参数, 箭头表示依 赖关系。 用户主题模型是由用户层的参数 α 和参数 β 定义的, 其中, α 反映了用户集合中 隐含主体间的相对强弱, β 反映所有隐含主题自身的概率分布, θ 表示用户中的各隐含主 题的比重, z 表示用户分配在每个特征上的隐含主题比重, w 是用户的特征向量表示形式, P 表示用户集合的数量, n 表示用户所含特征的数量。大矩形表示从 Dirichlet 分布中为用 户集中的每个用户 d 反复抽取主题分布 θ ; 小矩形表示从主题分布中反复抽取特征 w。
     举例而言, 给定一个用户集合 D, 包含了 P 个用户, 每个用户 d 包含一个特征序列 {w1, w2, ..., wn}。在集合 D 对应的 UTM 模型中, 将主题个数设置为 K 个, 为了使得 UTM 模型 易于处理已知用户之外的新的用户, 应用 UTM 模型时, UTM 模型先进行先验概率假设的处 理, 则对一个用户的行为特征向量进行聚类可以表示为以下步骤 :
     1) 从 Dirichlet 分布 p(θ|α) 中为每个用户 d 抽取以多项式分布 θd 表示的主 题, 其中该多项式分布的各项为特征空间上的多项式分布, 具体地, 根据 θ ~ Dir(α), 针 对用户集合 D 中的每个用户, 从 Dirichlet 分布中随机抽取一个 k 维的主题分布 θd, 其表 j 示为每个用户的各个主题比例的混合, 主题分布 θd 中每一维的元素记为 θd , 其表示为用 户 d 属于第 j 个主题的概率, 其中, p(θ|α) 如下式所示,
     其中, α 是一个 K 维的 Dirichlet 参数, αi 为超参量, θ 为参数向量, Γ 为标准 的 gamma 函数, α 反映用户集合 D 中各个主题间的相对强弱, θ 代表每个用户从属各主题 的概率。
     2) 从 Dirichlet 先验 β 中为每个主题抽取特征多项式分布, 具体地, 基于特定主 题比例从 Dirichlet 先验 β 中为每个用户 d 抽取每个特征多项式分布, 以获得 p(wn|θd, β)。其中, β 表示某个主题条件下生成某个特征 ( 词汇 ) 的概率, β 是一个 K×V 的矩阵。
     3) 对于用户集合 D 中所有用户 d 和用户中所有特征 w 进行如下操作, 首先选定主 题 zi, zi 服从 Multinomial(θd) 的多项式分布, 然后选择特征 wi, 在 zi 条件下的多项式分 布, 每个用户 d 中的第 i 个特征 wi 可以如下式所示,
     其中, zi 是潜在主题变量, 表明第 i 个特征 wi 取自该主题, P(wi|zi = j) 是特征 wi 属于主题 j 的概率, P(zi = j) 为主题 j 属于当前用户的概率。则 T 个主题形成 D 个用 表示对于主题 j, 特征 w 的多项式分布, ; 令 表示对于用户 d, K 个主题上的多项分布, 因此在用户 d 中特征 w 的概率如下式 所示,户以 W 个唯一性特征表示, 令
     4) 通过 EM 算法或 Gibbs 抽样法推算出 P(w|d), 然后基于 P(w|d) 间接求得第 d 个 j 用户属于第 j 个主题的概率 θd 以构建用户 - 主题矩阵 M。
     需要说明的是, 由于直接使用 EM 算法估计 θd 会存在局部极值的问题, 因此首先 对于给定的观察值特征 wi, 利用 Gibbs 抽样取特征 ( 词汇 ) 在主题 zi 上的后验概率 P(wi|zi) 的近似值。
     具体地, 在 Gibbs 抽样中, 先固定其他词的主题分配, 然后估计当前特征 wi 赋予各 种主题的概率 P(zi = j), 亦即 P(w|d) 的值, 根据所得 P(w|d) 的值间接的得到 θd 的值。其 j 中, 主题分布 θd 中每一维的元素记为 θd , 其表示为用户 d 属于第 j 个主题的概率, 对用户 集合 D 中的每一个用户进行上述 1) 至 4) 的操作, 即可获得每个用户的主题分布 θd, 基于 所得到的主题分布 θd 构建用户 - 主题矩阵 M。
     子步骤 140, 基于用户 - 主题矩阵 M 来确定用户所属的网页类别。
     更具体地, 基于用户 - 主题矩阵 M, 可以获得用户属于各个主题的概率, 然后根据 这些概率值来确定用户所属的网页类别。 确定方式多种多样, 例如, 可以预先设定各个主题 与各个网页类别的关联程度, 然后, 将使得用户所属的各主题的概率与网页类别的关联程 度的积的和最大的那个网页类别, 作为用户所属的网页类别。
     举例而言, 对于网页类别为社交网站, 预先设定各主题与网页类别的关联程度为 “社交网站 : 0.5 校园 ; 0.3 活动 ; 0.2 旅游” , 对于网页类别为电子商务网站, 预先设定各主题 与网页类别的关联程度为 “电子商务网站 : 0.5 交易 ; 0.3 公司 ; 0.2 电子” , 各个主题前面的 系数为各主题与所属网页类别的关联程度的值, 假定根据步骤 130 所得的某个用户 d 属于 各主题的概率为 “0.3 校园 ; 0.2 活动 ; 0.1 旅游 ; 0.1 交易 ; 0.1 公司 ; 0.2 电子” , 则将该用户 所属的各主题的概率与预先设定各主题所属网页类别的关联程度相乘, 获得与各个网页类 别相关联的各个主题的实际主题概率, 将所属网页类别的各个主题的实际主题概率进行相 加所得的和作为最终结果, 上述例子的最终结果为 “0.23 社交网站 ; 0.12 电子商务网站” , 根据所得的积的和的最大的值, 可知此用户所属的类别为社交网站, 此用户对于社会交往 类的活动感兴趣, 在进行定向广告发送时, 可以向此类用户发送类似于旅游、 休闲的定向广 告。
     示例 2 :
     参照图 6, 其示出了本申请的另一种用户行为分析方法示例的流程, 具体可以包括 以下步骤 :
     子步骤 110、 子步骤 120、 子步骤 130 与图 4 所示的示例 1 基本相同, 为了便于说明, 不再对与前述示例中相同的步骤进行详细展开, 而仅重点说明与前述示例的不同之处。在 图 5 中, 对与前述示例中相同或相似的步骤, 采用了相同的附图标记。
     在本示例中, 在子步骤 140 中具体包括子步骤 141 和 142。
     子步骤 141, 确定前述步骤 110 中的设定数量 ( 对应于第一设定数量 ) 网页的网页 类别所关联的一个或多个主题, 以构建主题 - 类别变换矩阵。
     具体地, 通过统计前述步骤 110 中的设定数量的网页中、 与第 j 个主题相关联且被 分类至第 k 个网页类别的网页数量 t’ j, k 来确定主题 - 类别变换矩阵 T 的第 j 行第 k 列元素 值, j 为小于等于主题数量的自然数, k 为小于等于网页类别数量 ( 即第二设定数量 ) 的自 然数。例如可将主题 - 类别变换矩阵 T 的第 j 行第 k 列的元素赋值为 tj, k = t’ j, k/total, 其中, total 为前述步骤 110 中的设定数量 ( 即第一设定数量 ) 的网页的数量。简而言之, 构建所述主题 - 类别变换矩阵, 其的元素值表征主题与网页类别的关联度。
     子步骤 142, 基于用户 - 主题矩阵 M 与主题 - 类别变换矩阵 T 的乘积的结果矩阵来 确定用户所属的网页类别。
     具体地, 将用户 - 主题矩阵 M 与主题 - 类别变换矩阵 T 相乘得到用户 - 类别矩阵 N。其中, 用户 - 类别矩阵 N 的第 d 行第 k 列 Nd,k 表示第 d 个用户属于第 k 个类别的概率, 亦即第 d 个用户在第 k 个类别上的关联度, 根据类别的关联度的值的大小来确定用户所属 的网页类别, 例如可基于所述用户 - 分类矩阵将与用户关联度最大一个或多个的网页类别 确定为该用户所属的网页类别。
     举例而言, 假定根据步骤 130 获得关于四个用户的用户 - 主题矩阵, 矩阵如下所 示,
     其中, 行向量分别表示用户 1、 用户 2、 用户 3、 用户 4 等四个用户, 列向量分别表示 校园、 活动、 旅游、 交易、 公司、 电子等六个主题。
     对于网页类别为社交网站, 预先设定与网页类别的相关联的主题为 “社交网站 : 校园 ; 活动 ; 旅游” , 对于网页类别为电子商务网站, 预先设定与网页类别的相关联的主题为 “电子商务网站 : 交易 ; 公司 ; 电子” 。
     根据子步骤 110 中设定数量的网页的网页类别所关联的一个或多个主题, 通过统 计前述子步骤 110 中的设定数量 ( 对应于第一设定数量 ) 的网页中、 与第 j 个主题相关联 且被分类至第 k 个网页类别的网页数量 t’ 假定子步骤 110 j, k 来确定主题 - 类别变换矩阵, 中的设定数量的网页为 8 个, 则属于各个主题的网页个数的表示分别为 “2 校园、 2 活动、 2 旅游、 2 交易、 0 公司、 0 电子” , 根据上述结果可以构建出主题 - 类别变换矩阵, 如下所示,
     其中, 行向量分别表示校园、 活动、 旅游、 交易、 公司、 电子等六个主题, 列向量分别 表示社交网站和电子商务网站两个网页类别。
     将所得用户 - 主题矩阵与主题 - 类比变换矩阵相乘得到用户 - 类别矩阵, 如下所 示,
     其中, 行向量分别表示用户 1、 用户 2、 用户 3、 用户 4 等四个用户, 列向量分别表示 社交网站和电子商务网站两个网页类别。用户 - 类别矩阵的第 d 行第 k 列 Nd, k 表示第 d 个 用户属于第 k 个类别的概率, 亦即第 d 个用户在第 k 个类别上的关联度, 根据类别的关联度 的值的大小来确定用户所属的网页类别, 根据上述矩阵, 可知用户 1、 用户 2 以及用户 3 所述 类别为社交网站, 用户 4 所属类别为电子商务网站, 因此在发送定向广告时, 可以根据用户 所属的网页类别进行有针对性的发送。
     需要注意的是, 上述例子仅为一个简单的例子, 所述的内容仅是为了便于理解本 申请而采用的实施方式, 并非用以限定本申请。由于互联网的普及, 互联网中的用户数以 百亿记, 而本申请方法是通过无监督方法进行分类的, 与用户数量无关, 可以处理大规模用 户的行为, 本申请方法可以在较小的计算代价上覆盖全面的用户行为, 从而可以充分的利 用用户的信息并将大量的用户进行分类, 充分利用海量数据蕴含的丰富信息定位用户的兴
     趣。 在本申请的另一种优选实施例中, 所述网络数据报文会包括用户的 3G 无线网络 操作信息, 如用户浏览的网页、 搜索等信息, 通过对这些网络数据报文进行数据挖掘, 也可 以获得用户行为的特征参数, 在具体实现中, 所述用户行为的特征参数可以为用户某类操 作的频率, 也可以为用户访问内容的排名等。例如, 通过网络数据报文进行数据挖掘, 得到 用户的具体行为信息, 比如用户浏览的网站类型, 用户在网页中点选的感兴趣内容等, 获得
     的用户行为特征参数为用户的操作频率。
     当然, 本领域技术人员采用任一种现有的通过数据挖掘进行用户行为分析的技术 或采用任一种用户行为分析的技术, 获得任一种用户行为的特征参数均是可行的, 本申请 对此不作限制。
     子步骤 S52、 判断所述用户行为的特征参数是否满足预设阈值。
     其中, 所述预设阈值可以由本领域技术人员根据实际情况任意设置, 比如, 设置用 户对某种类型的网站的操作频率的阈值为 20 次, 一旦分析获得用户对此种类型的网站的 操作频率 ( 用户行为特征参数 ) 大于或等于 20 次, 即可触发后续的定位用户行为与导航调 度操作。或如, 设置用户对某种内容页面的访问次数排名为第 1 名, 则获取用户对各种不同 类型内容的页面的点击操作 ( 用户行为特征参数 ), 并按点击次数进行排名, 获得点击次数 最高的对应类型内容的页面信息后, 即可触发后续的定位用户行为与导航调度操作。
     步骤 306、 根据所述个性化信息记录, 向该用户推送个性化页面。
     在本申请的一种优选实施例中, 所述步骤 306 具体可以包括如下子步骤 :
     子步骤 S61、 根据所述个性化信息记录生成当前用户的个性化标识 ;
     子步骤 S62、 根据所述个性化标识生成匹配的页面导航, 由所述页面导航以重定向 的方式向用户推送对应的个性化页面。
     当所述个性化信息记录满足预置规则时, 则会形成用户的个性化标识, 所述个性 化标识可以为对个性化信息记录进行分析获得的用户关注的要点信息, 即用户个性化行为 的要点。 然后根据用户的个性化行为, 为用户制定个性化导航, 即为针对用户定制符合所述 个性化行为的个性化页面。在该用户此后访问 3G 无线网络, 只要其个性化记录满足预置规 则, 则向该用户传递个性化导航, 即对用户进行精准个性化页面调度引导。
     在具体现实中, 可以采用重定向技术对用户进行精准个性化页面调度引导, 重定 向即重新将用户引导到对应的个性化页面进行访问, 即将个性化页面重定向给用户, 以实 现为用户提供精准个性化页面。
     参照图 7, 其示出了本申请的一种基于核心网侧的无线个性化精准信息主动推送 方法实施例 2 的步骤流程图, 具体可以包括如下步骤 :
     步骤 601、 核心网侧接收用户提交的 3G 无线网络连接请求, 所述连接请求中包括 用户身份信息 ;
     步骤 602、 核心网侧判断是否存在所述用户身份信息对应的个性化信息记录 ;
     若否, 则执行步骤 603 和步骤 604 ;
     若是, 则执行步骤 605 ;
     步骤 603、 核心网侧生成用户当次连接请求对应的 IP 信息, 并建立所述用户身份 信息与 IP 信息的关联 ;
     步骤 604、 核心网侧收集用户基于当前 IP 信息提交的 3G 无线网络的操作信息, 生成对应的个性化信息记录 ; 并建立所述用户身份信息与个性化信息记录的关联 ; 转步骤 605。
     步骤 605、 核心网侧判断所述个性化信息记录是否满足预置规则, 若是, 则执行步 骤 606 ;
     步骤 606、 互联网侧根据所述个性化信息记录, 向该用户推送个性化页面。步骤 607、 互联网侧接收用户在对应个性化页面上的修改, 并保存所述修改。
     在本申请实施例中, 所述互联网可以包括移动互联网 ( 包含 3G 无线网络 ) ; 所述 核心网是将业务提供者与接入网, 或者, 将接入网与其他接入网连接在一起的网络, 通常是 指除接入网和用户驻地网之外的网络部分。 简单点说, 可以把移动网络划分为三个部分, 基 站子系统, 网络子系统, 和系统支撑部分比如说安全管理等这些。 核心网部分就是位于网络 子系统内, 核心网的主要作用把 A 口上来的呼叫请求或数据请求, 接续到不同的网络上。主 要是涉及呼叫的接续、 计费, 移动性管理, 补充业务实现, 智能触发等方面主体支撑在交换 机。至于软交换则有两个很明显的概念, 控制与承载的分离, 控制信道与数据信道的分离。 核心网从协议上规定就是其到核心交换或者呼叫路由功能的网元, 对于 2G/3G 核心网一般 都是一样, 在 R4 架构比如 MSC SERVER MGW, HLR, VLR, EIR, AUC 等, 主要作用是整个呼叫信 令控制和承载建立。 从应用的角度而言, 核心网即指用户连接网络时通过核心网选择协议, 提供用户连接的网络。
     在实际中, 用户可能会对个性化页面进行定制修改, 应用本实施例, 在互联网侧将 保存用户对所述个性化页面的修改, 下次用户访问时, 将对用户展示修改生效的个性化页 面。
     需要说明的是, 对于前述的方法实施例, 为了简单描述, 故将其都表述为一系列的 动作组合, 但是本领域技术人员应该知悉, 本申请并不受所描述的动作顺页序的限制, 因为 依据本申请, 某些步骤可以采用其他顺页序或者同时进行。 其次, 本领域技术人员也应该知 悉, 说明书中所描述的实施例均属于优选实施例, 所涉及的动作和模块并不一定是本申请 所必须的。
     再者, 上述各个方法实施例均采用递进的方式描述, 每个实施例重点说明的都是 与其他实施例的不同之处, 各个实施例之间相同相似的部分互相参见即可。
     参照图 8, 其示出了本申请的一种基于核心网侧的无线个性化精准信息主动推送 装置实施例的结构框图, 具体可以包括以下模块 :
     连接模块 701, 用于接收用户提交的 3G 无线网络连接请求, 所述连接请求中包括 用户身份信息 ;
     用户个性化记录判断模块 702, 用于判断是否存在所述用户身份信息对应的个性 化信息记录 ;
     若否, 则调用 IP 信息生成模块 703 和个性化信息记录模块 704 ;
     若是, 则调用预置规则判断模块 705 ;
     IP 信息生成模块 703, 用于在不存在所述用户身份信息对应的个性化信息记录 时, 生成用户当次连接请求对应的 IP 信息, 并建立所述用户身份信息与 IP 信息的关联 ;
     个性化信息记录模块 704, 用于收集用户基于当前 IP 信息提交的 3G 无线网络的操 作信息, 生成对应的个性化信息记录 ; 并建立所述用户身份信息与个性化信息记录的关联 ; 所述个性化信息记录模块 704 与预置规则判断模块相连 705。
     预置规则判断模块 705, 用于判断所述个性化信息记录是否满足预置规则 ; 若否, 则返回个性化信息记录模块 704 ; 若是, 则调用个性化页面推送模块 706 ;
     个性化页面推送模块 706, 用于根据所述个性化信息记录, 向该用户推送个性化页 面。在具体实现中, 所述个性化信息记录可以包括所述用户的 3G 无线网络操作行为 信息, 和 / 或, 针对所述用户的 3G 无线网络操作生成的网络数据报文, 在这种情况下, 所述 预置规则判断模块 705 可以包括如下子模块 :
     用户行为特征参数获取子模块, 用于对所述用户的 3G 无线网络操作行为信息进 行行为分析, 和 / 或, 对所述针对用户的 3G 无线网络操作生成的网络数据报文进行数据挖 掘, 获得用户行为的特征参数 ;
     阈值判断子模块, 用于判断所述用户行为的特征参数是否满足预设阈值。
     在本申请的一种优选实施例中, 所述个性化页面推送模块 706 可以包括如下子模 块:
     个性化标识生成子模块, 用于根据所述个性化信息记录生成当前用户的个性化标 识;
     页面重定向子模块, 用于根据所述个性化标识生成匹配的页面导航, 由所述页面 导航以重定向的方式向用户推送对应的个性化页面。
     在具体应用中, 所述连接模块 701、 用户个性化记录判断模块 702、 预置规则判断 模块 705、 IP 信息生成模块 703、 个性化信息记录模块 704 可以设置在核心网侧 ; 所述个性 化页面推送模块 704 可以设置在互联网侧。 作为本申请的一种优选实施例, 本装置实施例还可以包括如下模块 :
     修改模块, 用于接收用户在对应个性化页面上的修改, 并保存所述修改。
     在具体应用中, 所述修改模块可以设置在互联网侧。
     对于装置实施例而言, 由于其与方法实施例基本相似, 所以描述的比较简单, 相关 之处参见方法实施例的部分说明即可。
     本申请可用于众多通用或专用的计算系统环境或配置中。 例如 : 个人计算机、 服务 器计算机、 手持设备或便携式设备、 平板型设备、 多处理器系统、 基于微处理器的系统、 置顶 盒、 可编程的消费电子设备、 网络 PC、 小型计算机、 大型计算机、 包括以上任何系统或设备的 分布式计算环境等等。
     本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述, 例如程序 模块。 一般地, 程序模块包括执行特定任务或实现特定抽象数据类型的例程、 程序、 对象、 组 件、 数据结构等等。也可以在分布式计算环境中实践本申请, 在这些分布式计算环境中, 由 通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中, 程序模块可以 位于包括存储设备在内的本地和远程计算机存储介质中。
     以上对本申请所提供的一种基于核心网侧的无线个性化精准信息主动推送系统, 一种基于核心网侧的无线个性化精准信息主动推送方法, 以及, 一种基于核心网侧的无线 个性化精准信息主动推送装置, 进行了详细介绍, 本文中应用了具体个例对本申请的原理 及实施方式进行了阐述, 以上实施例的说明只是用于帮助理解本申请的方法及其核心思 想; 同时, 对于本领域的一般技术人员, 依据本申请的思想, 在具体实施方式及应用范围上 均会有改变之处, 综上所述, 本说明书内容不应理解为对本申请的限制。
    

基于核心网侧的无线个性化精准信息主动推送系统及方法.pdf_第1页
第1页 / 共22页
基于核心网侧的无线个性化精准信息主动推送系统及方法.pdf_第2页
第2页 / 共22页
基于核心网侧的无线个性化精准信息主动推送系统及方法.pdf_第3页
第3页 / 共22页
点击查看更多>>
资源描述

《基于核心网侧的无线个性化精准信息主动推送系统及方法.pdf》由会员分享,可在线阅读,更多相关《基于核心网侧的无线个性化精准信息主动推送系统及方法.pdf(22页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102523274 A (43)申请公布日 2012.06.27 C N 1 0 2 5 2 3 2 7 4 A *CN102523274A* (21)申请号 201110406878.1 (22)申请日 2011.12.08 201110176700.2 2011.06.28 CN H04L 29/08(2006.01) (71)申请人北京亿赞普网络技术有限公司 地址 100081 北京市海淀区中关村南大街甲 18号院2号楼1607 (72)发明人刘生 罗峰 黄苏支 李娜 (74)专利代理机构北京润泽恒知识产权代理有 限公司 11319 代理人赵娟 (54) 发明名。

2、称 基于核心网侧的无线个性化精准信息主动推 送系统及方法 (57) 摘要 本申请提供了一种基于核心网侧的无线个性 化精准信息主动推送系统及方法,其中,所述方法 包括:步骤S11、接收用户提交的3G无线网络连接 请求,所述连接请求中包括用户身份信息;步骤 S12、判断是否存在所述用户身份信息对应的个性 化信息记录;若是,则执行步骤S13;步骤S13、判 断所述个性化信息记录是否满足预置规则,若是, 则执行步骤S14;步骤S14、根据所述个性化信息 记录,向该用户推送个性化页面。本申请可以针对 用户提供精准的个性化服务,并提升用户的3G业 务使用的易操作性,减少流量的使用。 (66)本国优先权数据。

3、 (51)Int.Cl. 权利要求书2页 说明书13页 附图6页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 13 页 附图 6 页 1/2页 2 1.一种基于核心网侧的无线个性化精准信息主动推送系统,其特征在于:包括搭载在 核心网上接受无线用户请求信息的核心网设备,所述核心网设备将无线用户请求信息分光 或镜像给核心网上的用户识别分析导航模块,所述核心网络将用户请求发送给搭载在互联 网上的能提供用户ID识别和精确识别、提供精确个性化页面并对用户个性化修改进行保 存的用户精准化个性WEB服务器。 2.根据权利要求1所述的基于核心网侧的无线个性化精准信息。

4、主动推送系统,其特征 在于:所述用户识别分享导航模块上搭载有对用户进行行为分析和个性化业务挖掘的用户 行为分析引擎和用户识别引擎。 3.根据权利要求1或2所述的基于核心网侧的无线个性化精准信息主动推送系统,其 特征在于:所述用户识别分析导航模块将精确分析后的数据反馈给核心网络设备,通过核 心网络设备对用户精确访问精确化主页进行引导。 4.一种基于核心网侧的无线个性化精准信息主动推送方法,其特征在于,包括: 步骤S11、接收用户提交的3G无线网络连接请求,所述连接请求中包括用户身份信息; 步骤S12、判断是否存在所述用户身份信息对应的个性化信息记录;若是,则执行步骤 S13; 步骤S13、判断所。

5、述个性化信息记录是否满足预置规则,若是,则执行步骤S14; 步骤S14、根据所述个性化信息记录,向该用户推送个性化页面。 5.根据权利要求4所述的方法,其特征在于,还包括: 步骤S15、若不存在所述用户身份信息对应的个性化信息记录,则生成用户当次连接请 求对应的IP信息,并建立所述用户身份信息与IP信息的关联; 步骤S16、收集用户基于当前IP信息提交的3G无线网络的操作信息,生成对应的个性 化信息记录;并建立所述用户身份信息与个性化信息记录的关联;转步骤S13。 6.根据权利要求5所述的方法,其特征在于,还包括: 若所述个性化信息记录不满足预置规则,则返回步骤S16。 7.根据权利要求4或5。

6、或6所述的方法,其特征在于,所述个性化信息记录包括所述用 户的3G无线网络操作行为信息,和/或,针对所述用户的3G无线网络操作生成的网络数据 报文,所述判断个性化信息记录是否满足预置规则的步骤包括: 对所述用户的3G无线网络操作行为信息进行行为分析,和/或,对所述针对用户的3G 无线网络操作生成的网络数据报文进行数据挖掘,获得用户行为的特征参数; 判断所述用户行为的特征参数是否满足预设阈值。 8.根据权利要求7所述的方法,其特征在于,所述根据个性化信息记录,向该用户推送 个性化页面的步骤包括: 根据所述个性化信息记录生成当前用户的个性化标识; 根据所述个性化标识生成匹配的页面导航,由所述页面导。

7、航以重定向的方式向用户推 送对应的个性化页面。 9.根据权利要求8所述的方法,其特征在于,还包括: 步骤S17、接收用户在对应个性化页面上的修改,并保存所述修改。 10.根据权利要求8或9所述的方法,其特征在于,所述步骤S11、步骤S12、步骤S13、 步骤S15、步骤S16在核心网侧执行;所述步骤S14、步骤S17在互联网侧执行。 权 利 要 求 书CN 102523274 A 2/2页 3 11.一种基于核心网侧的无线个性化精准信息主动推送装置,其特征在于,包括: 连接模块,用于接收用户提交的3G无线网络连接请求,所述连接请求中包括用户身份 信息; 用户个性化记录判断模块,用于判断是否存在。

8、所述用户身份信息对应的个性化信息记 录;若是,则调用预置规则判断模块; 预置规则判断模块,用于判断所述个性化信息记录是否满足预置规则;若是,则调用个 性化页面推送模块; 个性化页面推送模块,用于根据所述个性化信息记录,向该用户推送个性化页面。 12.根据权利要求11所述的装置,其特征在于,还包括: IP信息生成模块,用于在不存在所述用户身份信息对应的个性化信息记录时,生成用 户当次连接请求对应的IP信息,并建立所述用户身份信息与IP信息的关联; 个性化信息记录模块,用于收集用户基于当前IP信息提交的3G无线网络的操作信息, 生成对应的个性化信息记录;并建立所述用户身份信息与个性化信息记录的关联。

9、;所述个 性化信息记录模块与预置规则判断模块相连。 13.根据权利要求12所述的装置,其特征在于,若所述预置规则判断模块判断所述个 性化信息记录不满足预置规则,则调用个性化信息记录模块。 14.根据权利要求11或12或13所述的装置,其特征在于,所述个性化信息记录包括所 述用户的3G无线网络操作行为信息,和/或,针对所述用户的3G无线网络操作生成的网络 数据报文,所述预置规则判断模块包括: 用户行为特征参数获取子模块,用于对所述用户的3G无线网络操作行为信息进行行 为分析,和/或,对所述针对用户的3G无线网络操作生成的网络数据报文进行数据挖掘,获 得用户行为的特征参数; 阈值判断子模块,用于判。

10、断所述用户行为的特征参数是否满足预设阈值。 15.根据权利要求14所述的装置,其特征在于,所述个性化页面推送模块包括: 个性化标识生成子模块,用于根据所述个性化信息记录生成当前用户的个性化标识; 页面重定向子模块,用于根据所述个性化标识生成匹配的页面导航,由所述页面导航 以重定向的方式向用户推送对应的个性化页面。 16.根据权利要求15所述的装置,其特征在于,所述连接模块、用户个性化记录判断模 块、预置规则判断模块、IP信息生成模块、个性化信息记录模块位于核心网侧;所述个性化 页面推送模块位于互联网侧。 权 利 要 求 书CN 102523274 A 1/13页 4 基于核心网侧的无线个性化精。

11、准信息主动推送系统及方法 技术领域 0001 本申请涉及移动通信的技术领域,特别是涉及一种基于核心网侧的无线个性化精 准信息主动推送系统,一种基于核心网侧的无线个性化精准信息主动推送方法,以及,一种 基于核心网侧的无线个性化精准信息主动推送装置。 背景技术 0002 人们对信息的即时性和个性化的需求,推动着3G移动网络的快速发展。然而无线 3G的应用与互联网的应用有着巨大的差别: 0003 其一,终端类型多样化,且终端显示尺寸远远小于互联网终端(PC机等),而且无 线终端的使用没有多少辅助硬件(键盘、鼠标等),操作易用性远远不如互联网; 0004 其二,互联网已经非常普及,固网的费用多采用包月。

12、的方式,因此人们不会太在意 流量的消耗,但3G无线网络刚刚兴起,运营商的网络硬件成本导致了无线上网时对流量的 关注。 0005 为提升用户的无线3G应用的体验,现有技术中,国内的各移动通信运营商相继推 出了各自的3G无线门户,如联通的“沃门户”、移动的“移动梦网”、电信的“天翼空间”,然 而,此类无线门户是针对所有移动用户推出的大众化服务,尽管提供了用户登录业务、查询 个人资费信息等个性化服务,由于需要逐步逐页面地由用户选择及输入,以搜索和查找其 所需的个性化信息,操作十分复杂,繁琐,并且十分耗费流量。 0006 因此,目前需要本领域技术人员迫切解决的一个技术问题就是:提出一种基于核 心网侧的。

13、无线个性化精准信息主动推送机制,用以针对用户提供精准的个性化服务,并提 升用户的3G业务使用的易操作性,减少流量的使用。 发明内容 0007 本申请的目的是,提供一种基于核心网侧的无线个性化精准信息主动推送方法, 针对用户提供精准的个性化服务,并提升用户的3G业务使用的易操作性,减少流量的使 用。 0008 相应的,本申请还提供了一种基于核心网侧的无线个性化精准信息主动推送系 统,以及,一种基于核心网侧的无线个性化精准信息主动推送装置,用以保证上述方法在实 际中的实现和应用。 0009 为了解决上述问题,本申请公开了一种基于核心网侧的无线个性化精准信息主动 推送系统,包括搭载在核心网上接受无线。

14、用户请求信息的核心网设备,所述核心网设备将 无线用户请求信息分光或镜像给核心网上的用户识别分析导航模块,所述核心网络将用户 请求发送给搭载在互联网上的能提供用户ID识别和精确识别、提供精确个性化页面并对 用户个性化修改进行保存的用户精准化个性WEB服务器。 0010 优选的,所述用户识别分享导航模块上搭载有对用户进行行为分析和个性化业务 挖掘的用户行为分析引擎和用户识别引擎。 说 明 书CN 102523274 A 2/13页 5 0011 优选的,所述用户识别分析导航模块将精确分析后的数据反馈给核心网络设备, 通过核心网络设备对用户精确访问精确化主页进行引导。 0012 本申请实施例还公开了。

15、一种基于核心网侧的无线个性化精准信息主动推送方法, 包括: 0013 步骤S11、接收用户提交的3G无线网络连接请求,所述连接请求中包括用户身份 信息; 0014 步骤S12、判断是否存在所述用户身份信息对应的个性化信息记录;若是,则执行 步骤S13; 0015 步骤S13、判断所述个性化信息记录是否满足预置规则,若是,则执行步骤S14; 0016 步骤S14、根据所述个性化信息记录,向该用户推送个性化页面。 0017 优选的,所述的方法,还包括: 0018 步骤S15、若不存在所述用户身份信息对应的个性化信息记录,则生成用户当次连 接请求对应的IP信息,并建立所述用户身份信息与IP信息的关联。

16、; 0019 步骤S16、收集用户基于当前IP信息提交的3G无线网络的操作信息,生成对应的 个性化信息记录;并建立所述用户身份信息与个性化信息记录的关联;转步骤S13。 0020 优选的,所述的方法,还包括: 0021 若所述个性化信息记录不满足预置规则,则返回步骤S16。 0022 优选的,所述个性化信息记录包括所述用户的3G无线网络操作行为信息,和/或, 针对所述用户的3G无线网络操作生成的网络数据报文,所述判断个性化信息记录是否满 足预置规则的步骤包括: 0023 对所述用户的3G无线网络操作行为信息进行行为分析,和/或,对所述针对用户 的3G无线网络操作生成的网络数据报文进行数据挖掘,。

17、获得用户行为的特征参数; 0024 判断所述用户行为的特征参数是否满足预设阈值。 0025 优选的,所述根据个性化信息记录,向该用户推送个性化页面的步骤包括: 0026 根据所述个性化信息记录生成当前用户的个性化标识; 0027 根据所述个性化标识生成匹配的页面导航,由所述页面导航以重定向的方式向用 户推送对应的个性化页面。 0028 优选的,所述的方法,还包括: 0029 步骤S17、接收用户在对应个性化页面上的修改,并保存所述修改。 0030 优选的,所述步骤S11、步骤S12、步骤S13、步骤S15、步骤S16在核心网侧执行;所 述步骤S14、步骤S17在互联网侧执行。 0031 本申请。

18、实施例还公开了一种基于核心网侧的无线个性化精准信息主动推送装置, 包括: 0032 连接模块,用于接收用户提交的3G无线网络连接请求,所述连接请求中包括用户 身份信息; 0033 用户个性化记录判断模块,用于判断是否存在所述用户身份信息对应的个性化信 息记录;若是,则调用预置规则判断模块; 0034 预置规则判断模块,用于判断所述个性化信息记录是否满足预置规则;若是,则调 用个性化页面推送模块; 说 明 书CN 102523274 A 3/13页 6 0035 个性化页面推送模块,用于根据所述个性化信息记录,向该用户推送个性化页面。 0036 优选的,所述的装置,还包括: 0037 IP信息生。

19、成模块,用于在不存在所述用户身份信息对应的个性化信息记录时,生 成用户当次连接请求对应的IP信息,并建立所述用户身份信息与IP信息的关联; 0038 个性化信息记录模块,用于收集用户基于当前IP信息提交的3G无线网络的操作 信息,生成对应的个性化信息记录;并建立所述用户身份信息与个性化信息记录的关联; 所述个性化信息记录模块与预置规则判断模块相连。 0039 优选的,若所述预置规则判断模块判断所述个性化信息记录不满足预置规则,则 调用个性化信息记录模块。 0040 优选的,所述个性化信息记录包括所述用户的3G无线网络操作行为信息,和/或, 针对所述用户的3G无线网络操作生成的网络数据报文,所述。

20、预置规则判断模块包括: 0041 用户行为特征参数获取子模块,用于对所述用户的3G无线网络操作行为信息进 行行为分析,和/或,对所述针对用户的3G无线网络操作生成的网络数据报文进行数据挖 掘,获得用户行为的特征参数; 0042 阈值判断子模块,用于判断所述用户行为的特征参数是否满足预设阈值。 0043 优选的,所述个性化页面推送模块包括: 0044 个性化标识生成子模块,用于根据所述个性化信息记录生成当前用户的个性化标 识; 0045 页面重定向子模块,用于根据所述个性化标识生成匹配的页面导航,由所述页面 导航以重定向的方式向用户推送对应的个性化页面。 0046 优选的,所述连接模块、用户个性。

21、化记录判断模块、预置规则判断模块、IP信息生 成模块、个性化信息记录模块位于核心网侧;所述个性化页面推送模块位于互联网侧。 0047 与现有技术相比,本申请包括以下优点: 0048 通过核心网侧对用户进行识别,然后对用户进行长期的网络行为进行分析,挖掘 出用户的爱好及个性化习惯,在用户使用3G无线网络时,对用户提供精准个性化信息主 页,通过精准个性化页面的调度,提升用户的3G业务使用的易操作性,并减少用户对个性 化信息的搜索及查找,从而减少用户流量的使用。 附图说明 0049 图1为本发明所述基于核心网侧的无线个性化精准信息主动推送系统示意图; 0050 图2为本发明所述基于核心网侧的无线个性。

22、化精准信息主动推送系统流程图; 0051 图3是本申请的一种基于核心网侧的无线个性化精准信息主动推送方法实施例1 的步骤流程图; 0052 图4是本申请的一种用户行为分析方法示例的流程图; 0053 图5为根据本申请第一实施例的网络用户分类方法的聚类图模型示意图; 0054 图6是本申请的另一种用户行为分析方法示例的流程图; 0055 图7是本申请的一种基于核心网侧的无线个性化精准信息主动推送方法实施例2 的步骤流程图; 0056 图8是本申请的一种基于核心网侧的无线个性化精准信息主动推送装置实施例 说 明 书CN 102523274 A 4/13页 7 的结构框图。 具体实施方式 0057 。

23、为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本申请作进一步详细的说明。 0058 现结合说明书附图1和图2介绍本申请所述的基于核心网侧的无线个性化精准 信息主动推送系统具体实施方式:包括搭载在核心网上接受无线用户请求信息的核心网 设备,所述核心网设备将无线用户请求信息分光或镜像给核心网上的用户识别分析导航模 块,所述分光或镜像就是把用户上网信息镜像(复制)出一份给用户识别分析导航模块。 所述核心网络将用户搜索、访问、下载请求发送给搭载在互联网上的能提供用户ID识别和 精确识别、提供精确个性化页面并对用户个性化修改进行保存的用户精准化个性WEB服务 器。 00。

24、59 所述用户识别分享导航模块上搭载有对用户进行行为分析和个性化业务挖掘的 用户行为分析引擎和用户识别引擎。 0060 所述用户识别分析导航模块将精确分析后的数据反馈给核心网络设备,通过核心 网络设备对用户精确访问精确化主页进行引导。 0061 本申请系统通过核心网侧的流量分光/镜像平台环境,对用户进行唯一性识别; 通过用户的浏览、搜索、下载等行为,对用户信息进行数据挖掘,得出用户的精准信息及个 性化潜在需求;通过核心网侧,对用户进行精准信息及个性化导航服务调度;根据用户对 精准个性化导航页的修改进行保存;当用户再次使用无线时,对用户进行精准个性化信息 调度。 0062 本申请系统业务序列: 。

25、0063 1、无线用户对使用无线服务权限进行验证,这些信息中携带手机号码、IMEI、IMSI 等用户唯一ID。 0064 2、核心网设备将这些信息分光/镜像给用户识别分析导航模块,用户识别分析导 航模块根据此信息对用户进行唯一识别。 0065 3、用户使用无线服务,进行搜索、内容访问或下载。 0066 4、核心网数据报文分光/镜像给用户识别分析导航模块,用户识别分析导航模块 对用户进行行为分析和个性化业务挖掘。 0067 5、用户使用无线服务时,核心网将数据包分光/镜像给用户识别分析导航模块, 如果达到精准个性化页面调度条件,对用户进行精准个性化页面调度引导(使用重定向技 术)。 0068 6。

26、、用户根据引导报文访问精准个性化页面,精准个性化页面根据与用户识别分析 导航模块的私有协商协议中携带的用户唯一标识和精准个性化标识,对用户提供精准个性 化页面。 0069 7、用户可能会对精准个性化页面进行定制修改,精准个性化页面将对这些修改进 行保存,下次用户访问时,将对展示修改保存生效的精准个性化页面。 0070 本申请的核心构思之一在于,通过核心网侧对用户进行识别,然后对用户长期网 络行为进行分析,挖掘出用户的爱好及个性化习惯,在用户使用3G无线网络时,对用户提 说 明 书CN 102523274 A 5/13页 8 供精准个性化信息主页,通过精准个性化页面的调度,提升用户的3G业务使用。

27、的易操作 性,并减少用户对个性化信息的搜索及查找,从而减少用户流量的使用。 0071 参照图3,其示出了本申请的一种基于核心网侧的无线个性化精准信息主动推送 方法实施例1的步骤流程图,具体可以包括如下步骤: 0072 步骤301、接收用户提交的3G无线网络连接请求,所述连接请求中包括用户身份 信息; 0073 在具体应用中,当用户访问3G无线网络时,会提交3G无线网络连接请求,所述请 求的报文中会携带用户的身份信息,如手机号码、IMEI(International Mobile Equipment Identity,国际移动设备身份码)、IMSI(International Mobile Su。

28、bscriberIdentity,国 际移动用户识别码)等用户唯一标识信息。 0074 步骤302、判断是否存在所述用户身份信息对应的个性化信息记录;若否,则执行 步骤303;若是,则执行步骤305; 0075 步骤303、生成用户当次连接请求对应的IP信息,并建立所述用户身份信息与IP 信息的关联;转步骤304; 0076 对于用户每次提交的3G无线网络连接请求,都会生成一个对应的临时IP信息,用 户在3G无线网络连接之后的网络操作均会携带此临时IP信息。通过建立所述用户身份信 息与该临时IP信息的关联,如将所述用户身份信息与该临时IP信息进行绑定,则可以通过 该临时IP信息找到对应的用户身。

29、份信息,以实现对用户的唯一识别。 0077 步骤304、收集用户基于当前IP信息提交的3G无线网络的操作信息,生成对应的 个性化信息记录;并建立所述用户身份信息与个性化信息记录的关联;转步骤305; 0078 用户在连接3G无线网络后,使用无线服务,如进行搜索、内容访问或下载等3G无 线网络的操作,均会携带所述IP信息。在实际中,可以根据所述用户身份信息和IP信息创 建对应的个性化信息记录表,在该表中根据用户的3G无线网络的操作信息实时记录对应 的个性化信息。 0079 在本申请的一种优选实施例中,所述个性化信息记录可以包括:所述用户的3G无 线网络操作行为信息,和/或,针对所述用户的3G无线。

30、网络操作生成的网络数据报文。其 中,所述用户的3G无线网络操作行为信息可以进一步包括,用户访问网页的行为信息,用 户搜索的行为信息,用户点击的行为信息等。 0080 步骤305、判断所述个性化信息记录是否满足预置规则,若否,则返回步骤304;若 是,则执行步骤306; 0081 在本申请的一种优选实施例中,可以通过以下子步骤51和子步骤S52判断所述个 性化信息记录是否满足预置规则: 0082 子步骤S51、对所述用户的3G无线网络操作行为信息进行行为分析,和/或,对所 述针对用户的3G无线网络操作生成的网络数据报文进行数据挖掘,获得用户行为的特征 参数; 0083 为使本领域技术人员更好地理。

31、解本申请,以下提供两种对用户的3G无线网络操 作行为信息进行行为分析的示例: 0084 示例1: 0085 参照图4,其示出了本申请的一种用户行为分析方法示例的流程,具体可以包括以 说 明 书CN 102523274 A 6/13页 9 下步骤: 0086 子步骤110,预先确定多个(对应于第二设定数量)网页类别。 0087 基于第一设定数量的网页,来预先确定第二设定数量的网页类别。其中,每个网 页类别由多个主题构成,例如,网页类别为社交网站可以表示为“社交网站:校园、活动、旅 游”,其中,“校园”、“活动”、“旅游”为所属网页类别为社交网站的各个主题。首先将第一设 定数量的网页进行主题分类,。

32、然后根据与主题相关联的网页类别来确定第一设定数量的网 页所属的网页类别。例如,人人网所属的主题为“校园”,而“校园”与社交网站具有关联性, 则可将人人网的网页类别确定为社交网站。 0088 具体地,可以对设定数量(对应于第一设定数量)的网页进行人工分类,例如,可 针对现有百万个网页中的几万个或几十万个典型的网页进行人工分类,得到网页类别,例 如,京东网属性为电子商务网站,人人网属性为社交网站,美团网为团购网站。 0089 还可以应用网页自动分类技术将设定数量的网页进行分类得到网页分类。例如应 用统计学习法,通过分析经过人工分类的网页,从中挖掘关键词和类之间的联系,再利用关 键词和类之间的联系,。

33、对第一设定数量的网页进行分类,该统计学习法为现有技术,在此不 再赘述。 0090 子步骤120,基于用户的网络行为生成用户的行为特征向量。 0091 具体地,可以先获取用户的网络行为,将用户的网络行为进行预处理,以获得用户 的行为特征向量。 0092 预处理过程是整个网络用户分类的基础,一般包括使用记录预处理、内容信息预 处理和结构信息预处理,通过对所获得的用户网络行为进行预处理、去除冗余信息、模糊信 息以及无意义信息,得到精确表征用户网络行为的数据。 0093 在本申请实施例中,用于生成用户的行为特征向量的网络行为可以包括网络访问 行为和搜索行为。例如,可将网络访问行为所访问的网址(本申请中。

34、,将IP地址、网站的中 /英域名等统称为网址)和搜索行为所涉及的搜索关键词等词汇确定为用户的行为特征向 量的元素,例如用户进行了京东网、人人网和美团网的访问行为,则将所访问的网址中所包 含的词汇“京东”、“人人”以及“美团”等词汇确定为用户的行为特征向量的元素;用户的搜 索行为所涉及的搜索关键词,例如“京东”、“人人”以及“美团”等词汇确定为用户的行为特 征向量的元素。 0094 可将用户的行为特征向量W表示如下: 0095 W UserId w 1 ,w 2 ,.,w n ,. 0096 其中,U serId 用以标识用户,w n 是根据用户的网络访问行为或搜索行为所生成的第 n个特征(亦称。

35、词汇),包括用户的网络访问行为和搜索行为。 0097 举例而言,某用户访问了3个网址并且搜索了5个关键字,则在此用户访问了3个 网址的情况下,这3个网址分别表示3个特征(词汇),则关于该用户的网络访问行为的用 户行为特征可以用w 1 ,w 2 ,w 3 来表示,其中,w 1 ,w 2 ,w 3 分别表示用户访问这3个网址的次数; 而该用户还搜索了5个关键字,则在此用户搜索5个关键字的情况下,可将这5个关键字作 为5个特征,则关于该用户的搜索行为的用户行为特征可以w 3+1 ,w 3+2 .,w 3+5 来表示,其中 w 3+1 ,w 3+2 .,w 3+5 分别表示用户基于第1,2,.,5个关。

36、键字进行搜索的次数,基于以上所述, 则该用户的用户行为特征向量W可表示为W UserId w 1 ,w 2 ,w 3 ,w 3+1 ,w 3+2 .,w 3+5 。 说 明 书CN 102523274 A 7/13页 10 0098 子步骤130,基于各用户的行为特征向量进行聚类,以构建用户-主题矩阵M,其 中,用户-主题矩阵M的各元素值分别表征各用户与各主题之间的关联度,更具体地,M的 第d行第j列M d,j 表示第d个用户属于第j个主题的概率即 d j 。 0099 主题为经聚类所得到的一个以上特征或赋权特征的集合,例如,主题可表示为 “0.1书包;0.2校服;0.3早操;0.4作业本”,。

37、其中“书包”、“校服”、“早操”、“作业本”为特 征,而它们前面的系数为权重,将相似的特征聚合为同一主题,将包含有上述特征的主题设 定为校园,有利于对用户的网络行为习惯进行分析,从而便于达到对其进行分类的目的。 0100 优选地,可利用主题模型(Topic Model)来进行聚类。将各用户的行为特征向量 作为主题模型中特征层的特征向量,以构建用户主题模型(简称UTM模型),并利用该用户 主题模型来实现对用户所进行的聚类,本实施例的用户主题模型通过采用Dirichlet分布 对用户的行为特征向量进行建模。 0101 图5为根据本申请第一实施例的网络用户分类方法的聚类图模型示例。如图5所 示,聚类。

38、的图模型具有清晰的层次结构,每一层由相应的参数或随机变量来表征,包含特征 层、主题层和用户层三层结构。图2中空心点表示隐含变量,实心点表示参数,箭头表示依 赖关系。用户主题模型是由用户层的参数和参数定义的,其中,反映了用户集合中 隐含主体间的相对强弱,反映所有隐含主题自身的概率分布,表示用户中的各隐含主 题的比重,z表示用户分配在每个特征上的隐含主题比重,w是用户的特征向量表示形式,P 表示用户集合的数量,n表示用户所含特征的数量。大矩形表示从Dirichlet分布中为用 户集中的每个用户d反复抽取主题分布;小矩形表示从主题分布中反复抽取特征w。 0102 举例而言,给定一个用户集合D,包含了。

39、P个用户,每个用户d包含一个特征序列 w 1 ,w 2 ,.,w n 。在集合D对应的UTM模型中,将主题个数设置为K个,为了使得UTM模型 易于处理已知用户之外的新的用户,应用UTM模型时,UTM模型先进行先验概率假设的处 理,则对一个用户的行为特征向量进行聚类可以表示为以下步骤: 0103 1)从Dirichlet分布p(|)中为每个用户d抽取以多项式分布 d 表示的主 题,其中该多项式分布的各项为特征空间上的多项式分布,具体地,根据Dir(),针 对用户集合D中的每个用户,从Dirichlet分布中随机抽取一个k维的主题分布 d ,其表 示为每个用户的各个主题比例的混合,主题分布 d 中。

40、每一维的元素记为 d j ,其表示为用 户d属于第j个主题的概率,其中,p(|)如下式所示, 0104 0105 其中,是一个K维的Dirichlet参数, i 为超参量,为参数向量,为标准 的gamma函数,反映用户集合D中各个主题间的相对强弱,代表每个用户从属各主题 的概率。 0106 2)从Dirichlet先验中为每个主题抽取特征多项式分布,具体地,基于特定主 题比例从Dirichlet先验中为每个用户d抽取每个特征多项式分布,以获得p(w n | d , )。其中,表示某个主题条件下生成某个特征(词汇)的概率,是一个KV的矩阵。 0107 3)对于用户集合D中所有用户d和用户中所有特。

41、征w进行如下操作,首先选定主 题z i ,z i 服从Multinomial( d )的多项式分布,然后选择特征w i ,在z i 条件下的多项式分 布,每个用户d中的第i个特征w i 可以如下式所示, 说 明 书CN 102523274 A 10 8/13页 11 0108 0109 其中,z i 是潜在主题变量,表明第i个特征w i 取自该主题,P(w i |z i j)是特征 w i 属于主题j的概率,P(z i j)为主题j属于当前用户的概率。则T个主题形成D个用 户以W个唯一性特征表示,令表示对于主题j,特征w的多项式分布,;令 表示对于用户d,K个主题上的多项分布,因此在用户d中特。

42、征w的概率如下式 所示, 0110 0111 4)通过EM算法或Gibbs抽样法推算出P(w|d),然后基于P(w|d)间接求得第d个 用户属于第j个主题的概率 d j 以构建用户-主题矩阵M。 0112 需要说明的是,由于直接使用EM算法估计 d 会存在局部极值的问题,因此首先 对于给定的观察值特征w i ,利用Gibbs抽样取特征(词汇)在主题z i 上的后验概率P(w i |z i ) 的近似值。 0113 具体地,在Gibbs抽样中,先固定其他词的主题分配,然后估计当前特征w i 赋予各 种主题的概率P(z i j),亦即P(w|d)的值,根据所得P(w|d)的值间接的得到 d 的值。。

43、其 中,主题分布 d 中每一维的元素记为 d j ,其表示为用户d属于第j个主题的概率,对用户 集合D中的每一个用户进行上述1)至4)的操作,即可获得每个用户的主题分布 d ,基于 所得到的主题分布 d 构建用户-主题矩阵M。 0114 子步骤140,基于用户-主题矩阵M来确定用户所属的网页类别。 0115 更具体地,基于用户-主题矩阵M,可以获得用户属于各个主题的概率,然后根据 这些概率值来确定用户所属的网页类别。确定方式多种多样,例如,可以预先设定各个主题 与各个网页类别的关联程度,然后,将使得用户所属的各主题的概率与网页类别的关联程 度的积的和最大的那个网页类别,作为用户所属的网页类别。。

44、 0116 举例而言,对于网页类别为社交网站,预先设定各主题与网页类别的关联程度为 “社交网站:0.5校园;0.3活动;0.2旅游”,对于网页类别为电子商务网站,预先设定各主题 与网页类别的关联程度为“电子商务网站:0.5交易;0.3公司;0.2电子”,各个主题前面的 系数为各主题与所属网页类别的关联程度的值,假定根据步骤130所得的某个用户d属于 各主题的概率为“0.3校园;0.2活动;0.1旅游;0.1交易;0.1公司;0.2电子”,则将该用户 所属的各主题的概率与预先设定各主题所属网页类别的关联程度相乘,获得与各个网页类 别相关联的各个主题的实际主题概率,将所属网页类别的各个主题的实际主。

45、题概率进行相 加所得的和作为最终结果,上述例子的最终结果为“0.23社交网站;0.12电子商务网站”, 根据所得的积的和的最大的值,可知此用户所属的类别为社交网站,此用户对于社会交往 类的活动感兴趣,在进行定向广告发送时,可以向此类用户发送类似于旅游、休闲的定向广 告。 0117 示例2: 0118 参照图6,其示出了本申请的另一种用户行为分析方法示例的流程,具体可以包括 以下步骤: 说 明 书CN 102523274 A 11 9/13页 12 0119 子步骤110、子步骤120、子步骤130与图4所示的示例1基本相同,为了便于说明, 不再对与前述示例中相同的步骤进行详细展开,而仅重点说明。

46、与前述示例的不同之处。在 图5中,对与前述示例中相同或相似的步骤,采用了相同的附图标记。 0120 在本示例中,在子步骤140中具体包括子步骤141和142。 0121 子步骤141,确定前述步骤110中的设定数量(对应于第一设定数量)网页的网页 类别所关联的一个或多个主题,以构建主题-类别变换矩阵。 0122 具体地,通过统计前述步骤110中的设定数量的网页中、与第j个主题相关联且被 分类至第k个网页类别的网页数量t j,k 来确定主题-类别变换矩阵T的第j行第k列元素 值,j为小于等于主题数量的自然数,k为小于等于网页类别数量(即第二设定数量)的自 然数。例如可将主题-类别变换矩阵T的第j。

47、行第k列的元素赋值为t j,k t j,k /total, 其中,total为前述步骤110中的设定数量(即第一设定数量)的网页的数量。简而言之, 构建所述主题-类别变换矩阵,其的元素值表征主题与网页类别的关联度。 0123 子步骤142,基于用户-主题矩阵M与主题-类别变换矩阵T的乘积的结果矩阵来 确定用户所属的网页类别。 0124 具体地,将用户-主题矩阵M与主题-类别变换矩阵T相乘得到用户-类别矩阵 N。其中,用户-类别矩阵N的第d行第k列N d,k 表示第d个用户属于第k个类别的概率, 亦即第d个用户在第k个类别上的关联度,根据类别的关联度的值的大小来确定用户所属 的网页类别,例如可基。

48、于所述用户-分类矩阵将与用户关联度最大一个或多个的网页类别 确定为该用户所属的网页类别。 0125 举例而言,假定根据步骤130获得关于四个用户的用户-主题矩阵,矩阵如下所 示, 0126 0127 其中,行向量分别表示用户1、用户2、用户3、用户4等四个用户,列向量分别表示 校园、活动、旅游、交易、公司、电子等六个主题。 0128 对于网页类别为社交网站,预先设定与网页类别的相关联的主题为“社交网站: 校园;活动;旅游”,对于网页类别为电子商务网站,预先设定与网页类别的相关联的主题为 “电子商务网站:交易;公司;电子”。 0129 根据子步骤110中设定数量的网页的网页类别所关联的一个或多个主题,通过统 计前述子步骤110中的设定数量(对应于第一设定数量)的网页中、与第j个主题相关联 且被分类至第k个网页类别的网页数量t j,k 来确定主题-类别变换矩阵,假定子步骤110 中的设定数量的网页为8个,则属于各个主题的网页个数的表示分别为“2校园、2活动、2 旅游、2交易、0公司、0电子”,根据上述结果可以构建出主题-类别变换矩阵,如下所示, 说 明 书CN 102523274 A 12 10/13页 13 0130 0131 其中,行向量分别表示校园、活动、旅游、交易、公司、电子等六个主题,列向量分别 表示社交网站和电子商务网站两个网页类别。 01。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1