基于异构平台的用户行为数据关联方法及系统.pdf

上传人:e1 文档编号:6013196 上传时间:2019-04-03 格式:PDF 页数:13 大小:830.50KB
返回 下载 相关 举报
摘要
申请专利号:

CN201610806246.7

申请日:

2016.09.07

公开号:

CN106372219A

公开日:

2017.02.01

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20160907|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

大地风景(武汉)信息技术有限公司

发明人:

杜亭; 田广礼; 张西; 陈云武; 谭丽娟

地址:

430000 湖北省武汉市洪山区邮科院路88号烽火科技大厦2楼

优先权:

专利代理机构:

武汉智嘉联合知识产权代理事务所(普通合伙) 42231

代理人:

黄君军

PDF下载: PDF下载
内容摘要

一种基于异构平台的用户行为数据关联方法,包括:S1、列出异构系统的用户标识字段信息;S2、建立ID总表;S3、提取一个异构系统,读取异构系统中用户标识信息字段;S4、在提取下一个异构系统时,开始进行用户标识数据归并;S5、重复执行步骤S4,直至所有的异构系统均完成归并;在存在新增异构系统时,跳转到步骤S4;S6、通过步骤S4将ID总表补充完毕;S7、判断如果第一个异构系统提供了某个特征值;第二个异构系统提供了另一特征值;第三个异构系统同时提供了上述两个特征值,且有关联,则进入混合合并模式;S8、生成统一完整的ID总表后,反向从原异构系统中开始提取用户行为数据进行处理。

权利要求书

1.一种基于异构平台的用户行为数据关联方法,其特征在于,其包括如下步骤:
S1、列出异构系统的用户标识字段信息;
S2、建立ID总表,ID总表用于合并异构系统的关联数据结果;
S3、提取一个异构系统,读取异构系统中用户标识信息字段,判断用户标识字段中是否
存在用户标识数据,如果用户标识字段存在用户标识数据,则将用户标识数据填充到对应
的ID总表中,如果用户标识数据为空,则保留ID总表中位空;
S4、在提取下一个异构系统时,开始进行用户标识数据归并,用户标识数据归并的规则
如下:如果本异构系统的某个用户标识数据项和ID总表中的用户标识数据项一致;则从本
异构系统提取其他用户标识数据填充;
S5、重复执行步骤S4,直至所有的异构系统均完成归并;在存在新增异构系统时,跳转
到步骤S4;
S6、通过步骤S4将ID总表补充完毕;
S7、判断如果第一个异构系统提供了某个特征值;第二个异构系统提供了另一特征值;
第三个异构系统同时提供了上述两个特征值,且有关联,则进入混合合并模式;
S8、生成统一完整的ID总表后,反向从原异构系统中开始提取用户行为数据进行处理。
2.如权利要求1所述的基于异构平台的用户行为数据关联方法,其特征在于,
所述步骤S1中将异构系统中用户标识字段信息放入配置文件,配置文件的格式如下:
SystemName用于表示异构系统名称;
SystemDBLink用于表示异构数据库JDBC链接;
BussinessTableName用于表示业务系统表名称,多表用逗号分隔;
SQLForBussinessdata用于表示提取业务数据的SQL定义;
Fields用于表示关联数据的对应字段,用逗号分隔;
MapData用于表示业务数据到统一用户行为表的映射数据关系,使用键值对表示。
3.如权利要求2所述的基于异构平台的用户行为数据关联方法,其特征在于,
所述步骤S7包括:
S71、新进入的用户标识数据匹配到第一个关键字的用户,补充全第一个关键字的所有
用户标识数据;第一个异构系统带身份证号,第二个异构系统是手机号码,第三个异构系统
同时包括手机号码和身份证号;则第三个异构系统的用户标识数据进入时,对于某个用户
身份证号和手机号码已经进入异构系统时,通过第三个异构系统确认这两个信息是同一个
人;
S72、后续增加的用户标识数据,对已有用户标识数据进行逐条匹配,第三个异构系统
和ID总表的身份证号,在先判断了相同时,则第三个异构系统带的手机号码填写在ID总表
和身份证对应的那一条用户标识数据中,同时,在继续匹配中在还有手机号相同的一条记
录也在这个第三个异构系统中,则直接删除这条手机号相同的记录;
S73、将身份证号设置为拥有最高有限级别,如果归并信息中发现有身份证号相同,手
机号码不同的用户,则判断该用户拥有双手机或者手机换号;则可以记录为两条记录,并归
并成同一个人的信息。
4.如权利要求3所述的基于异构平台的用户行为数据关联方法,其特征在于,
所述步骤S8包括:
S81、定义用户行为数据表的表结构,同时对所有异构系统的用户标识字段对应到用户
行为表的字段结构上;
S82、读取ID总表的第一条用户标识数据,打开异构系统的一个业务数据库的对应表,
通过直接查看配置文件进行判断;
S83、判断配置文件中,该异构数据库的关联字,从配置文件中,使用预先写好的SQL,利
用关联字提取该异构系统的用户标识数据;
S84、使用配置文件的数据映射关系,完成最后的用户标识数据插入映射处理;
S85、循环步骤S81至步骤S84开始获得处理下一个异构系统直至所有的异构系统中用
户标识数据处理完毕。
5.一种基于异构平台的用户行为数据关联系统,其特征在于,其包括如下单元:
信息列举单元,用于列出异构系统的用户标识字段信息;
ID总表构建单元,用于建立ID总表,ID总表用于合并异构系统的关联数据结果;
数据填充单元,用于提取一个异构系统,读取异构系统中用户标识信息字段,判断用户
标识字段中是否存在用户标识数据,如果用户标识字段存在用户标识数据,则将用户标识
数据填充到对应的ID总表中,如果用户标识数据为空,则保留ID总表中位空;
数据归并单元,用于在提取下一个异构系统时,开始进行用户标识数据归并,用户标识
数据归并的规则如下:如果本异构系统的某个用户标识数据项和ID总表中的用户标识数据
项一致;则从本异构系统提取其他用户标识数据填充;
迭代单元,用于重复执行数据归并单元,直至所有的异构系统均完成归并;在存在新增
异构系统时,跳转到数据归并单元;
数据补充单元,用于通过数据归并单元将ID总表补充完毕;
关联判断单元,用于判断如果第一个异构系统提供了某个特征值;第二个异构系统提
供了另一特征值;第三个异构系统同时提供了上述两个特征值,且有关联,则进入混合合并
模式;
反向提取单元,用于在生成统一完整的ID总表后,反向从原异构系统中开始提取用户
行为数据进行处理。
6.如权利要求5所述的基于异构平台的用户行为数据关联系统,其特征在于,
所述信息列举单元中将异构系统中用户标识字段信息放入配置文件,配置文件的格式
如下:
SystemName用于表示异构系统名称;
SystemDBLink用于表示异构数据库JDBC链接;
BussinessTableName用于表示业务系统表名称,多表用逗号分隔;
SQLForBussinessdata用于表示提取业务数据的SQL定义;
Fields用于表示关联数据的对应字段,用逗号分隔;
MapData用于表示业务数据到统一用户行为表的映射数据关系,使用键值对表示。
7.如权利要求6所述的基于异构平台的用户行为数据关联系统,其特征在于,
所述关联判断单元包括:
同一用户判断子单元,用于对新进入的用户标识数据匹配到第一个关键字的用户,补
充全第一个关键字的所有用户标识数据;第一个异构系统带身份证号,第二个异构系统是
手机号码,第三个异构系统同时包括手机号码和身份证号;则第三个异构系统的用户标识
数据进入时,对于某个用户身份证号和手机号码已经进入异构系统时,通过第三个异构系
统确认这两个信息是同一个人;
重复信息删除子单元,用于对后续增加的用户标识数据,对已有用户标识数据进行逐
条匹配,第三个异构系统和ID总表的身份证号,在先判断了相同时,则第三个异构系统带的
手机号码填写在ID总表和身份证对应的那一条用户标识数据中,同时,在继续匹配中在还
有手机号相同的一条记录也在这个第三个异构系统中,则直接删除这条手机号相同的记
录;
信息合并子单元,用于将身份证号设置为拥有最高有限级别,如果归并信息中发现有
身份证号相同,手机号码不同的用户,则判断该用户拥有双手机或者手机换号;则可以记录
为两条记录,并归并成同一个人的信息。
8.如权利要求7所述的基于异构平台的用户行为数据关联系统,其特征在于,
所述反向提取单元包括:
用户行为表创建子单元,用于定义用户行为数据表的表结构,同时对所有异构系统的
用户标识字段对应到用户行为表的字段结构上;
ID总表数据查询子单元,用于读取ID总表的第一条用户标识数据,打开异构系统的一
个业务数据库的对应表,通过直接查看配置文件进行判断;
用户标识数据提取子单元,用于判断配置文件中,该异构数据库的关联字,从配置文件
中,使用预先写好的SQL,利用关联字提取该异构系统的用户标识数据;
数据插入子单元,用于使用配置文件的数据映射关系,完成最后的用户标识数据插入
映射处理;
迭代子单元,用于循环用户行为表创建子单元至数据插入子单元开始获得处理下一个
异构系统直至所有的异构系统中用户标识数据处理完毕。

说明书

基于异构平台的用户行为数据关联方法及系统

技术领域

本发明涉及信息数据处理技术领域,特别涉及一种基于异构平台的用户行为数据
关联方法及系统。

背景技术

目前,旅游行业有很多的信息采集的平台,比如wifi系统,微信信息,门票系统,酒
店系统等,一个旅游投资公司往往拥有不同业态的各种异构平台数据系统,但是这些平台
独立工作,需要一种方法将这些异构的数据关联寻找出来,进而挖掘分析确认这些系统的
用户是否是同一个用户,利用这种挖掘方法进一步确认用户在各种平台上的行为数据关
联,形成一个统一的用户描述信息。

发明内容

有鉴于此,本发明提出一种能够解决多异构平台中,寻找匹配确认各种异构平台
中的用户信息,并确认是否同一个用户,并提取到一个统一的用户行为数据平台中的基于
异构平台的用户行为数据关联方法及系统。

一种基于异构平台的用户行为数据关联方法,其包括如下步骤:

S1、列出异构系统的用户标识字段信息;

S2、建立ID总表,ID总表用于合并异构系统的关联数据结果;

S3、提取一个异构系统,读取异构系统中用户标识信息字段,判断用户标识字段中
是否存在用户标识数据,如果用户标识字段存在用户标识数据,则将用户标识数据填充到
对应的ID总表中,如果用户标识数据为空,则保留ID总表中位空;

S4、在提取下一个异构系统时,开始进行用户标识数据归并,用户标识数据归并的
规则如下:如果本异构系统的某个用户标识数据项和ID总表中的用户标识数据项一致;则
从本异构系统提取其他用户标识数据填充;

S5、重复执行步骤S4,直至所有的异构系统均完成归并;在存在新增异构系统时,
跳转到步骤S4;

S6、通过步骤S4将ID总表补充完毕;

S7、判断如果第一个异构系统提供了某个特征值;第二个异构系统提供了另一特
征值;第三个异构系统同时提供了上述两个特征值,且有关联,则进入混合合并模式;

S8、生成统一完整的ID总表后,反向从原异构系统中开始提取用户行为数据进行
处理。

在本发明所述的基于异构平台的用户行为数据关联方法中,

所述步骤S1中将异构系统中用户标识字段信息放入配置文件,配置文件的格式如
下:

SystemName用于表示异构系统名称;

SystemDBLink用于表示异构数据库JDBC链接;

BussinessTableName用于表示业务系统表名称,多表用逗号分隔;

SQLForBussinessdata用于表示提取业务数据的SQL定义;

Fields用于表示关联数据的对应字段,用逗号分隔;

MapData用于表示业务数据到统一用户行为表的映射数据关系,使用键值对表示。

在本发明所述的基于异构平台的用户行为数据关联方法中,

所述步骤S7包括:

S71、新进入的用户标识数据匹配到第一个关键字的用户,补充全第一个关键字的
所有用户标识数据;第一个异构系统带身份证号,第二个异构系统是手机号码,第三个异构
系统同时包括手机号码和身份证号;则第三个异构系统的用户标识数据进入时,对于某个
用户身份证号和手机号码已经进入异构系统时,通过第三个异构系统确认这两个信息是同
一个人;

S72、后续增加的用户标识数据,对已有用户标识数据进行逐条匹配,第三个异构
系统和ID总表的身份证号,在先判断了相同时,则第三个异构系统带的手机号码填写在ID
总表和身份证对应的那一条用户标识数据中,同时,在继续匹配中在还有手机号相同的一
条记录也在这个第三个异构系统中,则直接删除这条手机号相同的记录;

S73、将身份证号设置为拥有最高有限级别,如果归并信息中发现有身份证号相
同,手机号码不同的用户,则判断该用户拥有双手机或者手机换号;则可以记录为两条记
录,并归并成同一个人的信息。

在本发明所述的基于异构平台的用户行为数据关联方法中,

所述步骤S8包括:

S81、定义用户行为数据表的表结构,同时对所有异构系统的用户标识字段对应到
用户行为表的字段结构上;

S82、读取ID总表的第一条用户标识数据,打开异构系统的一个业务数据库的对应
表,通过直接查看配置文件进行判断;

S83、判断配置文件中,该异构数据库的关联字,从配置文件中,使用预先写好的
SQL,利用关联字提取该异构系统的用户标识数据;

S84、使用配置文件的数据映射关系,完成最后的用户标识数据插入映射处理;

S85、循环步骤S81至步骤S84开始获得处理下一个异构系统直至所有的异构系统
中用户标识数据处理完毕。

本发明还提供一种基于异构平台的用户行为数据关联系统,其包括如下单元:

信息列举单元,用于列出异构系统的用户标识字段信息;

ID总表构建单元,用于建立ID总表,ID总表用于合并异构系统的关联数据结果;

数据填充单元,用于提取一个异构系统,读取异构系统中用户标识信息字段,判断
用户标识字段中是否存在用户标识数据,如果用户标识字段存在用户标识数据,则将用户
标识数据填充到对应的ID总表中,如果用户标识数据为空,则保留ID总表中位空;

数据归并单元,用于在提取下一个异构系统时,开始进行用户标识数据归并,用户
标识数据归并的规则如下:如果本异构系统的某个用户标识数据项和ID总表中的用户标识
数据项一致;则从本异构系统提取其他用户标识数据填充;

迭代单元,用于重复执行数据归并单元,直至所有的异构系统均完成归并;在存在
新增异构系统时,跳转到数据归并单元;

数据补充单元,用于通过数据归并单元将ID总表补充完毕;

关联判断单元,用于判断如果第一个异构系统提供了某个特征值;第二个异构系
统提供了另一特征值;第三个异构系统同时提供了上述两个特征值,且有关联,则进入混合
合并模式;

反向提取单元,用于在生成统一完整的ID总表后,反向从原异构系统中开始提取
用户行为数据进行处理。

在本发明所述的基于异构平台的用户行为数据关联系统中,

所述信息列举单元中将异构系统中用户标识字段信息放入配置文件,配置文件的
格式如下:

SystemName用于表示异构系统名称;

SystemDBLink用于表示异构数据库JDBC链接;

BussinessTableName用于表示业务系统表名称,多表用逗号分隔;

SQLForBussinessdata用于表示提取业务数据的SQL定义;

Fields用于表示关联数据的对应字段,用逗号分隔;

MapData用于表示业务数据到统一用户行为表的映射数据关系,使用键值对表示。

在本发明所述的基于异构平台的用户行为数据关联系统中,

所述关联判断单元包括:

同一用户判断子单元,用于对新进入的用户标识数据匹配到第一个关键字的用
户,补充全第一个关键字的所有用户标识数据;第一个异构系统带身份证号,第二个异构系
统是手机号码,第三个异构系统同时包括手机号码和身份证号;则第三个异构系统的用户
标识数据进入时,对于某个用户身份证号和手机号码已经进入异构系统时,通过第三个异
构系统确认这两个信息是同一个人;

重复信息删除子单元,用于对后续增加的用户标识数据,对已有用户标识数据进
行逐条匹配,第三个异构系统和ID总表的身份证号,在先判断了相同时,则第三个异构系统
带的手机号码填写在ID总表和身份证对应的那一条用户标识数据中,同时,在继续匹配中
在还有手机号相同的一条记录也在这个第三个异构系统中,则直接删除这条手机号相同的
记录;

信息合并子单元,用于将身份证号设置为拥有最高有限级别,如果归并信息中发
现有身份证号相同,手机号码不同的用户,则判断该用户拥有双手机或者手机换号;则可以
记录为两条记录,并归并成同一个人的信息。

在本发明所述的基于异构平台的用户行为数据关联系统中,

所述反向提取单元包括:

用户行为表创建子单元,用于定义用户行为数据表的表结构,同时对所有异构系
统的用户标识字段对应到用户行为表的字段结构上;

ID总表数据查询子单元,用于读取ID总表的第一条用户标识数据,打开异构系统
的一个业务数据库的对应表,通过直接查看配置文件进行判断;

用户标识数据提取子单元,用于判断配置文件中,该异构数据库的关联字,从配置
文件中,使用预先写好的SQL,利用关联字提取该异构系统的用户标识数据;

数据插入子单元,用于使用配置文件的数据映射关系,完成最后的用户标识数据
插入映射处理;

迭代子单元,用于循环用户行为表创建子单元至数据插入子单元开始获得处理下
一个异构系统直至所有的异构系统中用户标识数据处理完毕。

实施本发明提供的基于异构平台的用户行为数据关联方法及系统与现有技术相
比具有以下有益效果:当有多种不同异构系统,每种异构系统有各自的唯一信息标识,但是
无法确定这些异构系统中的用户是否是一个用户,利用本发明技术方案,可以得出(只要这
一批异构系统的数据有相互关联)异构系统中的用户是否是同一个用户,并且从不同的异
构系统中提取出这个用户的相关行为。最终形成统一的ID总表和用户行为信息表,能够为
后续的数据分析做准备。

附图说明

图1是本发明实施例的基于异构平台的用户行为数据关联系统示意图;

图2是本发明实施例的基于异构平台的用户行为数据关联系统结构框图;

图3是图2中关联判断单元结构框图;

图4是图2中反向提取单元结构框图。

具体实施方式

一种基于异构平台的用户行为数据关联方法,其包括如下步骤:

S1、列出异构系统的用户标识字段信息。

S2、建立ID总表,ID总表用于合并异构系统的关联数据结果。

S3、提取一个异构系统,读取异构系统中用户标识信息字段,判断用户标识字段中
是否存在用户标识数据,如果用户标识字段存在用户标识数据,则将用户标识数据填充到
对应的ID总表中,如果用户标识数据为空,则保留ID总表中位空。

S4、在提取下一个异构系统时,开始进行用户标识数据归并,用户标识数据归并的
规则如下:如果本异构系统的某个用户标识数据项和ID总表中的用户标识数据项一致;则
从本异构系统提取其他用户标识数据填充。

S5、重复执行步骤S4,直至所有的异构系统均完成归并;在存在新增异构系统时,
跳转到步骤S4。

S6、通过步骤S4将ID总表补充完毕。

S7、判断如果第一个异构系统提供了某个特征值;第二个异构系统提供了另一特
征值;第三个异构系统同时提供了上述两个特征值,且有关联,则进入混合合并模式;如果
第一个异构系统提供了比如某个特征值,比如身份证号,第二个异构系统提供了比如手机
号码的特征值,第三个异构系统同时提供了身份证号和手机号码,且有关联,则进入混合合
并模式。

S8、生成统一完整的ID总表后,反向从原异构系统中开始提取用户行为数据进行
处理。

在本发明所述的基于异构平台的用户行为数据关联方法中,

所述步骤S1中将异构系统中用户标识字段信息放入配置文件,配置文件的格式如
下:

SystemName用于表示异构系统名称;

SystemDBLink用于表示异构数据库JDBC链接;

BussinessTableName用于表示业务系统表名称,多表用逗号分隔;

SQLForBussinessdata用于表示提取业务数据的SQL定义;

Fields用于表示关联数据的对应字段,用逗号分隔;

MapData用于表示业务数据到统一用户行为表的映射数据关系,使用键值对表示。

在本发明所述的基于异构平台的用户行为数据关联方法中,

所述步骤S7包括:

S71、新进入的用户标识数据匹配到第一个关键字的用户,补充全第一个关键字的
所有用户标识数据;第一个异构系统带身份证号,第二个异构系统是手机号码,第三个异构
系统同时包括手机号码和身份证号;则第三个异构系统的用户标识数据进入时,对于某个
用户身份证号和手机号码已经进入异构系统时但是还不确认是同一个人,通过第三个异构
系统确认这两个信息是同一个人。

S72、后续增加的用户标识数据,对已有用户标识数据进行逐条匹配,第三个异构
系统和ID总表的身份证号,在先判断了相同时,则第三个异构系统带的手机号码填写在ID
总表和身份证对应的那一条用户标识数据中,同时,在继续匹配中在还有手机号相同的一
条记录也在这个第三个异构系统中,则直接删除这条手机号相同的记录。

S73、将身份证号设置为拥有最高有限级别,如果归并信息中发现有身份证号相
同,手机号码不同的用户,则判断该用户拥有双手机或者手机换号;则可以记录为两条记
录,并归并成同一个人的信息。

在本发明所述的基于异构平台的用户行为数据关联方法中,

所述步骤S8包括:

S81、定义用户行为数据表的表结构,同时对所有异构系统的用户标识字段对应到
用户行为表的字段结构上。

S82、读取ID总表的第一条用户标识数据,打开异构系统的一个业务数据库的对应
表,通过直接查看配置文件进行判断。

S83、判断配置文件中,该异构数据库的关联字,从配置文件中,使用预先写好的
SQL,利用关联字提取该异构系统的用户标识数据。

S84、使用配置文件的数据映射关系,完成最后的用户标识数据插入映射处理。

S85、循环步骤S81至步骤S84开始获得处理下一个异构系统直至所有的异构系统
中用户标识数据处理完毕。

如图1、2所示,图1是本发明实施例的基于异构平台的用户行为数据关联系统示意
图,本发明还提供一种基于异构平台的用户行为数据关联系统,其包括如下单元:

信息列举单元,用于列出异构系统的用户标识字段信息;

ID总表构建单元,用于建立ID总表,ID总表用于合并异构系统的关联数据结果;

数据填充单元,用于提取一个异构系统,读取异构系统中用户标识信息字段,判断
用户标识字段中是否存在用户标识数据,如果用户标识字段存在用户标识数据,则将用户
标识数据填充到对应的ID总表中,如果用户标识数据为空,则保留ID总表中位空;

数据归并单元,用于在提取下一个异构系统时,开始进行用户标识数据归并,用户
标识数据归并的规则如下:如果本异构系统的某个用户标识数据项和ID总表中的用户标识
数据项一致;则从本异构系统提取其他用户标识数据填充;

迭代单元,用于重复执行数据归并单元,直至所有的异构系统均完成归并;在存在
新增异构系统时,跳转到数据归并单元;

数据补充单元,用于通过数据归并单元将ID总表补充完毕;

关联判断单元,用于判断如果第一个异构系统提供了某个特征值;第二个异构系
统提供了另一特征值;第三个异构系统同时提供了上述两个特征值,且有关联,则进入混合
合并模式;

反向提取单元,用于在生成统一完整的ID总表后,反向从原异构系统中开始提取
用户行为数据进行处理。

在本发明所述的基于异构平台的用户行为数据关联系统中,

所述信息列举单元中将异构系统中用户标识字段信息放入配置文件,配置文件的
格式如下:

SystemName用于表示异构系统名称;

SystemDBLink用于表示异构数据库JDBC链接;

BussinessTableName用于表示业务系统表名称,多表用逗号分隔;

SQLForBussinessdata用于表示提取业务数据的SQL定义;

Fields用于表示关联数据的对应字段,用逗号分隔;

MapData用于表示业务数据到统一用户行为表的映射数据关系,使用键值对表示。

如图3所示,在本发明所述的基于异构平台的用户行为数据关联系统中,

所述关联判断单元包括:

同一用户判断子单元,用于对新进入的用户标识数据匹配到第一个关键字的用
户,补充全第一个关键字的所有用户标识数据;第一个异构系统带身份证号,第二个异构系
统是手机号码,第三个异构系统同时包括手机号码和身份证号;则第三个异构系统的用户
标识数据进入时,对于某个用户身份证号和手机号码已经进入异构系统时,通过第三个异
构系统确认这两个信息是同一个人;

重复信息删除子单元,用于对后续增加的用户标识数据,对已有用户标识数据进
行逐条匹配,第三个异构系统和ID总表的身份证号,在先判断了相同时,则第三个异构系统
带的手机号码填写在ID总表和身份证对应的那一条用户标识数据中,同时,在继续匹配中
在还有手机号相同的一条记录也在这个第三个异构系统中,则直接删除这条手机号相同的
记录;

信息合并子单元,用于将身份证号设置为拥有最高有限级别,如果归并信息中发
现有身份证号相同,手机号码不同的用户,则判断该用户拥有双手机或者手机换号;则可以
记录为两条记录,并归并成同一个人的信息。

如图4所示,在本发明所述的基于异构平台的用户行为数据关联系统中,

所述反向提取单元包括:

用户行为表创建子单元,用于定义用户行为数据表的表结构,同时对所有异构系
统的用户标识字段对应到用户行为表的字段结构上;

ID总表数据查询子单元,用于读取ID总表的第一条用户标识数据,打开异构系统
的一个业务数据库的对应表,通过直接查看配置文件进行判断;

用户标识数据提取子单元,用于判断配置文件中,该异构数据库的关联字,从配置
文件中,使用预先写好的SQL,利用关联字提取该异构系统的用户标识数据;

数据插入子单元,用于使用配置文件的数据映射关系,完成最后的用户标识数据
插入映射处理;

迭代子单元,用于循环用户行为表创建子单元至数据插入子单元开始获得处理下
一个异构系统直至所有的异构系统中用户标识数据处理完毕。

可以理解的是,对于本领域的普通技术人员来说,可以根据本发明的技术构思做
出其它各种相应的改变与变形,而所有这些改变与变形都应属于本发明权利要求的保护范
围。

基于异构平台的用户行为数据关联方法及系统.pdf_第1页
第1页 / 共13页
基于异构平台的用户行为数据关联方法及系统.pdf_第2页
第2页 / 共13页
基于异构平台的用户行为数据关联方法及系统.pdf_第3页
第3页 / 共13页
点击查看更多>>
资源描述

《基于异构平台的用户行为数据关联方法及系统.pdf》由会员分享,可在线阅读,更多相关《基于异构平台的用户行为数据关联方法及系统.pdf(13页珍藏版)》请在专利查询网上搜索。

一种基于异构平台的用户行为数据关联方法,包括:S1、列出异构系统的用户标识字段信息;S2、建立ID总表;S3、提取一个异构系统,读取异构系统中用户标识信息字段;S4、在提取下一个异构系统时,开始进行用户标识数据归并;S5、重复执行步骤S4,直至所有的异构系统均完成归并;在存在新增异构系统时,跳转到步骤S4;S6、通过步骤S4将ID总表补充完毕;S7、判断如果第一个异构系统提供了某个特征值;第二个异。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1