地址信息库的更新方法和装置.pdf

上传人:000****221 文档编号:1640730 上传时间:2018-06-30 格式:PDF 页数:12 大小:811.62KB
返回 下载 相关 举报
摘要
申请专利号:

CN201510059620.7

申请日:

2015.02.04

公开号:

CN104636458A

公开日:

2015.05.20

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20150204|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

中国联合网络通信集团有限公司

发明人:

王蓉; 王志军

地址:

100033北京市西城区金融大街21号

优先权:

专利代理机构:

北京安信方达知识产权代理有限公司11262

代理人:

李丹; 栗若木

PDF下载: PDF下载
内容摘要

本发明实施例提供的地址信息库的更新方法和装置,包括:根据地址信息库对用户访问互联网的记录进行应用识别,查找出识别成功的记录以及识别失败的记录;根据预设算法计算任意一条识别成功的记录中的访问地址和任意一条识别失败的记录中的访问地址的相关系数;若两个访问地址的相关系数大于或等于预设值,则确定该相关系数对应的两个访问地址对应同一个互联网应用;将两个访问地址中识别失败的记录对应的访问地址添加到该互联网应用的地址库中。通过本发明提供的技术方案,能够将所有互联网应用的所有地址信息收集完整,提高地址信息库的准确性。

权利要求书

权利要求书
1.  一种地址信息库的更新方法,其特征在于,包括:
根据地址信息库对用户访问互联网的记录进行应用识别,每条记录中包 括访问地址和访问时刻,查找出识别成功的记录以及识别失败的记录;
对于由任意一条识别成功的记录和任意一条识别失败的记录组成的两条 记录,根据所述两条记录对应的两个访问时刻计算所述两条记录对应的两个 访问地址的相关系数;
若所述两个访问地址的相关系数大于或等于预设值,则确定所述两个访 问地址对应同一个互联网应用;将所述两个访问地址中所述识别失败的记录 对应的访问地址添加到所述互联网应用的地址库中。

2.  根据权利要求1所述的方法,所述根据所述两条记录对应的两个访问 时刻计算所述两条记录对应的两个访问地址的相关系数包括:
计算所述两条记录对应的两个访问时刻的时间差;
将所述时间差与预设时间阈值进行比较;
若所述时间差小于或等于所述预设时间阈值,则所述两个访问地址的相 关系数为P;若所述时间差大于所述预设时间阈值,则所述两个访问地址的 相关系数为Q;其中,P>Q。

3.  根据权利要求2所述的方法,其特征在于,所述根据所述两条记录对 应的两个访问时刻计算所述两条记录对应的两个访问地址的相关系数还包 括:
当计算得到的所述两个访问地址的相关系数有K个时,将所述K个相关 系数的平均值作为所述两个访问地址的相关系数,K为大于1的整数。

4.  根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
对于所述识别失败记录中未被添加的访问地址,根据任意两个未被添加 的访问地址对应的访问时刻计算所述任意两个未被添加的访问地址的相关系 数;
若任意两个未被添加的访问地址的相关系数大于或等于所述预设值,则 确定所述任意两个未被添加的访问地址对应同一个新的互联网应用并利用网 络爬虫技术识别出所述新的互联网应用;将所述任意两个未被添加的访问地 址添加到所述新的互联网应用的地址库中并更新所述地址信息库。

5.  根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
对于所述识别失败记录中未被添加的访问地址,利用网络爬虫技术识别 出所述未被添加的访问地址对应的互联网应用并根据所述识别结果更新所述 地址信息库。

6.  一种用于更新地址信息库的装置,其特征在于,包括:
识别单元,用于根据地址信息库对用户访问互联网的记录进行应用识别, 每条记录中包括访问地址和访问时刻,查找出识别成功的记录以及识别失败 的记录;
计算单元,用于对于由任意一条识别成功的记录和任意一条识别失败的 记录组成的两条记录,根据所述两条记录对应的两个访问时刻计算所述两条 记录对应的两个访问地址的相关系数;
处理单元,用于若所述两个访问地址的相关系数大于或等于预设值,则 确定所述两个访问地址对应同一个互联网应用;将所述两个访问地址中所述 识别失败的记录对应的访问地址添加到所述互联网应用的地址库中。

7.  根据权利要求6所述的装置,所述计算单元具体用于:
计算所述两条记录对应的两个访问时刻的时间差;
将所述时间差与预设时间阈值进行比较;
若所述时间差小于或等于所述预设时间阈值,则所述两个访问地址的相 关系数为P;若所述时间差大于所述预设时间阈值,则所述两个访问地址的 相关系数为Q;其中,P>Q。

8.  根据权利要求7所述的装置,其特征在于,所述计算单元还具体用于:
当计算得到的所述两个访问地址的相关系数有K个时,将所述K个相关 系数的平均值作为所述两个访问地址的相关系数,K为大于1的整数。

9.  根据权利要求6至8任一所述的装置,其特征在于,所述计算单元还 用于对于所述识别失败记录中未被添加的访问地址,根据任意两个未被添加 的访问地址对应的访问时刻计算所述任意两个未被添加的访问地址的相关系 数;相应的,
所述处理单元还用于若任意两个未被添加的访问地址的相关系数大于或 等于所述预设值,则确定所述任意两个未被添加的访问地址对应同一个新的 互联网应用并利用网络爬虫技术识别出所述新的互联网应用;将所述任意两 个未被添加的访问地址添加到所述新的互联网应用的地址库中并更新所述地 址信息库。

10.  根据权利要求6至8任一所述的装置,其特征在于,所述处理单元 还用于:
对于所述识别失败记录中未被添加的访问地址,利用网络爬虫技术识别 出所述未被添加的访问地址对应的互联网应用并根据所述识别结果更新所述 地址信息库。

说明书

说明书地址信息库的更新方法和装置
技术领域
本发明涉及互联网技术领域,具体涉及一种地址信息库的更新方法和装 置。
背景技术
移动互联网用户行为分析是指以识别用户使用的互联网应用(例如微信、 QQ、微博、新浪网以及淘宝网等等)为基础,通过对用户相关的数据进行应 用识别以识别出用户所访问的互联网应用类别和频度,从而得到用户的上网 喜好等信息。其中,应用识别是指将用户访问互联网的记录中的访问的互联 网协议(Internet Protocol,IP)地址或访问的统一资源定位符(Uniform Resource  Locator,URL)与互联网应用的地址信息库中的记录进行匹配计算,该地址 信息库中存储与互联网应用对应的地址信息,地址信息包括:该互联网应用 对应的IP地址和/或该互联网应用对应的URL(注:某些互联网应用可能只 有对应的IP地址而没有对应的URL),如果用户访问互联网的记录(例如访 问的URL)与该地址信息库中某个互联网应用的地址信息(例如该互联网应 用对应的URL)匹配成功,则成功识别出该记录是用户访问该互联网应用的 记录。
随着时间的发展,互联网应用的地址信息会发生变化,例如新增的可供 访问的IP地址或URL,因此,互联网应用的地址信息库就需要根据实际情况 不断更新。现有的技术方案是使用网络爬虫技术来更新和维护地址信息库。 网络爬虫是一个自动提取网页的程序,它的基本原理为:将给定的网址信息 作为目标地址,将目标地址放入待抓取队列中,从待抓取队列依次读取,并 将队列中待抓取的目标地址交给网页下载器,网页下载器将目标地址对应的 网页的页面内容下载下来,对页面内容进行分析可以确定该页面对应的应用 以及该页面中与目标地址相关的地址。由于网络爬虫会消耗网站的资源,容 易引起网站访问阻塞,一些互联网应用对网络爬虫进行了屏蔽。因此,现有 的技术方案存在以下问题:无法将所有互联网应用的所有地址信息收集完整, 地址信息库的准确性较低。
发明内容
本发明实施例提供的地址信息库的更新方法和装置,能够将所有互联网 应用的所有地址信息收集完整,提高地址信息库的准确性。
第一方面,本发明实施例提供一种地址信息库的更新方法,所述方法包 括:
根据地址信息库对用户访问互联网的记录进行应用识别,每条记录中包 括访问地址和访问时刻,查找出识别成功的记录以及识别失败的记录;
对于由任意一条识别成功的记录和任意一条识别失败的记录组成的两条 记录,根据所述两条记录对应的两个访问时刻计算所述两条记录对应的两个 访问地址的相关系数;
若所述两个访问地址的相关系数大于或等于预设值,则确定所述两个访 问地址对应同一个互联网应用;将所述两个访问地址中所述识别失败的记录 对应的访问地址添加到所述互联网应用的地址库中。
结合第一方面,在第一种可能的实现方式中,所述根据所述两条记录对 应的两个访问时刻计算所述两条记录对应的两个访问地址的相关系数包括:
计算所述两条记录对应的两个访问时刻的时间差;
将所述时间差与预设时间阈值进行比较;
若所述时间差小于或等于所述预设时间阈值,则所述两个访问地址的相 关系数为P;若所述时间差大于所述预设时间阈值,则所述两个访问地址的 相关系数为Q;其中,P>Q。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中, 根据所述两条记录对应的两个访问时刻计算所述两条记录对应的两个访问地 址的相关系数还包括:
当计算得到的所述两个访问地址的相关系数有K个时,将所述K个相关 系数的平均值作为所述两个访问地址的相关系数,K为大于1的整数。
结合第一方面或其上述可能的实现方式的任一种,在第三种可能的实现 方式中,所述方法还包括:
对于所述识别失败记录中未被添加的访问地址,根据任意两个未被添加 的访问地址对应的访问时刻计算所述任意两个未被添加的访问地址的相关系 数;
若任意两个未被添加的访问地址的相关系数大于或等于所述预设值,则 确定所述任意两个未被添加的访问地址对应同一个新的互联网应用并利用网 络爬虫技术识别出所述新的互联网应用;将所述任意两个未被添加的访问地 址添加到所述新的互联网应用的地址库中并更新所述地址信息库。
结合第一方面或其上述可能的实现方式的任一种,在第四种可能的实现 方式中,其特征在于,所述方法还包括:
对于所述识别失败记录中未被添加的访问地址,利用网络爬虫技术识别 出所述未被添加的访问地址对应的互联网应用并根据所述识别结果更新所述 地址信息库。
第二方面,本发明实施例提供一种用于更新地址信息库的装置,所述装 置包括:
识别单元,用于根据地址信息库对用户访问互联网的记录进行应用识别, 每条记录中包括访问地址和访问时刻,查找出识别成功的记录以及识别失败 的记录;
计算单元,用于对于由任意一条识别成功的记录和任意一条识别失败的 记录组成的两条记录,根据所述两条记录对应的两个访问时刻计算所述两条 记录对应的两个访问地址的相关系数;
处理单元,用于若所述两个访问地址的相关系数大于或等于预设值,则 确定所述两个访问地址对应同一个互联网应用;将所述两个访问地址中所述 识别失败的记录对应的访问地址添加到所述互联网应用的地址库中。
结合第二方面,在第一种可能的实现方式中,所述计算单元具体用于:
计算所述两条记录对应的两个访问时刻的时间差;
将所述时间差与预设时间阈值进行比较;
若所述时间差小于或等于所述预设时间阈值,则所述两个访问地址的相 关系数为P;若所述时间差大于所述预设时间阈值,则所述两个访问地址的 相关系数为Q;其中,P>Q。
结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中, 所述计算单元还具体用于:
当计算得到的所述两个访问地址的相关系数有K个时,将所述K个相关 系数的平均值作为所述两个访问地址的相关系数,K为大于1的整数。
结合第二方面或其上述可能的实现方式的任一种,在第三种可能的实现 方式中,
所述计算单元还用于对于所述识别失败记录中未被添加的访问地址,根 据任意两个未被添加的访问地址对应的访问时刻计算所述任意两个未被添加 的访问地址的相关系数;相应的,
所述处理单元还用于若任意两个未被添加的访问地址的相关系数大于或 等于所述预设值,则确定所述任意两个未被添加的访问地址对应同一个新的 互联网应用并利用网络爬虫技术识别出所述新的互联网应用;将所述任意两 个未被添加的访问地址添加到所述新的互联网应用的地址库中并更新所述地 址信息库。
结合第二方面或其上述可能的实现方式的任一种,在第四种可能的实现 方式中,所述处理单元还用于:
对于所述识别失败记录中未被添加的访问地址,利用网络爬虫技术识别 出所述未被添加的访问地址对应的互联网应用并根据所述识别结果更新所述 地址信息库。
本发明实施例提供的地址信息库的更新方法和装置,根据地址信息库对 用户访问互联网的记录进行应用识别,每条记录中包括访问地址和访问时刻, 查找出识别成功的记录以及识别失败的记录;对于由任意一条识别成功的记 录和任意一条识别失败的记录组成的两条记录,根据所述两条记录对应的两 个访问时刻计算所述两条记录对应的两个访问地址的相关系数;若所述两个 访问地址的相关系数大于或等于预设值,则确定所述两个访问地址对应同一 个互联网应用;将所述两个访问地址中所述识别失败的记录对应的访问地址 添加到所述互联网应用的地址库中。通过本发明提供的技术方案,能够将所 有互联网应用的所有地址信息收集完整,提高地址信息库的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面 描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的地址信息库的更新方法的流程示意图一;
图2为本发明实施例提供的地址信息库的更新方法的流程示意图二;
图3为本发明实施例提供的用于更新地址信息库的装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而 不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在详细介绍本实施例提供的技术方案前,将本发明实施例涉及的相关内 容进行说明,在本发明实施例提供的技术方案中,地址信息库可以使用现有 的地址信息库,该地址信息库由各个互联网应用的地址库组成,互联网应用 的地址库中存有该互联网应用的地址。访问互联网的记录包括:访问地址, 即用户访问的互联网应用的地址,例如,IP地址或者URL;访问时刻,即用 户访问该互联网应用的地址时的时刻。
另外,本发明实施例提供的技术方案中所述的用户访问互联网的记录可 以是运营商系统内单个用户或者全网所有用户海量的访问互联网的记录(例 如系统存储的单个用户或全网所有用户一个月的访问记录),如果是后者, 则基于每个用户的访问互联网的记录实施本发明实施例提供的技术方案即 可,虽然后者的情况带来的运算量比较大,但是也可以收集到更多的地址信 息,进而使得地址信息库的更新速度和准确度更高。
本发明实施例提供的地址信息库的更新方法,如图1所示,该方法包括:
步骤101、根据地址信息库对用户访问互联网的记录进行应用识别,每 条记录中包括访问地址和访问时刻,查找出识别成功的记录以及识别失败的 记录。
步骤102、对于由任意一条识别成功的记录和任意一条识别失败的记录 组成的两条记录,根据两条记录对应的两个访问时刻计算两条记录对应的两 个访问地址的相关系数。
步骤103、若两个访问地址的相关系数大于或等于预设值,则确定两个 访问地址对应同一个互联网应用;将两个访问地址中识别失败的记录对应的 访问地址添加到该互联网应用的地址库中。
通过本发明提供的技术方案,能够将所有互联网应用的所有地址信息收 集完整,提高地址信息库的准确性。
为了使本领域技术人员能够更清楚地理解本发明实施例提供的技术方 案,下面通过具体的实施例,对本发明的实施例提供的地址信息库的更新方 法进行详细说明,如图2所示,该方法包括:
步骤201、根据地址信息库对用户访问互联网的记录进行应用识别,每 条记录中包括访问地址和访问时刻,查找出识别成功的记录以及识别失败的 记录。
示例性的,以用户A一个月的访问互联网的记录为例,根据已有的地址 信息库对用户A一个月的访问互联网的记录进行应用识别,查找出其中能够 匹配上该地址信息库中存有的互联网应用的地址的识别成功的记录以及匹配 不上该地址信息库中存有的互联网应用的地址的识别失败的记录。
步骤202、对于由任意一条识别成功的记录和任意一条识别失败的记录 组成的两条记录,根据两条记录对应的两个访问时刻计算两条记录对应的两 个访问地址的相关系数。
具体的,根据两条记录对应的两个访问时刻计算两条记录对应的两个访 问地址的相关系数可以包括:
计算两条记录对应的两个访问时刻的时间差;
将该时间差与预设时间阈值进行比较;
若该时间差小于或等于预设时间阈值,则两个访问地址的相关系数为P; 若该时间差大于预设时间阈值,则两个访问地址的相关系数为Q;其中,P >Q。
进一步的,当计算得到的两个访问地址的相关系数有K个时,将K个相 关系数的平均值作为前述两个访问地址的相关系数,K为大于1的整数。
下面通过详细的例子对上述的计算方法进行说明,为了方便说明,假定 两条记录为记录1和记录2,记录1为:URL1,10:10:06:200即访问时刻为 上午10点10分06秒200毫秒;记录2为:URL2,10:10:06:300;时间差为 正数,是时间相减之后的绝对值,则记录1与记录2的时间差为100毫秒; 预设时间阈值为200ms;P=1,Q=0;则记录1的URL1和记录2的URL2的 相关系数为:1。
需要说明的是,预设时间阈值的选取对计算访问地址之间的相关系数有 较大影响,为了更好的反映两个访问地址之间的相关度,还可以选取多个时 间阈值用于计算两个访问地址的相关系数,利用多个时间阈值独立计算得到 多个关于所述两个访问地址的相关系数,将前述多个相关系数的平均值作为 所述两个访问地址的相关系数。例如,分别利用5个时间阈值50ms、100ms、 200ms、300ms以及500ms独立计算得到5个关于URL1和URL2的相关系数 0、1、1、1以及1,将平均值0.8最终作为URL1和URL2的相关系数。
另外,由于用户A一个月的访问互联网的记录中可能有多条包括URL1 的记录以及多条包括URL2的记录,因此,在计算两个访问地址的相关系数 时,可能会计算得到多个URL1和URL2的相关系数,假设计算得到URL1 和URL2的相关系数有100个即K取100,则对该100个相关系数求平均值, 将得到的平均值作为URL1和URL2的相关系数。
步骤203、若两个访问地址的相关系数大于或等于预设值,则确定两个 访问地址对应同一个互联网应用;将两个访问地址中识别失败的记录对应的 访问地址添加到该互联网应用的地址库中。
示例性的,假设URL1为识别成功的记录中的访问地址,URL2为识别 失败的记录中的访问地址,预设值取0.8,假设根据202最后计算得到URL1 和URL2的相关系数为0.8等于预设值0.8,则确定URL1和URL2对应同一 个互联网应用,将URL2添加到前述互联网应用的地址库中。
进一步的,对于识别失败记录中未被添加的访问地址,可以执行步骤204 以及步骤205。
步骤204、根据任意两个未被添加的访问地址对应的访问时刻计算任意 两个未被添加的访问地址的相关系数。
示例性的,对于两个未被添加的访问地址的相关系数的计算方法,参照 步骤202中的计算方法,在此不做赘述。
步骤205、若任意两个未被添加的访问地址的相关系数大于或等于预设 值,则确定任意两个未被添加的访问地址对应同一个新的互联网应用并利用 网络爬虫技术识别出该新的互联网应用;将任意两个未被添加的访问地址添 加到该新的互联网应用的地址库中并更新地址信息库。
示例性的,假设两条未被添加的访问地址URL3和URL4的相关系数为 0.9,预设值取0.8,则确定URL3和URL4对应同一个新的互联网应用并利用 网络爬虫技术识别出URL3和URL4对应的该新的互联网应用,将URL3和 URL4添加到该新的互联网应用的地址库中,并将新的互联网应用的地址库 添加到地址信息库中。
另外,对于经过步骤203或步骤205后识别失败记录中仍未被添加的访 问地址,还可以利用网络爬虫技术识别出未被添加的访问地址对应的互联网 应用并根据识别结果更新地址信息库。
本发明实施例提供的地址信息库的更新方法,根据地址信息库对用户访 问互联网的记录进行应用识别,每条记录中包括访问地址和访问时刻,查找 出识别成功的记录以及识别失败的记录;对于由任意一条识别成功的记录和 任意一条识别失败的记录组成的两条记录,根据两条记录对应的两个访问时 刻计算两条记录对应的两个访问地址的相关系数;若两个访问地址的相关系 数大于或等于预设值,则确定两个访问地址对应同一个互联网应用;将两个 访问地址中所述识别失败的记录对应的访问地址添加到该互联网应用的地址 库中。通过本发明提供的技术方案,能够将所有互联网应用的所有地址信息 收集完整,提高地址信息库的准确性。
本发明实施例提供的用于更新地址信息库的装置10,如图3所示,该装 置10包括:
识别单元11,用于根据地址信息库对用户访问互联网的记录进行应用识 别,每条记录中包括访问地址和访问时刻,查找出识别成功的记录以及识别 失败的记录。
计算单元12,用于对于由任意一条识别成功的记录和任意一条识别失败 的记录组成的两条记录,根据两条记录对应的两个访问时刻计算两条记录对 应的两个访问地址的相关系数。
处理单元13,用于若两个访问地址的相关系数大于或等于预设值,则确 定两个访问地址对应同一个互联网应用;将两个访问地址中识别失败的记录 对应的访问地址添加到该互联网应用的地址库中。
可选的,计算单元12具体用于:
计算两条记录对应的两个访问时刻的时间差;
将该时间差与预设时间阈值进行比较;
若该时间差小于或等于预设时间阈值,则两个访问地址的相关系数为P; 若该时间差大于预设时间阈值,则两个访问地址的相关系数为Q;其中,P >Q。
可选的,计算单元12还具体用于:
当计算得到的两个访问地址的相关系数有K个时,将K个相关系数的平 均值作为前述两个访问地址的相关系数,K为大于1的整数。
可选的,计算单元12还用于:对于所述识别失败记录中未被添加的访问 地址,根据任意两个未被添加的访问地址对应的访问时刻计算所述任意两个 未被添加的访问地址的相关系数。
相应的,处理单元13还用于若任意两个未被添加的访问地址的相关系数 大于或等于预设值,则确定任意两个未被添加的访问地址对应同一个新的互 联网应用并利用网络爬虫技术识别出该新的互联网应用;将任意两个未被添 加的访问地址添加到该新的互联网应用的地址库中并更新地址信息库。
可选的,处理单元13还用于:
对于识别失败记录中未被添加的访问地址,利用网络爬虫技术识别出未 被添加的访问地址对应的互联网应用并根据识别结果更新地址信息库。
本实施例用于实现上述各方法实施例,本实施例中各个单元的工作流程 和工作原理参见上述各方法实施例中的描述,在此不再赘述。
本发明实施例提供的用于更新地址信息库的装置,根据地址信息库对用 户访问互联网的记录进行应用识别,每条记录中包括访问地址和访问时刻, 查找出识别成功的记录以及识别失败的记录;对于由任意一条识别成功的记 录和任意一条识别失败的记录组成的两条记录,根据两条记录对应的两个访 问时刻计算两条记录对应的两个访问地址的相关系数;若两个访问地址的相 关系数大于或等于预设值,则确定两个访问地址对应同一个互联网应用;将 两个访问地址中所述识别失败的记录对应的访问地址添加到该互联网应用的 地址库中。通过本发明提供的技术方案,能够将所有互联网应用的所有地址 信息收集完整,提高地址信息库的准确性。
以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为 一种逻辑功能划分,实际实现时可以有另外的划分方式。另一点,所显示或 讨论的模块相互之间的连接可以是通过一些接口,可以是电性,机械或其它 的形式。所述各个模块可以是或者也可以不是物理上分开的,可以是或者也 可以不是物理单元。可以根据实际的需要选择其中的部分或者全部模块来实 现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中, 也可以是各个模块单独物理包括,也可以两个或两个以上模块集成在一个模 块中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件 功能模块的形式实现。
上述以软件功能单元的形式实现的集成的模块,可以存储在一个计算机 可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指 令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等) 执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、 移动硬盘、只读存储器(英文:Read-Only Memory,简称ROM)、随机存取 存储器(英文:Random Access Memory,简称RAM)、磁碟或者光盘等各种 可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限 于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易 想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护 范围应以所述权利要求的保护范围为准。

地址信息库的更新方法和装置.pdf_第1页
第1页 / 共12页
地址信息库的更新方法和装置.pdf_第2页
第2页 / 共12页
地址信息库的更新方法和装置.pdf_第3页
第3页 / 共12页
点击查看更多>>
资源描述

《地址信息库的更新方法和装置.pdf》由会员分享,可在线阅读,更多相关《地址信息库的更新方法和装置.pdf(12页珍藏版)》请在专利查询网上搜索。

本发明实施例提供的地址信息库的更新方法和装置,包括:根据地址信息库对用户访问互联网的记录进行应用识别,查找出识别成功的记录以及识别失败的记录;根据预设算法计算任意一条识别成功的记录中的访问地址和任意一条识别失败的记录中的访问地址的相关系数;若两个访问地址的相关系数大于或等于预设值,则确定该相关系数对应的两个访问地址对应同一个互联网应用;将两个访问地址中识别失败的记录对应的访问地址添加到该互联网应用。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1