一种用户群的分类方法和设备.pdf

上传人:xia****o6 文档编号:1300703 上传时间:2018-04-14 格式:PDF 页数:15 大小:950.24KB
返回 下载 相关 举报
摘要
申请专利号:

CN201510955046.3

申请日:

2015.12.17

公开号:

CN106897282A

公开日:

2017.06.27

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效 IPC(主分类):G06F 17/30申请日:20151217|||公开

IPC分类号:

G06F17/30; G06K9/62

主分类号:

G06F17/30

申请人:

阿里巴巴集团控股有限公司

发明人:

席炎; 王晓光; 李文鹏; 赵科科; 隋宛辰; 闫俊杰; 曾海峰

地址:

英属开曼群岛大开曼资本大厦一座四层847号邮箱

优先权:

专利代理机构:

北京国昊天诚知识产权代理有限公司 11315

代理人:

黄熊

PDF下载: PDF下载
内容摘要

本申请公开了一种用户群的分类方法和设备,包括:获取至少两个不同用户的用户信息,所述用户信息包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的一种或者多种;根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,所述设定业务场景至少对应一个用户群;在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场景的不同用户群中,有效改善了现有技术中使用二分类逻辑回归导致用户群分类存在不准确的问题,提高用户群分类的精确度。

权利要求书

1.一种用户群的分类方法,其特征在于,包括:
获取至少两个不同用户的用户信息,其中,所述用户信息包含所述用户的
基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行
为偏好信息中的至少一种或者多种;
根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模
型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率
值,其中,所述设定业务场景至少对应一个用户群;
在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少
两个不同用户划分至所述设定业务场景的用户群中。
2.如权利要求1所述的分类方法,其特征在于,根据所述至少两个不同
用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户
属于所述设定业务场景的其中一个用户群的概率值,包括:
根据所述至少两个不同用户的用户信息和基于设定业务场景的有序多分
类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个
用户群的概率值。
3.如权利要求1所述的分类方法,其特征在于,根据所述至少两个不同
用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户
属于所述设定业务场景的其中一个用户群的概率值,包括:
根据所述至少两个不同用户的用户信息和基于设定业务场景的无序多分
类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个
用户群的概率值。
4.如权利要求1所述的分类方法,其特征在于,根据所述至少两个不同
用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户
属于设定业务场景的其中一个用户群的概率值,包括:
针对所述至少两个不同用户中每一个用户,分别执行以下操作:
根据所述用户的用户信息和基于设定业务场景的有序多分类逻辑回归算
法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第一概率
值;
根据所述用户的用户信息和基于设定业务场景的无序多分类逻辑回归算
法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第二概率
值;
比较所述第一概率值与所述第二概率值的大小,将其中概率值较大的作为
所述用户属于所述设定业务场景的其中一个用户群的概率值。
5.如权利要求1至4任一项所述的分类方法,其特征在于,根据所述概
率值的大小,将所述至少两个不同用户划分至所述设定业务场景的用户群中,
包括:
将得到的每一个所述用户的概率值进行排序;
根据所述设定业务场景所划分用户群的个数,将所述至少两个不同用户进
行划分,得到所述设定业务场景的用户群中包含的用户。
6.一种用户群的分类方法,其特征在于,包括:
获取在设定业务场景下待处理的用户产生的用户信息,其中,所述用户信
息中包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系
信息、所述用户的行为偏好信息中的至少一种或者多种;
根据所述用户的用户信息和基于设定业务场景的多分类模型,确定得到所
述用户属于所述设定业务场景的其中一个用户群的概率值;
将所述概率值与所述设定业务场景中包含的不同用户群对应的设定阈值
进行比较,确定所述用户所属所述设定业务场景的用户群。
7.一种用户群的分类设备,其特征在于,包括:
获取单元,用于获取至少两个不同用户的用户信息,其中,所述用户信息
包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、
所述用户的行为偏好信息中的至少一种或者多种;
确定单元,用于根据所述至少两个不同用户的用户信息和基于设定业务场
景的多分类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的
其中一个用户群的概率值,其中,所述设定业务场景至少对应一个用户群;
分类单元,用于在得到每一个所述用户的概率值时,根据所述概率值的大
小,将所述至少两个不同用户划分至所述设定业务场景的不同用户群中。
8.如权利要求7所述的分类设备,其特征在于,所述确定单元根据所述
至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每
一个所述用户属于所述设定业务场景的其中一个用户群的概率值,包括:
根据所述至少两个不同用户的用户信息和基于设定业务场景的有序多分
类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个
用户群的概率值。
9.如权利要求7所述的分类设备,其特征在于,所述确定单元根据所述
至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每
一个所述用户属于所述设定业务场景的其中一个用户群的概率值,包括:
根据所述至少两个不同用户的用户信息和基于设定业务场景的无序多分
类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个
用户群的概率值。
10.如权利要求7所述的分类设备,其特征在于,所述确定单元根据所述
至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每
一个所述用户属于设定业务场景的其中一个用户群的概率值,包括:
针对所述至少两个不同用户中每一个用户,分别执行以下操作:
根据所述用户的用户信息和基于设定业务场景的有序多分类逻辑回归算
法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第一概率
值;
根据所述用户的用户信息和基于设定业务场景的无序多分类逻辑回归算
法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第二概率
值;
比较所述第一概率值与所述第二概率值的大小,将其中概率值较大的作为
所述用户属于所述设定业务场景的其中一个用户群的概率值。
11.如权利要求7至10任一项所述的分类设备,其特征在于,所述分类
单元根据所述概率值的大小,将所述至少两个不同用户划分至所述设定业务场
景的用户群中,包括:
将得到的每一个所述用户的概率值进行排序;
根据所述设定业务场景所划分用户群的个数,将所述至少两个不同用户进
行划分,得到所述设定业务场景的用户群中包含的用户。
12.一种用户群的分类设备,其特征在于,包括:
获取单元,用于获取在设定业务场景下待处理的用户产生的用户信息,其
中,所述用户信息中包含所述用户的基本信息、所述用户的信用信息、所述用
户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;
确定单元,用于根据所述用户的用户信息和基于设定业务场景的多分类模
型,确定得到所述用户属于所述设定业务场景的其中一个用户群的概率值;
分类单元,用于将所述概率值与所述设定业务场景中包含的不同用户群对
应的设定阈值进行比较,确定所述用户所属所述设定业务场景的用户群。

说明书

一种用户群的分类方法和设备

技术领域

本申请涉及互联网信息处理技术领域,尤其涉及一种用户群的分类方法和
设备。

背景技术

“互联网+”是创新2.0下的互联网发展的新业态,是知识社会创新2.0推动
下的互联网形态演进及其催生的经济社会发展新形态。“互联网+”是互联网思
维的进一步实践成果,它代表一种先进的生产力,推动经济形态不断的发生演
变,从而带动社会经济实体的生命力,为改革、创新、发展提供广阔的网络平
台。在“互联网+”这种大环境下,互联网金融等金融创新行业得以蓬勃发展。
信用消费市场也随着互联网金融行业的发展应运而生。

为了保证信用消费市场的良性发展,个人征信系统(又称为消费者信用信
息系统)也随之出现,个人征信系统通过搜集的个人信用信息(例如:个人基
本信息、信用交易信息、特殊交易、特别记录、客户本人声明等各类信息)确
定消费者(以下称之为用户)的信用度,这样,信用消费市场可以利用不同用
户的信用度为用户提供不同的服务。

经研究发现,在确定用户的信用度时,首先,可以将不同的用户进行划分,
即将不同的用户进行分群;其次,基于得到的不同用户群,为属于同一个用户
群的用户确定信用度。那么,如何精确地将不同的用户进行分群成为一个需要
解决的重要问题。

发明内容

有鉴于此,本申请实施例提供了一种用户群的分类方法和设备,用于解决
现有技术中如何精确地将不同的用户进行分群的问题。

一种用户群的分类方法,包括:

获取至少两个不同用户的用户信息,其中,所述用户信息包含所述用户的
基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行
为偏好信息中的至少一种或者多种;

根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模
型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率
值,其中,所述设定业务场景至少对应一个用户群;

在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少
两个不同用户划分至所述设定业务场景的用户群中。

一种用户群的分类方法,包括:

获取在设定业务场景下待处理的用户产生的用户信息,其中,所述用户信
息中包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系
信息、所述用户的行为偏好信息中的至少一种或者多种;

根据所述用户的用户信息和基于设定业务场景的多分类模型,确定得到所
述用户属于所述设定业务场景的其中一个用户群的概率值;

将所述概率值与所述设定业务场景中包含的不同用户群对应的设定阈值
进行比较,确定所述用户所属所述设定业务场景的用户群。

一种用户群的分类设备,包括:

获取单元,用于获取至少两个不同用户的用户信息,其中,所述用户信息
包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、
所述用户的行为偏好信息中的至少一种或者多种;

确定单元,用于根据所述至少两个不同用户的用户信息和基于设定业务场
景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个
用户群的概率值,其中,所述设定业务场景至少对应一个用户群;

分类单元,用于在得到每一个所述用户的概率值时,根据所述概率值的大
小,将所述至少两个不同用户划分至所述设定业务场景的用户群中。

一种用户群的分类设备,包括:

获取单元,用于获取在设定业务场景下待处理的用户产生的用户信息,其
中,所述用户信息中包含所述用户的基本信息、所述用户的信用信息、所述用
户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;

确定单元,用于根据所述用户的用户信息和基于设定业务场景的多分类模
型,确定得到所述用户属于所述设定业务场景的其中一个用户群的概率值;

分类单元,用于将所述概率值与所述设定业务场景中包含的不同用户群对
应的设定阈值进行比较,确定所述用户所属所述设定业务场景的用户群。

本申请有益效果如下:

本申请实施例获取至少两个不同用户的用户信息,所述用户信息包含所述
用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用
户的行为偏好信息中的至少一种或者多种;根据所述至少两个不同用户的用户
信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设
定业务场景的其中一个用户群的概率值,所述设定业务场景至少对应一个用户
群;在得到每一个所述用户的概率值时,根据所述概率值的大小,将所述至少
两个不同用户划分至所述设定业务场景的不同用户群中。这样,本申请实施例
在确定用户所属的用户群时,基于多分类模型,利用比较全面的用户信息,进
而能够计算得到一个相对准确的确定用户属于哪一个用户群的概率值,有效改
善了现有技术中使用二分类逻辑回归导致用户群分类存在不准确的问题,提高
用户群分类的精确度,为后续能够精确地确定用户的信用度奠定基础,同时也
能够降低后续信用消费市场的消费风险。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所
需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的
一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提
下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种用户群的分类方法的流程示意图;

图2为本申请实施例提供的一种用户群的分类方法的流程示意图;

图3为本申请实施例提供的一种用户群的分类设备的结构示意图;

图4为本申请实施例提供的一种用户群的分类设备的结构示意图。

具体实施方式

为了实现本申请的目的,本申请实施例提供了一种用户群的分类方法和设
备,获取至少两个不同用户的用户信息,所述用户信息包含所述用户的基本信
息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好
信息中的至少一种或者多种;根据所述至少两个不同用户的用户信息和基于设
定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的
其中一个用户群的概率值,所述设定业务场景至少对应一个用户群;在得到每
一个所述用户的概率值时,根据所述概率值的大小,将所述至少两个不同用户
划分至所述设定业务场景的不同用户群中。这样,本申请实施例在确定用户所
属的用户群时,基于多分类模型,利用比较全面的用户信息,进而能够计算得
到一个相对准确的确定用户属于哪一个用户群的概率值,有效改善了现有技术
中使用二分类逻辑回归导致用户群分类存在不准确的问题,提高用户群分类的
精确度,为后续能够精确地确定用户的信用度奠定基础,同时也能够降低后续
信用消费市场的消费风险。

需要说明的是,本申请实施例中所记载的基于设定业务场景的多分类模型
可以是基于设定业务场景的多分类逻辑回归算法得到的,例如:有序多分类逻
辑回归算法,和/或无序多分类逻辑回归算法;也可以是基于其他分类算法得
到的,这里不做具体限定。

下面结合说明书附图对本申请各个实施例作进一步地详细描述。显然,所
描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请
中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有
其它实施例,都属于本申请保护的范围。

图1为本申请实施例提供的一种用户群的分类方法的流程示意图。所述方
法可以如下所示。

步骤101:获取至少两个不同用户的用户信息。

其中,所述用户信息包含所述用户的基本信息、所述用户的信用信息、所
述用户的社会化关系信息以及所述用户的行为偏好信息。

在步骤101中,在获取用户信息阶段,可以是基于不同业务场景,从服务
器中获取与业务场景相关的用户信息,也可以是不限于业务场景,从服务器中
获取已有的用户信息,还可以是基于用户产生的用户行为数据,从服务器中获
取与用户行为数据相关联的用户信息,这里不做限定。

本申请实施例中记载的用户信息可以包含用户的基本信息,所谓用户的基
本信息可以包括年龄、性别、出生地、学历、所从事的职业等,用户的基本信
息可以基于用户在不同互联网平台上的注册信息确定;也可以包含用户的信用
信息,这里的信用信息可以包含用户的信用度、用户所借资源以及逾期未还资
源的信息等;也可以包含用户的的社会化关系信息,这里的社会化关系信息可
以包含与所述用户建立社会化关系的其他用户的用户信息,或者与所述用户建
立社会化关系的其他用户的信用信息等;还可以包含用户的行为偏好信息,这
里的用户的行为偏好信息可以根据用户的行为数据确定。

例如:获取到的用户A的用户信息,其中,用户信息中包含用户A的基
本信息:用户A的姓名XXX、年龄23、出生地北京、学历本科、当期职业学
生等;用户A的信用信息:用户A的信用度良好、当前用户A所具备的信用
额度与其经济能力相当;用户A的社会化关系信息:与用户A建立社会化关
系的其他用户属于大学生的居多;用户A的行为偏好信息:网上购买电子产品
居多,消费能力较同等年龄的人强。

步骤102:根据所述至少两个不同用户的用户信息和基于设定业务场景的
多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户
群的概率值。

其中,所述设定业务场景至少对应一个用户群。

在步骤102中,本申请实施例中所记载的基于设定业务场景的多分类逻辑
回归算法可以是指基于设定业务场景不同,所确定的多分类逻辑回归算法中的
变量不同,例如:对于校园类业务,所设置的变量可以基于所处的学习阶段不
同,例如可以包含一年级的学生、二年级的学生、三年级的学生等,也可以包
含小学生、中学生、大学生、研究生等;对于大众化的业务,所设置的变量可
以基于职业的不同,例如可以包含工人、农民、学生、公务员等等。

这样针对获取的不同用户的用户信息,可以按照设定业务场景所述设置的
变量,利用多分类逻辑回归算法,计算得到每一个所述用户属于所述设定业务
场景的其中一个用户群的概率值。

在实际应用中,多分类逻辑回归算法包含有序多分类逻辑回归算法和无序
多分类逻辑回归算法,有序多分类逻辑回归算法是在二分类逻辑回归算法基础
之上发展的一种算法,通过将设定变量的k种情形划分为两类,利用二分类逻
辑回归模型拟合得到有序多分类逻辑回归模型;无序多分类逻辑回归算法则是
首先定义因变量的参考值,其次,利用不同自变量对应的因变量与参考值相比
建立变换模型,并利用变换模型确定用户的概率值的算法。

本申请实施例中记载的有序多分类逻辑回归算法可以是以现有有序多分
类逻辑算法的基础,结合互联网平台中多样性的用户信息,通过训练的方式得
到的;无序多分类逻辑回归算法可以是以现有无序多分类逻辑算法的基础,结
合互联网平台中多样性的用户信息,通过训练的方式得到的,这里不做限定。

需要说明的是,本申请实施例利用多分类逻辑回归算法,将不同用户的用
户信息进行量化,利用量化结果计算得到每一个所述用户属于所述设定业务场
景的其中一个用户群的概率值。

这里计算得到每一个所述用户属于所述设定业务场景的其中一个用户群
的概率值,说明每一个用户只能被划分至一个用户群中,不可能同时被划分至
两个或者多个用户群中,至于将会被划分至哪个用户群中,需要根据步骤103
中所记载的方式确定。

具体地,根据所述至少两个不同用户的用户信息和基于设定业务场景的有
序多分类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其
中一个用户群的概率值。

例如:将不同用户的用户信息输入基于设定业务场景的有序多分类逻辑回
归算法模型中,使得基于设定业务场景的有序多分类逻辑回归算法模型可以根
据输入的用户信息,确定该用户属于所述设定业务场景的其中一个用户群的概
率值。

或者,

根据所述至少两个不同用户的用户信息和基于设定业务场景的无序多分
类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个
用户群的概率值。

例如:将不同用户的用户信息输入基于设定业务场景的无序多分类逻辑回
归算法模型中,使得基于设定业务场景的无序多分类逻辑回归算法模型可以根
据输入的用户信息,确定该用户属于所述设定业务场景的其中一个用户群的概
率值。

或者,

针对所述至少两个不同用户中每一个用户,分别执行以下操作:

根据所述用户的用户信息和基于设定业务场景的有序多分类逻辑回归算
法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第一概率
值;

根据所述用户的用户信息和基于设定业务场景的无序多分类逻辑回归算
法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第二概率
值;

比较所述第一概率值与所述第二概率值的大小,将其中概率值较大的作为
所述用户属于所述设定业务场景的其中一个用户群的概率值。

这里需要说明的是,基于一种业务场景,可以为该业务场景训练一个有序
多分类逻辑回归模型和一个无序多分类逻辑回归模型,这样,将一个用户的用
户信息分别输入基于设定业务场景的有序多分类逻辑回归算法模型和基于设
定业务场景的无序多分类逻辑回归算法模型中,由基于设定业务场景的有序多
分类逻辑回归算法模型根据该用户的用户信息确定所述用户属于所述设定业
务场景的其中一个用户群的第一概率值;由基于设定业务场景的无序多分类逻
辑回归算法模型根据该用户的用户信息确定所述用户属于所述设定业务场景
的其中一个用户群的第二概率值,从得到的第一概率值和第二概率值中选择其
中一个概率值作为确定用户属于哪个用户群的概率值。

步骤103:在得到每一个所述用户的概率值时,根据所述概率值的大小,
将所述至少两个不同用户划分至所述设定业务场景的用户群中。

在步骤103中,将得到的每一个所述用户的概率值进行排序;根据所述设
定业务场景所划分用户群的个数,将所述至少两个不同用户进行划分,得到所
述设定业务场景的用户群中包含的用户。

需要说明的是,每一个用户群中所包含用户的个数不限,可以相同,也可
以不相同。

这里进行划分可以采用平均划分的方式,也可以采用加权划分的方式,这
里不做限定。

在得到所述设定业务场景的不同用户群中包含的用户时,根据每一个用户
群中包含的用户的概率值,还可以确定该用户群的概率值的取值范围,这样,
对于后续新出现的用户,可以通过概率值的取值范围,快速确定用户所属的用
户群。

或者,还可以根据每一个用户群中包含的用户的概率值,确定该用户群的
设定阈值。

可选地,如果预先确定所述设定业务场景所划分用户群的个数以及每一个
用户群的设定阈值,则可以针对所述至少两个不同用户中每一个用户的概率
值,分别执行以下操作:

将所述用户的概率值与所述设定业务场景的不同用户群对应的设定阈值
进行比较;

当所述用户的概率值与所述设定业务场景的不同用户群对应的设定阈值
之间的差值小于设定数值时,将所述用户划分至所述设定业务场景中所述设定
阈值对应的用户群中。

需要说明的是,本申请实施例可以用来作为训练用户群的方法,通过从互
联网平台中获取大量的用户信息,利用本申请实施例的方案训练不同业务场景
下的用户群分类模型,为后续快速确定用户所属的用户群奠定基础。

通过本申请实施例提供的技术方案,获取至少两个不同用户的用户信息,
所述用户信息包含所述用户的基本信息、所述用户的信用信息、所述用户的社
会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;根据所述至
少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一
个所述用户属于所述设定业务场景的其中一个用户群的概率值,所述设定业务
场景至少对应一个用户群;在得到每一个所述用户的概率值时,根据所述概率
值的大小,将所述至少两个不同用户划分至所述设定业务场景的不同用户群
中。这样,本申请实施例在确定用户所属的用户群时,基于多分类模型,利用
比较全面的用户信息,进而能够计算得到一个相对准确的确定用户属于哪一个
用户群的概率值,有效改善了现有技术中使用二分类逻辑回归导致用户群分类
存在不准确的问题,提高用户群分类的精确度,为后续能够精确地确定用户的
信用度奠定基础,同时也能够降低后续信用消费市场的消费风险。

图2为本申请实施例提供的一种用户群的分类方法的流程示意图。所述方
法可以如下所示。

步骤201:获取在设定业务场景下待处理的用户产生的用户信息。

其中,所述用户信息中包含所述用户的基本信息、所述用户的信用信息、
所述用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多
种。

在步骤201中,在获取用户信息阶段,可以是基于不同业务场景,从服务
器中获取与业务场景相关的用户信息,也可以是不限于业务场景,从服务器中
获取已有的用户信息,还可以是基于用户产生的用户行为数据,从服务器中获
取与用户行为数据相关联的用户信息,这里不做限定。

本申请实施例中记载的用户信息可以包含用户的基本信息,所谓用户的基
本信息可以包括年龄、性别、出生地、学历、所从事的职业等,用户的基本信
息可以基于用户在不同互联网平台上的注册信息确定;也可以包含用户的信用
信息,这里的信用信息可以包含用户的信用度、用户所借资源以及逾期未还资
源的信息等;也可以包含用户的的社会化关系信息,这里的社会化关系信息可
以包含与所述用户建立社会化关系的其他用户的用户信息,或者与所述用户建
立社会化关系的其他用户的信用信息等;还可以包含用户的行为偏好信息,这
里的用户的行为偏好信息可以根据用户的行为数据确定。

步骤202:根据所述用户的用户信息和基于设定业务场景的多分类模型,
确定得到所述用户属于所述设定业务场景的其中一个用户群的概率值。

这里步骤202的实现方式与本申请上述实施例中步骤102中的实现方式相
同,这里不做具体描述。

步骤203:将所述概率值与所述设定业务场景中包含的不同用户群对应的
设定阈值进行比较,确定所述用户所属所述设定业务场景的用户群。

在步骤203中,确定所述设定业务场景中包含的用户群的设定阈值,分别
将所述概率值与确定的每一个设定阈值进行比较,选择比较结果最小所使用的
设定阈值对应的用户群作为所述用户所属所述设定业务场景的用户群。

图3为本申请实施例提供的一种用户群的分类设备的结构示意图。所述分
类设备包括:获取单元31、确定单元32和分类单元33,其中:

获取单元31,用于获取至少两个不同用户的用户信息,其中,所述用户信
息包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信
息、所述用户的行为偏好信息中的至少一种或者多种;

确定单元32,用于根据所述至少两个不同用户的用户信息和基于设定业务
场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一
个用户群的概率值,其中,所述设定业务场景至少对应一个用户群;

分类单元33,用于在得到每一个所述用户的概率值时,根据所述概率值的
大小,将所述至少两个不同用户划分至所述设定业务场景的用户群中。

在本申请的另一个实施例中,所述确定单元32根据所述至少两个不同用
户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属
于所述设定业务场景的其中一个用户群的概率值,包括:

根据所述至少两个不同用户的用户信息和基于设定业务场景的有序多分
类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个
用户群的概率值。

在本申请的另一个实施例中,所述确定单元32根据所述至少两个不同用
户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属
于所述设定业务场景的其中一个用户群的概率值,包括:

根据所述至少两个不同用户的用户信息和基于设定业务场景的无序多分
类逻辑回归算法,确定得到每一个所述用户属于所述设定业务场景的其中一个
用户群的概率值。

在本申请的另一个实施例中,所述确定单元32根据所述至少两个不同用
户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属
于设定业务场景的其中一个用户群的概率值,包括:

针对所述至少两个不同用户中每一个用户,分别执行以下操作:

根据所述用户的用户信息和基于设定业务场景的有序多分类逻辑回归算
法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第一概率
值;

根据所述用户的用户信息和基于设定业务场景的无序多分类逻辑回归算
法,确定得到所述用户属于所述设定业务场景的其中一个用户群的第二概率
值;

比较所述第一概率值与所述第二概率值的大小,将其中概率值较大的作为
所述用户属于所述设定业务场景的其中一个用户群的概率值。

在本申请的另一个实施例中,所述分类单元33根据所述概率值的大小,
将所述至少两个不同用户划分至所述设定业务场景的用户群中,包括:

将得到的每一个所述用户的概率值进行排序;

根据所述设定业务场景所划分用户群的个数,将所述至少两个不同用户进
行划分,得到所述设定业务场景的用户群中包含的用户。

需要说明的是,本申请实施例提供的分类设备可以通过软件方式实现,也
可以通过硬件方式实现,这里不做限定。本申请实施例提供的分类设备在确定
用户所属的用户群时,基于多分类模型,利用比较全面的用户信息,进而能够
计算得到一个相对准确的确定用户属于哪一个用户群的概率值,有效改善了现
有技术中使用二分类逻辑回归导致用户群分类存在不准确的问题,提高用户群
分类的精确度,为后续能够精确地确定用户的信用度奠定基础,同时也能够降
低后续信用消费市场的消费风险。

图4为本申请实施例提供的一种用户群的分类设备的结构示意图。所述分
类设备包括:获取单元41、确定单元42和分类单元43,其中:

获取单元41,用于获取在设定业务场景下待处理的用户产生的用户信息,
其中,所述用户信息中包含所述用户的基本信息、所述用户的信用信息、所述
用户的社会化关系信息、所述用户的行为偏好信息中的至少一种或者多种;

确定单元42,用于根据所述用户的用户信息和基于设定业务场景的多分类
模型,确定得到所述用户属于所述设定业务场景的其中一个用户群的概率值;

分类单元43,用于将所述概率值与所述设定业务场景中包含的不同用户群
对应的设定阈值进行比较,确定所述用户所属所述设定业务场景的用户群。

本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)、
或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、
或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其
中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储
器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品
的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或
方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的
结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机
或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他
可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或
多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设
备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中
的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个
流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使
得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处
理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个
流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基
本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要
求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申
请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及
其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

一种用户群的分类方法和设备.pdf_第1页
第1页 / 共15页
一种用户群的分类方法和设备.pdf_第2页
第2页 / 共15页
一种用户群的分类方法和设备.pdf_第3页
第3页 / 共15页
点击查看更多>>
资源描述

《一种用户群的分类方法和设备.pdf》由会员分享,可在线阅读,更多相关《一种用户群的分类方法和设备.pdf(15页珍藏版)》请在专利查询网上搜索。

本申请公开了一种用户群的分类方法和设备,包括:获取至少两个不同用户的用户信息,所述用户信息包含所述用户的基本信息、所述用户的信用信息、所述用户的社会化关系信息、所述用户的行为偏好信息中的一种或者多种;根据所述至少两个不同用户的用户信息和基于设定业务场景的多分类模型,确定得到每一个所述用户属于所述设定业务场景的其中一个用户群的概率值,所述设定业务场景至少对应一个用户群;在得到每一个所述用户的概率值时。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1