一种用于药店会员分析的H‑RFM用户建模方法及系统.pdf

上传人:Y94****206 文档编号:1286918 上传时间:2018-04-12 格式:PDF 页数:10 大小:660.92KB
返回 下载 相关 举报
摘要
申请专利号:

CN201610915845.2

申请日:

2016.10.20

公开号:

CN106503438A

公开日:

2017.03.15

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 19/00申请日:20161020|||公开

IPC分类号:

G06F19/00(2011.01)I; G06Q30/02(2012.01)I

主分类号:

G06F19/00

申请人:

上海科瓴医疗科技有限公司

发明人:

蒋超; 张红广; 冯褚; 杨友仁; 袁伟成; 徐志刚; 刘凯; 王梯; 陈琦

地址:

200433 上海市杨浦区政府路18号906室

优先权:

专利代理机构:

上海宏京知识产权代理事务所(普通合伙) 31297

代理人:

赵朋晓

PDF下载: PDF下载
内容摘要

本发明公开了一种用于药店会员分析的H‑RFM用户建模方法,采用基于健康水平H、消费近度R、消费频度F和消费额度M的K均值K‑means聚类方法进行聚类,并计算每个聚类会员的加权平均HRFM得分用来确定它们的会员终身价值CLV大小顺序,以实现会员分类。此外,本发明还公开了一种用于药店会员分析的H‑RFM用户建模系统,包括数据清洗模块、特征提取模块、加权处理模块、聚类分析模块以及类型定义模块。本发明利用大数据分析做用户建模,对会员进行精细化分类和分析,从而实现精准而高效的会员管理。

权利要求书

1.一种用于药店会员分析的H-RFM用户建模方法,其特征在于,采用基于健康水平H、消
费近度R、消费频度F和消费额度M的K均值K-means聚类方法进行聚类,并计算每个聚类会员
的加权平均HRFM得分用来确定它们的会员终身价值CLV大小顺序,以实现会员分类。
2.如权利要求1所述的方法,其特征在于,该方法具体包括如下步骤:
第一步,数据清洗:针对购药记录的特点,以天为单位整合每个会员的购药信息,把同
一天购药信息整合并作为单次购药信息,删除干扰信息;
第二步,特征提取:提取会员的健康水平H、消费近度R、消费频度F和消费额度M特征;所
述消费近度R是会员最近一次购药时间距当前研究时间的天数或该研究时间段内的持续购
药天数;所述消费频度F是会员在研究时间段内总的购药次数;所述消费额度M是会员在研
究时间段的购药单价或购药总费用;
第三步,加权处理:初步确定HRFM四者权重的初步比例关系;对特征进行两两比较得到
相应的评价矩阵,并进行相应的调整以使其通过一致性检验;利用层次分析法求得HRFM四
个特征的权重;
第四步,聚类分析:利用K-means聚类算法对加权后的HRFM作聚类分析;
第五步,类型定义:对每类会员标准化后的HRFM取平均,将平均值加权求和,得到相应
的加权后的会员终身价值CLV得分,并在此基础上确定每类会员的终身价值大小排序;将每
类会员的HRFM平均值和全部会员的HRFM平均值比较,得到每类会员的HRFM的变动情况用来
分析该会员类别的性质,并结合每类会员的终身价值大小排序和药店自身的运营经验定义
会员类型。
3.如权利要求2所述的方法,其特征在于,第一步中,所述干扰信息包括:有退药记录的
会员;单次购药金额很小的记录;单次消费金额最大的5%的会员的记录或者单次消费金额
在一定金额以上的会员的记录;数据重复记录。
4.如权利要求2所述的方法,其特征在于,第二步中,所述健康水平H是会员的BMI值、血
压级别和血糖级别的加权和,其计算如公式(1)所示:
H=LevelBMI*WBMI+LevelBP*WBP+LevelBS*WBS (1)
其中,LevelBMI、LevelBP和LevelBS分别是BMI值、血压值和血糖值在系统中定义的级别,
WBMI、WBP和WBS是BMI值、血压值和血糖值的相应权重。
5.如权利要求2所述的方法,其特征在于,第二步中,对提取的所述健康水平H、消费近
度R、消费频度F和消费额度M特征进行标准化处理。
6.如权利要求5所述的方法,其特征在于,所述标准化处理采用每个特征的标准分数来
代替原来相应特征的具体值。
7.如权利要求2所述的方法,其特征在于,第四步中,所述K-means聚类算法,包括如下
步骤:
步骤1:随机选取K个点作为K个聚类的初始中心点;
步骤2:将每个样本分配给与其距离最近的聚类;
步骤3:更新每个聚类的中心点位置;
步骤4:满足终止条件则终止,否则回到步骤2;终止条件可以设置为每个聚类中心点位
置几乎不变动,即小于设定的阈值。
8.如权利要求2所述的方法,其特征在于,第五步中,所述将平均值加权求和,按照公式
(2)加权求和:
CLVscore=NH*WH+NR*WR+NF*WF+NM*WM (2)
其中,NH、NR、NF和NM分别代表标准化后的H、R、F、M值,WH、WR、WF和WM是对应的权重。
9.一种采用如权利要求1-8任一项所述方法实现的用于药店会员分析的H-RFM用户建
模系统,其特征在于,包括数据清洗模块、特征提取模块、加权处理模块、聚类分析模块以及
类型定义模块;
所述数据清洗模块用于整合每个会员每天购药信息作为单次购药信息,并删除干扰信
息;
所述特征提取模块用于提取会员的健康水平H、消费近度R、消费频度F和消费额度M特
征;所述消费近度R是会员最近一次购药时间距当前研究时间的天数或该研究时间段内的
持续购药天数;所述消费频度F是会员在研究时间段内总的购药次数;所述消费额度M是会
员在研究时间段的购药单价或购药总费用;
所述加权处理模块用于确定初步确定健康水平H、消费近度R、消费频度F和消费额度M
四个特征的权重;
所述聚类分析模块用于利用K-means聚类算法对加权后的HRFM作聚类分析;
所述类型定义模块用于计算每个聚类会员的加权平均HRFM得分用来确定其会员终身
价值CLV大小顺序,以实现会员分类。

说明书

一种用于药店会员分析的H-RFM用户建模方法及系统

技术领域

本发明涉及医疗健康数据分析与挖掘领域,具体涉及一种用于药店会员分析的H-
RFM用户建模方法;此外,本发明还涉及一种用于药店会员分析的H-RFM用户建模系统。

背景技术

会员是连锁药店最核心的资源,药店通过多年积累下来的会员资料“堆积如山”,
然而真正识得数据价值的药店却少之又少。一些药店管理者对数据的认识还停留在会员档
案、销售额等层次,对数据的深入挖掘、全面利用意识尚未形成。大部分药店对会员管理采
取的还是“胡子眉毛一把抓”的粗放式管理方法,在实际情况中体现在“会员日送鸡蛋”和
“群发短信”等活动上。“会员日送鸡蛋”等活动刺激了会员的短期冲动消费,但是会降低药
店在会员心中的品牌价值,“群发短信”则会招致非合适受众的反感。这些粗放的会员管理
方法从长远来看都会导致会员流失,所以并不可取。

实际上,会员管理中存在所谓的“二八定律”,即百分之二十的会员贡献了百分之
八十的利润。因此利用大数据分析做用户建模,对会员进行精细化分类,从而实现精准而高
效的会员管理。本发明将提出一种用于药店会员管理的大数据用户建模方法。

发明内容

本发明要解决的技术问题在于提供一种用于药店会员分析的H-RFM用户建模方
法,克服了现有技术的上述缺陷,利用大数据分析做用户建模,对会员进行精细化分类和分
析,从而实现精准而高效的会员管理。为此,本发明还提供一种用于药店会员分析的H-RFM
用户建模系统。

零售数据中有三个神奇的要素,这三个要素构成了数据分析最好的指标:最近一
次消费(Recency,简称R)、消费频率(Frequency,简称F)、消费金额(Monetary,简称M)。最近
一次消费R意指上一次购买的时间,消费频率F是顾客在限定期内购买的次数,消费金额M是
顾客在限定期内购买的金额或平均客单价。而在药店这样一个健康场景下,有别于其它零
售行业的特点是会员的健康(Health,简称H)水平,因为从会员的角度来看,购买药品的目
的是为了改善健康。健康水平H是依据药店会员的健康数据得到的一个量化指标,用于定量
的描述会员的健康状况,可以是单个的健康指标也可以是多个健康指标的加权和。

基于药店的购药记录大数据和会员的健康大数据构建用户模型,本发明从以上四
个维度健康水平H,最近一次消费R,消费频率F,消费金额M完整地显示一个药店会员的轮
廓,提供一种用于药店会员分析的H-RFM用户建模方法,这为个性化的沟通和服务提供了依
据。同时,随着时间的发展和数据的积累,四项指标能够越来越精确地判断该会员的长期价
值(甚至是终身价值)。所以,对于连锁药店来说,大数据用户建模是一个不断成长、贴近会
员真实价值,并不断助力会员管理的过程。

为解决上述技术问题,本发明提供一种用于药店会员分析的H-RFM用户建模方法,
采用基于健康水平H、消费近度R、消费频度F和消费额度M的K均值K-means聚类方法进行聚
类,并计算每个聚类会员的加权平均HRFM得分用来确定它们的会员终身价值CLV大小顺序,
以实现会员分类。

作为本发明优选的技术方案,该方法具体包括如下步骤:

第一步,数据清洗:针对购药记录的特点,以天为单位整合每个会员的购药信息,
把同一天购药信息整合并作为单次购药信息,删除干扰信息;

第二步,特征提取:提取会员的健康水平H、消费近度R、消费频度F和消费额度M特
征;所述消费近度R是会员最近一次购药时间距当前研究时间的天数或该研究时间段内的
持续购药天数;所述消费频度F是会员在研究时间段内总的购药次数;所述消费额度M是会
员在研究时间段的购药单价或购药总费用;

第三步,加权处理:初步确定HRFM四者权重的初步比例关系;对特征进行两两比较
得到相应的评价矩阵,并进行相应的调整以使其通过一致性检验;利用层次分析法求得
HRFM四个特征的权重;

第四步,聚类分析:利用K-means聚类算法对加权后的HRFM作聚类分析;

第五步,类型定义:对每类会员标准化后的HRFM取平均,将平均值加权求和,得到
相应的加权后的会员终身价值CLV得分,并在此基础上确定每类会员的终身价值大小排序;
将每类会员的HRFM平均值和全部会员的HRFM平均值比较,得到每类会员的HRFM的变动情况
用来分析该会员类别的性质,并结合每类会员的终身价值大小排序和药店自身的运营经验
定义会员类型。

作为本发明优选的技术方案,第一步中,所述干扰信息包括:有退药记录的会员;
单次购药金额很小的记录;单次消费金额最大的5%的会员的记录或者单次消费金额在一
定金额以上的会员的记录;数据重复记录。

作为本发明优选的技术方案,第二步中,所述健康水平H是会员的BMI值、血压级别
和血糖级别的加权和,其计算如公式(1)所示:

H=LevelBMI*WBMI+LevelBP*WBP+LevelBS*WBS (1)

其中,LevelBMI、LevelBP和LevelBS分别是BMI值、血压值和血糖值在系统中定义的
级别,WBMI、WBP和WBS是BMI值、血压值和血糖值的相应权重。

作为本发明优选的技术方案,第二步中,对提取的所述健康水平H、消费近度R、消
费频度F和消费额度M特征进行标准化处理。所述标准化处理可以采用每个特征的标准分数
来代替原来相应特征的具体值。

作为本发明优选的技术方案,第四步中,所述K-means聚类算法,包括如下步骤:

步骤1:随机选取K个点作为K个聚类的初始中心点;

步骤2:将每个样本分配给与其距离最近的聚类;

步骤3:更新每个聚类的中心点位置;

步骤4:满足终止条件则终止,否则回到步骤2;终止条件可以设置为每个聚类中心
点位置几乎不变动,即小于设定的阈值。

作为本发明优选的技术方案,第五步中,所述将平均值加权求和,按照公式(2)加
权求和:

CLVscore=NH*WH+NR*WR+NF*WF+NM*WM (2)

其中,NH、NR、NF和NM分别代表标准化后的H、R、F、M值,WH、WR、WF和WM是对应的权重。

此外,本发明还提供一种实现上述方法的用于药店会员分析的H-RFM用户建模系
统,包括数据清洗模块、特征提取模块、加权处理模块、聚类分析模块以及类型定义模块;

所述数据清洗模块用于整合每个会员每天购药信息作为单次购药信息,并删除干
扰信息;

所述特征提取模块用于提取会员的健康水平H、消费近度R、消费频度F和消费额度
M特征;所述消费近度R是会员最近一次购药时间距当前研究时间的天数或该研究时间段内
的持续购药天数;所述消费频度F是会员在研究时间段内总的购药次数;所述消费额度M是
会员在研究时间段的购药单价或购药总费用;

所述加权处理模块用于确定初步确定健康水平H、消费近度R、消费频度F和消费额
度M四个特征的权重;

所述聚类分析模块用于利用K-means聚类算法对加权后的HRFM作聚类分析;

所述类型定义模块用于计算每个聚类会员的加权平均HRFM得分用来确定其会员
终身价值CLV大小顺序,以实现会员分类。

根据以上提供的技术方案,与现有技术相比,本发明具有以下有益效果:

1、本发明将RFM模型引入药店行业,并根据药店行业的特点引入会员的健康水平
H,帮助药店进行更加精确的会员分析;

2、本发明考虑H-RFM四个指标的权重,帮助药店进行更加个性化的会员分析;

3、本发明运用加权处理以及聚类分析方法来分析会员类别的性质,并在此基础上
定义会员类型,经过多次实验分析,得到了健康水平H以及会员终身价值CLV的经验公式,有
利于更合理地、更准确地对会员进行精细化分类。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1是本发明的整体流程图及系统模块图。

图2是本发明中K-means聚类算法流程图。

具体实施方式

现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以
示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。

本发明一种用于药店会员分析的H-RFM用户建模方法,采用基于健康水平H
(Health)、消费近度R(Recency)、消费频度F(Frequency)和消费额度M(Monetary)的K均值
K-means聚类方法进行聚类,并计算每个聚类会员的加权平均HRFM得分用来确定它们的会
员终身价值CLV(Customer Lifetime Value)大小顺序,以实现会员分类。该方法的整体流
程如图1所示,具体实现步骤如下:

1)数据清洗

针对购药记录的特点,以天为单位整合每个会员的购药信息,把同一天购药信息
整合并作为单次购药信息;删除有退药记录的会员;删除单次购药金额很小的记录;删除单
次消费金额最大的5%的会员的记录或者删除单次消费金额在一定金额以上的会员的记录
(这两种情况一般为团体性而非个人购药行为,此删除处理,主要是想把团体性购药行为与
个人购药行为分开讨论,团体性购药主要表现就是单次购药金额很大),如发现有数据重复
问题,去除重复记录仅保留一条记录即可。

2)特征提取

从会员基本信息表、血压测量表和血糖测量表中分别提取会员的最新BMI值(体质
指数BMI=体重(kg)÷身高2(m))、血压级别和血糖级别。

本发明中BMI、血压和血糖分级标准,分别如表1、2和3所示。

表1 BMI分级标准

BMI分级

偏瘦-1
<18.5
正常-0
18.5-23.9
偏胖-1
24-27.9
肥胖-2
>28

表2 血压分级标准


表3 血糖分级标准


H(Health)代表会员(顾客)健康水平,可以是单个的健康指标也可以是多个健康
指标的加权和,在本方法中,H是会员的BMI值、血压级别和血糖级别的加权和,如公式(1)所
示。

H=LevelBMI*WBMI+LevelBP*WBP+LevelBS*WBS (1)

其中,LevelBMI、LevelBP和LevelBS分别是BMI值、血压值(BP)和血糖值(BS)在系统
中定义的级别,WBMI、WBP和WBS是相应的BMI值、血压值和血糖值的权重。

比如可以将BMI值、血压值和血糖值的权重比例关系确定为2:4:4,那么一个偏胖、
二级高血压但血糖正常的会员,他或她的H指标值就是14。

H=1*2+3*4+0*4=14

R(Recency)是会员(顾客)最近一次购药时间距当前研究时间的天数或该研究时
间段内的持续购药天数。F(Frequency)是会员(顾客)在研究时间段内总的购药次数。M
(Monetary)是会员(顾客)在研究时间段的购药单价或购药总费用。由于不同特征的量纲不
同,需要进行标准化处理,比如可以用每个特征的标准分数standard score来代替原来相
应特征的具体值。

标准分数(standard score)也叫z分数(z-score),是一个分数与平均数的差再除
以标准差的过程。用公式表示为:

z=(x-μ)/σ。其中x为某一具体分数,

μ为平均数,σ为标准差。

3)加权处理

考虑到药店对HRFM各类特征的重视程度可能不同,因此可以对这四个不同特征赋
予相应的权重。在本方法中,采用专家咨询的方式,结合药店运营一线的调研反馈,初步确
定HRFM四者权重的初步比例关系。比如对于某家药店,它所采用的HRFM的权重比例关系为
2:3:3:2。如果需要调整权值,可以对特征进行两两比较得到相应的评价矩阵,并进行相应
的调整以使其通过一致性检验,然后利用层次分析法求得HRFM四个特征的权重。假设某家
药店所采用的HRFM评价矩阵如表4所示,该表对应的一致性比例为0.055,小于0.1表明该矩
阵的一致性可以接受,计算得到HRFM各指标相对权重为(0.232,0.402,0.061,0.305)。

表4 示例评价矩阵


H
R
F
M
H
1
1/3
5
1
R
3
1
5
1
F
1/5
1/5
1
1/5
M
1
1
5
1

4)聚类分析

利用K-means聚类算法对加权后的HRFM作聚类分析。在本方法中,依据药店运营的
经验和建议,来确定聚类的数目K值。

K-means是非常经典的聚类算法,其主要计算过程如图2所示,包括如下步骤:

步骤1:随机选取K个点作为K个聚类的初始中心点;

步骤2:将每个样本分配给与其距离最近的聚类;

步骤3:更新每个聚类的中心点位置;

步骤4:满足终止条件则终止,否则回到步骤2;终止条件可以设置为每个聚类中心
点位置几乎不变动,即小于设定的阈值。

5)类型定义

对每类会员标准化后的HRFM取平均,将平均值按照公式(2)加权求和,得到相应的
加权后的CLV得分,并在此基础上确定每类会员的终身价值大小排序。

CLVscore=NH*WH+NR*WR+NF*WF+NM*WM (2)

其中,NH、NR、NF和NM分别代表标准化后的H、R、F、M值,WH、WR、WF和WM是对应的权重。

假设某家药店的HRFM对应的权重依次为0.2、-0.3、0.3和0.2,有两个会员聚类,它
们标准化后的HRFM平均值依次为(0.21,0.09,0.32,0.12)和(0.28,0.31,0.11,0.14)。前一
个会员聚类的加权CLV得分为0.135大于后一个会员聚类的0.024,所以前一个会员聚类的
会员终身价值CLVscore1大于后一个会员的CLVscore2。具体计算过程如下:

CLVscore1=0.21*0.2-0.09*0.3+0.32*0.3+0.12*0.2=0.135

CLVscore2=0.28*0.2-0.31*0.3+0.11*0.3+0.14*0.2=0.024

将每类会员的HRFM平均值和全部会员的HRFM平均值比较,得到每类会员的HRFM的
变动情况用来分析该会员类别的性质,并结合每类会员的终身价值大小排序和药店自身的
运营经验定义会员类型。例如某家药店的重要挽留型会员的典型特征是R很大明显高于平
均水平表明距上次购药有很长的一段时间了,M很大远高于平均水平或H明显高于平均水
平。该家药店全部会员的HRFM平均值依次为2.31、93.71、7.97和46.61,其中一个会员聚类
的HRFM平均值依次为3.28、145.11、2.26和151.11。它的R值明显大于全部会员的平均水平,
有近5个月没有来过药店,但它的M值是全部会员的平均水平的3倍多,可以将此类会员定义
为重要挽留会员。

如图1所示,本发明一种用于药店会员分析的H-RFM用户建模系统,包括数据清洗
模块、特征提取模块、加权处理模块、聚类分析模块以及类型定义;

所述数据清洗模块用于整合每个会员每天购药信息作为单次购药信息,并删除干
扰信息;

所述特征提取模块用于提取会员的健康水平H、消费近度R、消费频度F和消费额度
M特征;所述消费近度R是会员最近一次购药时间距当前研究时间的天数或该研究时间段内
的持续购药天数;所述消费频度F是会员在研究时间段内总的购药次数;所述消费额度M是
会员在研究时间段的购药单价或购药总费用;

所述加权处理模块用于确定初步确定健康水平H、消费近度R、消费频度F和消费额
度M四个特征的权重;

所述聚类分析模块用于利用K-means聚类算法对加权后的HRFM作聚类分析;

所述类型定义模块用于计算每个聚类会员的加权平均HRFM得分用来确定其会员
终身价值CLV大小顺序,以实现会员分类。

以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完
全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术
性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

一种用于药店会员分析的H‑RFM用户建模方法及系统.pdf_第1页
第1页 / 共10页
一种用于药店会员分析的H‑RFM用户建模方法及系统.pdf_第2页
第2页 / 共10页
一种用于药店会员分析的H‑RFM用户建模方法及系统.pdf_第3页
第3页 / 共10页
点击查看更多>>
资源描述

《一种用于药店会员分析的H‑RFM用户建模方法及系统.pdf》由会员分享,可在线阅读,更多相关《一种用于药店会员分析的H‑RFM用户建模方法及系统.pdf(10页珍藏版)》请在专利查询网上搜索。

本发明公开了一种用于药店会员分析的HRFM用户建模方法,采用基于健康水平H、消费近度R、消费频度F和消费额度M的K均值Kmeans聚类方法进行聚类,并计算每个聚类会员的加权平均HRFM得分用来确定它们的会员终身价值CLV大小顺序,以实现会员分类。此外,本发明还公开了一种用于药店会员分析的HRFM用户建模系统,包括数据清洗模块、特征提取模块、加权处理模块、聚类分析模块以及类型定义模块。本发明利用大数。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1