K-Means 聚类 客户价值分析

首先给大家推荐一下我老师大神的人工智能教学网站。教学不仅零基础,通俗易懂,而且非常风趣幽默,还时不时有内涵黄段子!点这里可以跳转到网站

1 背景与挖掘目标

1.1 背景1、航空公司业务竞争激烈,企业营销焦点从产品中心转为客户中心;2、针对不同类型客户,进行精准营销,实现利润最大化;3、建立合理的客户价值评估模型,进行客户分类,是解决问题的关键。1.2 挖掘目标1、借助航空公司客户数据,对客户进行分类;2、对不同的客户类别进行特征分析,比较不同类客户的客户价值;3、对不同价值的客户类别提供个性化服务,制定相应的营销策略。
2 分析方法与过程2.1 分析方法1、首先,明确目标是客户价值识别;2、识别客户价值,应用最广泛的客户细分模型是通过三个指标:最近消费时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetary);3、以上模型简称 RFM 模型,作用是:识别出高价值的客户。

  • 消费金额,一般表示一段时间内,消费的总额。但是,因为航空票价收到距离和舱位等级多种因素的影响,同样消费金额的旅客对航空公司价值不同。
  • 因此,需要修改指标。选定变量,舱位因素=舱位所对应的折扣系数的平均值=C,距离因素=一定时间内累积的飞行里程=M。
  • 再考虑到,航空公司的会员系统,用户的入会时间长短能在一定程度上影响客户价值,所以增加指标L=入会时间长度=客户关系长度
  • 总共确定了五个指标,最近消费时间间隔R,消费频率F,飞行里程 M和折扣系数的平均值C,客户关系长度L
  • 以上指标,作为航空公司识别客户价值指标,记为LRFMC模型

4、若采用传统RFM模型分析的属性分箱方法,如下图,它是依据,各属性的平均值进行划分。缺点是:细分客户群太多,精准营销成本太高。

5、综上,本案例以 LRFMC 五个指标为基础,采用聚类(K-Means)的方法,识别客户价值。6、本案例,总体流程如下图:

2.2 挖掘步骤1、从数据源进行数据抽取,选择性抽取与新增数据抽取,形成历史数据和增量数据;2、对步骤1的两个数据,进行数据探索性分析和预处理,主要有缺失值与异常值的分析处理,数据的属性规约、清洗和变换;3、利用步骤2处理后的数据作为建模数据,基于旅客价值的LRFMC模型进行客户分群,对各个客户群再进行特征分析,识别有价值客户;4、针对模型结果得到不同价值的客户,采用不同的营销手段,提供定制化的营销服务,或者针对性的优惠与关怀。(重点维护老客户)。2.3 数据抽取1、以2014-03-31为结束时间,选取宽度为两年的时间段(2012-4-1至2014-3-31),作为观测窗口,抽取观测窗口内所有客户的详细数据,形成历史数据;2、对于后续新增的客户信息,以新增数据中最新的时间点作为结束时间,形成新增数据。2.4 探索性分析1、探索性分析,主要对数据进行缺失值和异常值分析。2、发现,存在票价为空值,票价最小值为0、折扣率最小值为0、总飞行公里数大于0的记录。票价为空值,可能是不存在乘机记录。其他数据可能是,飞机票为0折扣或来自于积分兑换等;3、查找每列属性观测值中空值的个数、最大值、最小值,结果如下。

2.5 数据预处理1、数据清洗

  • 丢弃票价为空的记录;
  • 丢弃票价为0、平均折扣率不为0、总飞行公里数大于0的记录。

2、属性规约

  • 原始数据中属性太多,根据航空公司客户价值LRFMC模型,选择与模型相关的六个属性。
  • 删除不相关、弱相关或冗余属性,如会员卡号、性别等。
  • 与模型相关的六个属性分别是:FFP_DATE、LOAD_TIME、FLIGHT_COUNT、SEG_KM_SUM、LAST_TO_END、avg_discount

3、数据变换

  • 数据变换就是将数据转换成“适当”的格式,以适应挖掘任务及算法的需要;
  • 本例主要采用的数据变换方法是:属性构造和数据标准化;
  • LRFMC 5个指标需要通过原始数进行提取,计算方式如下:

L = LOAD_TIME – FFP_DATER = LAST_TO_ENDF = FLIGHT_COUNTM = SEG_KM_SUMC = avg_discount

  • 5个指标的取值范围差异较大,需进行标准化处理,消除数量级的影响;

2.6 模型构建模型的构建主要包括两部分:1、根据指标数据,对客户作聚类分群;2、结合业务对每个客户群进行特征分析,分析其客户价值,并对每个客户群进行排名。
1、客户聚类采用K-Means算法对客户数据进行客户分群,聚成五类(需结合业务的理解与分析来确定客户的类别数量)

绘制客户群特征雷达图:

2、客户价值分析针对“客户群特征分析图”所示的聚类结果,结合业务进行特征分析。我们重点关注的是L(户关系长度)、F(消费频率)、M(飞行里程)三个指标:

  • 客户群1(Customers 1)在C属性上最大,可定义为重要挽留客户;
  • 客户群2(Customers 2)在R属性上最大,在F、M属性上最小,可定义为低价值客户;
  • 客户群3(Customers 3)在F、M属性上最大,在R属性上最小,可定义为重要保持客户;
  • 客户群4(Customers 4)在L、C属性上最小,可定义为一般客户;
  • 客户群5(Customers 5)在L属性上最大,可定义为重要发展客户;

每种客户类别的特征如下:

  • 重要保持客户:C(平均折扣率较高、仓位等级较高)、F(乘坐次数)、M(里程)较高,R(最近乘坐航班)低。应将资源优先投放到这类客户身上,进行差异化管理,提高客户的忠诚度和满意度。
  • 重要发展客户:C较高,R、F、M较低。这类客户入会时长(L)短、当前价值低、发展潜力大,应促使客户增加在本公司和合作伙伴处的消费。
  • 重要挽留客户:C、F 或 M 较高,R较高 或 L变小,客户价值变化的不确定性高。应掌握客户最新信息、维持与客户的互动。
  • 一般和低价值客户:C、F、M、L低、R较高。这类客户可能在打折促销时才会选择消费。

3 模型应用1)会员升级与保级(积分削减等) 在会员升级或保级评价的时间点前,对接近但尚未达到要求的较高消费客户进行提醒或促销活动,提高客户满意度。2)首次兑换 对接近但尚未达到标准的会员进行提醒或促销活动,提高客户满意度。3)交叉销售 通过与非航空类企业的合作,使客户在其他消费过程中获得本公司积分,增强与公司联系,提高忠诚度。4 小结

  • 获取新客成本远大于维持老客,应努力维系客户关系水平,保持优质客户。
  • 差异化管理、精准营销,提高客户忠诚度、满意度,延长客户高水平消费。

点这里可以跳转到人工智能网站

发表评论