实战:航空公司客户价值分析

来源:互联网 发布:软件开发项目简介 编辑:程序博客网 时间:2024/05/01 01:06

一、 背景与挖掘目标

试图实现以下目标:

(1)借助航空公司数据,对客户进行分类。

(2)对不同类别的客户进行特征分析,比较不同类别客户的价值分析。

(3)对不同价值的客户类别进行个性化服务,制定相应的营销策略。

二、分析方法

使用 LRMFC模型来进行分析

L:


三、数据探索

注意观察describe()函数参数变化。

(1)



(2)





导出后的Excel文件如下:


四、数据预处理

1、数据清洗

由数据探索分析可知,数据中存在缺失值,存在票价最小值为0、平均折扣率为0但飞行公里数却大于0的记录。由于这些记录的数量不多,所以对其进行丢失处理。

PS:在Excel中对SUM_YR_1SUM_YR_2筛选掉空白值时,SUM_YR_2有太多值,筛选只能显示前10000个值,所以只能通过自定义筛选的方法来去除空白值。


2、属性规约

根据LRFMC模型,选择与该模型相关的6个属性:FFP_DATE、LOAD_TIME、FLIGHT_COUNT、avg_discount、SEG_KM_SUM、LAST_TO_END


结果如下:



3、数据变换

 数据变换是将数据转换成“适当的”形式,以适应挖掘任务和算法的要求。本案例中采用的数据变换方式是属性构造和数据标准化。

由于数据中并没有直接给出LRFMC5个指标,需要通过属性构造来提取这5个指标。具体的计算方式如下:

(1)L=LOAD_TIME-FFP_DATE

(2)R=LAST_TO_END

(3)F=FLIGHT_COUNT

(4)M=SEG_KM_SUM

(5)C=avg_discount


代码如下:


数据提取后,其数据取值范围如下:





原创粉丝点击