《大数据精准挖掘》电信行业应用--客户流失预测

来源:互联网 发布:t-sql语法基础知识 编辑:程序博客网 时间:2024/04/29 00:27

一、背景介绍

国内电信市场日趋饱和,企业竞争日趋激烈,获取新客户的成本远远高于留住现有客户的花费。

发展一位新客户的成本是留住老客户的6倍;客户加入时间越长,价值越高。

二、商业理解

用户:业务分析员+决策人员

客户流失可能性预测:对每一位客户流失倾向的大小进行预测。

流失原因:主要流失原因的预测和分析。

客户流失影响:预测、分析。

客户保留措施:根据客户不同的特点,差异化挽留措施。

三、数据理解

流失情况和之前一段时间的通话、短信、上网情况相关,数据可由电信公司数据库获得。

行为数据+个人信息

四、数据准备

用户计费信息数据集original_data,包含2011.4.1-2011.9.30的消费信息和未来三个月的流失信息,共99720条。

数据集中有825个流失者+98895个未流失者,保留所有的流失者和1/10的未流失者作为随机样本,加入全中变量weight。

数据字段:用户ID,是否流失用户,年龄,入网时间、产品名称、套餐品牌、计费时长、通话次数、开帐金额、短信条数、开帐欠费、上网流量、计费时长、上网金额

五、建立打分模型

设置建模的自变量、因变量和权重变量。

六、分析建模结果

八个变量进入模型,建模效果理想。

将客户按分数平均分成十组,第一组得分最低的9990人中,真正流失229人,占流失总人数(825)的27.8%,前六组流失人数占总流失人数高达90.5%。

结果显示,最近几个月的通话次数和开帐金额与未来4个月的流失有紧密关系。

七、结果运用

预测出较大流失可能性的客户后,评估保留客户后的收益和成本。高价值用户保留,低价值用户任其流失。

0 0