某电信公司客户RFM模型分析

       手机充值业务是一项主要电信业务形式,客户的充值行为记录正好满足RFM模型的交易数据要求。

       根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:最近一次消费(Recency)、消费频率(Frequency)、消费金额(Monetary)。

       RFM模型:R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M  (Monetary)表示客户在最近一段时间内购买的金额。一般原始数据为3个字段:客户ID、购买时间(日期格式)、购买金额,用数据挖掘软件处理,加权(考虑权重)得到RFM得分,进而可以进行客户细分,客户等级分类,Customer
Level Value得分排序等,实现数据库营销!

这里再次借用@数据挖掘与数据分析的RFM客户RFM分类图。

本次分析用的的软件工具:IBM SPSS Statistics 19,IBM SPSS Modeler14.1,Tableau,EXCEL和PPT

       因为RFM分析仅是项目的一个小部分分析,但也面临海量数据的处理能力,这一点对计算机的内存和硬盘容量都有要求。

       先说说对海量数据挖掘和数据处理的一点体会:(仅指个人电脑操作平台而言)

  • 一般我们拿到的数据都是压缩格式的文本文件,需要解压缩,都在G字节以上存储单位,一般最好在外置电源移动硬盘存储;如果客户不告知,你大概是不知道有多少记录和字段的;
  • Modeler挖掘软件默认安装一般都需要与C盘进行数据交换,至少需要100G空间预留,否则读取数据过程中将造成空间不足
  • 海量数据处理要有耐心,等待30分钟以上运行出结果是常有的现象,特别是在进行抽样、合并数据、数据重构、神经网络建模过程中,要有韧性,否则差一分钟中断就悲剧了,呵呵;
  • 数据挖掘的准备阶段和数据预处理时间占整个项目的70%,我这里说如果是超大数据集可能时间要占到90%以上。一方面是处理费时,一方面可能就只能这台电脑处理,不能几台电脑同时操作;
  • 多带来不同,这是我一直强调的体验。所以海量数据需要用到抽样技术,用来查看数据和预操作,记住:有时候即使样本数据正常,也可能全部数据有问题。建议数据分隔符采用“|”存储;
  • 如何强调一个数据挖掘项目和挖掘工程师对行业的理解和业务的洞察都不为过,好的数据挖掘一定是市场导向的,当然也需要IT人员与市场人员有好的沟通机制;
  • 数据挖掘会面临数据字典和语义层含义理解,在MetaData元数据管理和理解上下功夫会事半功倍,否则等数据重构完成发现问题又要推倒重来,悲剧;
  • 每次海量大数据挖掘工作时都是我上微博最多的时侯,它真的没我算的快,只好上微博等它,哈哈!

     传统RFM分析转换为电信业务RFM分析主要思考:

这里的RFM模型和进而细分客户仅是数据挖掘项目的一个小部分,假定我们拿到一个月的客户充值行为数据集(实际上有六个月的数据),我们们先用IBM
Modeler软件构建一个分析流:

数据结构完全满足RFM分析要求,一个月的数据就有3千万条交易记录!

我们先用挖掘工具的RFM模型的RFM汇总节点和RFM分析节点产生R(Recency)、F(Frequency)、M  (Monetary);

接着我们采用RFM分析节点就完成了RFM模型基础数据重构和整理;

    现在我们得到了RFM模型的Recency_Score、Frequency_Score、Monetary_Score和RFM_Score;这里对RFM得分进行了五等分切割,采用100、10、1加权得到RFM得分表明了125个RFM魔方块。

    传统的RFM模型到此也就完成了,但125个细分市场太多啦无法针对性营销也需要识别客户特征和行为,有必要进一步细分客户群;

       另外:RFM模型其实仅仅是一种数据处理方法,采用数据重构技术同样可以完成,只是这里固化了RFM模块更简单直接,但我们可以采用RFM构建数据的方式不为RFM也可用该模块进行数据重构。

        我们可以将得到的数据导入到Tableau软件进行描述性分析:(数据挖掘软件在描述性和制表输出方面非常弱智,哈哈)

我们也可以进行不同块的对比分析:均值分析、块类别分析等等

这时候我们就可以看出Tableau可视化工具的方便性

 
    

接下来,我们继续采用挖掘工具对R、F、M三个字段进行聚类分析,聚类分析主要采用:Kohonen、K-means和Two-step算法:

 
       

这时候我们要考虑是直接用R(Recency)、F(Frequency)、M  (Monetary)三个变量还是要进行变换,因为R、F、M三个字段的测量尺度不同最好对三个变量进行标准化,例如:Z得分(实际情况可以选择线性插值法,比较法,对标法等标准化)!另外一个考虑:就是R、F、M三个指标的权重该如何考虑,在现实营销中这三个指标重要性显然不同!

       有资料研究表明:对RFM各变量的指标权重问题,Hughes,Arthur认为RFM在衡量一个问题上的权重是一致的,因而并没有给予不同的划分。而Stone,Bob通过对信用卡的实证分析,认为各个指标的权重并不相同,应该给予频度最高,近度次之,值度最低的权重;

        这里我们采用加权方法:WR=2 WF=3 WM=5的简单加权法(实际情况需要专家或营销人员测定);具体选择哪种聚类方法和聚类数需要反复测试和评估,同时也要比较三种方法哪种方式更理想!

下图是采用快速聚类的结果:

以及kohonen神经算法的聚类结果:

接下来我们要识别聚类结果的意义和类分析:这里我们可以采用C5.0规则来识别不同聚类的特征:

其中Two-step两阶段聚类特征图:

采用评估分析节点对C5.0规则的模型识别能力进行判断:

 
    

结果还不错,我们可以分别选择三种聚类方法,或者选择一种更易解释的聚类结果,这里选择Kohonen的聚类结果将聚类字段写入数据集后,为方便我们将数据导入SPSS软件进行均值分析和输出到Excel软件!

 
     输出结果后将数据导入Excel,将R、F、M三个字段分类与该字段的均值进行比较,利用Excel软件的条件格式给出与均值比较的趋势!结合RFM模型魔方块的分类识别客户类型:通过RFM分析将客户群体划分成重要保持客户、重要发展客户、重要挽留客户、一般重要客户、一般客户、无价值客户等六个级别;(有可能某个级别不存在);

        另外一个考虑是针对R、F、M三个指标的标准化得分按聚类结果进行加权计算,然后进行综合得分排名,识别各个类别的客户价值水平;

至此如果我们通过对RFM模型分析和进行的客户细分满意的话,可能分析就此结束!如果我们还有客户背景资料信息库,可以将聚类结果和RFM得分作为自变量进行其他数据挖掘建模工作!

时间: 2024-11-19 01:33:03

某电信公司客户RFM模型分析的相关文章

数据挖掘应用案例:RFM模型分析与客户细分

这里,我先给各位朋友拜年,祝大家新春快乐!        兔年就要过去了,本命年的最后一天再不更新博客有点对不住大家!正好刚帮某电信行业完成一个数据挖掘工作,其中的RFM模型还是有一定代表性,就再把数据挖掘RFM模型的建模思路细节与大家分享一下吧!手机充值业务是一项主要电信业务形式,客户的充值行为记录正好满足RFM模型的交易数据要求.        根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:最近一次消费(Recen

RFM模型数据处理结果分析(回答网友的问题)

    玩家生命周期 早些时候,有位同行给了一个基于RFM的分析报告,但是不太明白上述用户中的3,4,5类为什么占比非常少,但是生命周期却非常长. 下面是我的一些观点(由于不清楚具体的产品,只知道大概的类别是社交游戏): 首先,使用了基于玩家充值的RFM分析,并把用户分成了8类,经过分析发现刚才上述的规律,那么我们具体来看. 3类用户:高充值.远期.高频率(用户量4.38%,生命周期15) 既然和充值相关那么我们就要考虑本身这类游戏的IB特点以及客群的特点,事实上,页游IB和社交游戏的IB有很多

用Excel利用RFM模型进行客户细分

背景: 一个会员服务的企业,有近1年约1200个会员客户的收银数据.由于公司想针对不同类别不活跃客户进行激活促销:同时,为回馈重点客户,也计划推出一系列针对重点客户的优惠活动,希望保留这些客户,维持其活跃度.因此希望利用该数据进行客户分类研究. 根据客户的需求,RFM模型相对简单并且直接,按照R(Recency-近度).F(Frequency-频度)和M(Monetary-额度)三个维度进行细分客户群体.由于该客户的数量较少(约1200个),所以,采用3x3x3=27个魔方(1200/27=44

RFM模型

RFM模型的內容 根據美國資料庫營銷研究所Arthur Hughes的研究,客戶資料庫中有三個神奇的要素,這三個要素構成了數據分析最好的指標: 最近一次消費(Recency) 消費頻率(Frequency) 消費金額(Monetary) 最近一次消費 最近一次消費意指上一次購買的時候--顧客上一次是幾時來店裡.上一次根據哪本郵購目錄購買東西.什麼時候買的車,或在你的超市買早餐最近的一次是什麼時候. 理論上,上一次消費時間越近的顧客應該是比較好的顧客,對提供即時的商品或是服務也最有可能會有反應.營

lda 文本挖掘-现在想用LDA主题模型分析文本内容,LDA主题模型怎么阅读每个topic下面的词汇

问题描述 现在想用LDA主题模型分析文本内容,LDA主题模型怎么阅读每个topic下面的词汇 现在想用LDA主题模型分析文本内容,LDA主题模型怎么阅读每个topic下面的词汇,每个主题会有一个概率值吗.

CUDA线程执行模型分析(二)大军未动粮草先行---GPU的革命

序:今天或许是比较不顺心的一天,从早上第一个电话,到下午的一些列的事情,有些许的失落.有的时候真的很想把工作和生活完全分开,但是谁又能真正的分得那么开,人非草木!很多的时候都想给人生下一些定义,添加一些注释.但是生活本来就是不需要添加注释的自解释的代码.用0来解释?还是用1来解释?0,天地之始,1,万物之源.谁又能说清楚,是先有0,还是先有1,他们本就是同体--要想成事,就应该拿得起,放得下.感叹人生的同时,人生的旅程是不会停止的--手下还有招来的那么多将士,都还等着啦! 正文:书接上回--<C

sql 报表设计-基于RFM客户分析的月报表设计

问题描述 基于RFM客户分析的月报表设计 设计合理的年度KPI指标: 按RFM进行客户细分: 将年度KPI分别按细分客户群.月份.和地区三个维度进行分解: 按三个维度和对应的KPI体系设计月报表: 生成两个月的月报表. 解决方案 https://www.baidu.com/link?url=WaEQiQ_4H0djI4W6uFEobCPjsRmV1NHYIZOUMh0yhj32X2GbKv-BtNyPmqKth4kqUZfb62ojq28PRA0Q8xw46K&wd=&eqid=e7aa5

PTN+OTN联合组网模型分析 下篇

组网模型的不同可以根据对网络安全性的要求.业务的种类.业务量的多少及投资环境等条件来选择.2011年湖北移动部分重要县市将演进为模型四的组网方式.随着业务对传输网容量和安全性要求不断提高及设备成本不断降低,模型五将会在未来业务承载得以应用.两种建网模型 如下分析.模型四:498)this.w idth=498;' onmousewheel = 'javascript:return big(this)' alt="PTN+OTN联合组网五大模型分析" border="0&quo

PTN+OTN联合组网模型分析 中篇

PTN/OTN各自技术特点,基本按照汇聚.接入层大量部署PTN满足各种业务接入需求,骨干层部署OTN用来完成PTN汇聚后的大颗粒业务调度的原则,能够联合组建出 五种组网模型,其各有优劣点.不同的模型可以根据对网络安全性的要求.业务的种类.业务量的多少及投资环境等条件来选择.联合组网模型中的二.三已经得到大量应用,如湖北移动在传输网建设中广泛采用了模型二和模型三的组网方式,两种建网模型 如下分析.模型二:498)this.w idth=498;' onmousewheel = 'javascrip