KNIMI数据挖掘建模与分析系列_003_利用KNIMI做客户细分

利用KNIMI做客户细分

老帅

20150801

http://blog.csdn.net/shuaihj

一、测试数据

            

需要测试数据,请留下邮箱

 二、计算消费金额和消费次数

1.读入(销售数据.csv)

读取列标题

2. 时间格式转换

按指定时间格式识别“订单创建日期”列

3.对金额分组加和

依据客户编号对”销售金额”加和

 

4.字段重命名更可读

统计结果

5. 对订单分组计数

依据客户编号对”销售订单编号”进行去重加和

6.字段重命名更可读

统计结果

7.连接查询客户的消费金额和消费次数

设置连接方式和关键列

8.统计结果

9.数据流

三、计算多少天没消费了

1.最近一次消费时间

依据客户编号对订单创建日期取最大值

2.多少天没消费了

计算客户最近一次消费,距离“2014年1月31日”有“多少天没消费了”

3.过滤无用字段

4.统计结果

5.数据流

四、根据销售数据对客户进行层次聚类计算

1.连接查询客户的消费信息

设置连接方式和关键列

查询结果

2.聚类计算前标准化

设置需要标准化的列和标准化算法

标准化结果

3.计算层次聚类

指定“距离函数”、“连接类型”以及参与聚类计算的列

分层聚类结果

4.去掉噪声数据(全局)

放大层次聚类图

选中噪声点并设置为噪声

在全局过滤噪声数据

查看被过滤掉的数据

5.数据流


四、根据销售数据对客户进行k-Means聚类计算

1.计算k-Means聚类

指定聚类参数及参与聚类计算的列

查看聚类结果

2.根据聚类结果指派数据

(也就是根据训练模型测试真实数据)

查看聚类结果

3.决策树训练

设置决策树参数

查看训练结果

4.数据流

时间: 2024-09-25 02:54:44

KNIMI数据挖掘建模与分析系列_003_利用KNIMI做客户细分的相关文章

KNIMI数据挖掘建模与分析系列_001_利用KNIMI做演员关系网络分析

利用KNIMI做演员关系网络分析 老帅 20150407 一.测试数据                二.演员社会关系网络可视化 1.读入"演员社会关系.csv" 读取列标题 2.识别社会关系网络节点 一个关系是由两个节点组成的,设置关系的第一个节点和第二个节点 3.可视化社会关系网络 4.数据流 5.可视化结果 三.附加节点属性分析社会关系 1.读入"02演员基本信息.csv" 读取列标题 2.匹配演员基本信息 设置匹配依据的"节点ID"列 3

KNIMI数据挖掘建模与分析系列_004_利用KNIMI做客户流失预测

利用KNIMI做客户流失预测 老帅 20150801 http://blog.csdn.net/shuaihj 一.测试数据 中国移动客服数据 需要测试数据,请留下邮箱 二.统计已流失客户 1.读取移动客服数据(客户流失.xlsx) 2.统计已流失客户 参数设置 统计结果 3.数据流 三.贝叶斯预测客户流失 1.字符类型转换 将"流失"列转换为字符串类型 2.划分训练集和测试集 取30%作为训练数据,剩余70%作为测试数据,我们将预测这70%客户的流失率: 设置"流失&quo

KNIMI数据挖掘建模与分析系列_002_利用KNIMI做商超零售关联推荐

利用KNIMI做商超零售关联推荐 老帅 20150801 http://blog.csdn.net/shuaihj 一.测试数据              需要测试数据,请留下邮箱  二.训练关联推荐规则 1.读取销售记录(sales.table) 2.训练关联规则(得到前后项) 设置最小项集属性 3.过滤不关心列 只保留"后项"和"前项"两列 4.列重命名更可读 5.数据流 6.训练结果 三.聚合后项信息 1.读取商品信息(items.table) 2.聚合后项详

《数据挖掘:实用案例分析》——3.2 数据挖掘建模过程

3.2 数据挖掘建模过程 广州TipDM团队在多年的数据挖掘项目实施过程中,积累了一套行之有效的数据挖掘方法论,数据挖掘建模过程如图3-2所示. 3.2.1 定义挖掘目标 针对具体的数据挖掘应用需求,首先要非常清楚:本次的挖掘目标是什么?系统完成后能达到什么样的效果?因此我们必须分析应用领域,包括应用中的各种知识和应用目标.了解相关领域的有关情况,熟悉背景知识,弄清用户需求.要想充分发挥数据挖掘的价值,必须要对目标有一个清晰明确的定义,即决定到底想干什么.否则,很难得到正确的结果. 3.2.2

《数据挖掘:实用案例分析》——第3章 数据挖掘建模 3.1 数据挖掘的过程

第3章 数据挖掘建模 数据挖掘是从海量数据中提取隐含在其中的有用信息和知识的过程.各运营支撑系统所积累的海量历史数据是企业的一笔宝贵财富,谁能正确地挖掘与分析隐含在数据中的信息,谁就能更好地向用户提供产品与服务,从而在竞争中脱颖而出. 3.1 数据挖掘的过程 数据挖掘提供了从数据到价值的解决方案: 数据+工具+方法+目标+行动=价值 目前,数据挖掘已有一系列应用:分类分析.聚类分析.预测分析.偏差分析.关联分析和时序模式等,这些应用涉及的技术和工具各不相同,然而却可以依据统一的方法论来实行,并可

《Hadoop大数据分析与挖掘实战》——1.4节数据挖掘建模过程

1.4 数据挖掘建模过程从本节开始,将以餐饮行业的数据挖掘应用为例来详细介绍数据挖掘的建模过程,如图1-1所示. 1.4.1 定义挖掘目标针对具体的数据挖掘应用需求,首先要明确本次的挖掘目标是什么?系统完成后能达到什么样的效果?因此必须分析应用领域,包括应用中的各种知识和应用目标,了解相关领域的有关情况,熟悉背景知识,弄清用户需求.要想充分发挥数据挖掘的价值,必须要对目标有一个清晰明确的定义,即决定到底想干什么. 针对餐饮行业的数据挖掘应用,可定义如下挖掘目标:实现动态菜品智能推荐,帮助顾客快速

数据挖掘应用案例:RFM模型分析与客户细分

这里,我先给各位朋友拜年,祝大家新春快乐!        兔年就要过去了,本命年的最后一天再不更新博客有点对不住大家!正好刚帮某电信行业完成一个数据挖掘工作,其中的RFM模型还是有一定代表性,就再把数据挖掘RFM模型的建模思路细节与大家分享一下吧!手机充值业务是一项主要电信业务形式,客户的充值行为记录正好满足RFM模型的交易数据要求.        根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:最近一次消费(Recen

破解索尼PS4系列:利用网页漏洞实现相关的ROP攻击(一)

本文讲的是破解索尼PS4系列:利用网页漏洞实现相关的ROP攻击(一), 目前关于PS4的黑客攻击还非常的少,但这并不能说明PS4 系统非常安全,黑客不会对其发动攻击.本文的目的就是找出PS4的一系列漏洞,最终来获得PS4的内核执行代码. PlayStation 4(简称PS4),是索尼电脑娱乐公司(SCE)推出的家用游戏机.是PlayStation游戏机系列的第四代游戏主机.PlayStation 4采用以AMD为基础的x86-64架构处理器(8核) 除了有一个记录良好的架构处理器,PS4中使用

dubbo源码分析系列(3)服务的引用

1 系列目录 dubbo源码分析系列(1)扩展机制的实现 dubbo源码分析系列(2)服务的发布 dubbo源码分析系列(3)服务的引用 dubbo源码分析系列(4)dubbo通信设计 2 服务引用案例介绍 先看一个简单的客户端引用服务的例子,dubbo配置如下: <dubbo:application name="consumer-of-helloService" /> <dubbo:registry protocol="zookeeper" ad