KNIMI数据挖掘建模与分析系列_002_利用KNIMI做商超零售关联推荐

利用KNIMI做商超零售关联推荐

老帅

20150801

http://blog.csdn.net/shuaihj

一、测试数据

            

需要测试数据,请留下邮箱

 二、训练关联推荐规则

1.读取销售记录(sales.table)

2.训练关联规则(得到前后项)

设置最小项集属性

3.过滤不关心列

只保留“后项”和“前项”两列

4.列重命名更可读

5.数据流

6.训练结果

三、聚合后项信息

1.读取商品信息(items.table)

2.聚合后项详细信息

设置聚合方式和关键字段

3.数据流

4.聚合结果

四、聚合前项信息

1.复制行ID(为合项提供依据)

给复制列取个新名字

 

复制结果:

2.拆前项

拆分结果

3.聚合前项详细信息

设置聚合方式和关键字段

4.列重命名更可读

5.合并后项

设置合并依据关键字段

设置合并后,”前项名称”组合在一起

6.合并结果



7.数据流

时间: 2024-10-23 09:28:19

KNIMI数据挖掘建模与分析系列_002_利用KNIMI做商超零售关联推荐的相关文章

KNIMI数据挖掘建模与分析系列_001_利用KNIMI做演员关系网络分析

利用KNIMI做演员关系网络分析 老帅 20150407 一.测试数据                二.演员社会关系网络可视化 1.读入"演员社会关系.csv" 读取列标题 2.识别社会关系网络节点 一个关系是由两个节点组成的,设置关系的第一个节点和第二个节点 3.可视化社会关系网络 4.数据流 5.可视化结果 三.附加节点属性分析社会关系 1.读入"02演员基本信息.csv" 读取列标题 2.匹配演员基本信息 设置匹配依据的"节点ID"列 3

KNIMI数据挖掘建模与分析系列_004_利用KNIMI做客户流失预测

利用KNIMI做客户流失预测 老帅 20150801 http://blog.csdn.net/shuaihj 一.测试数据 中国移动客服数据 需要测试数据,请留下邮箱 二.统计已流失客户 1.读取移动客服数据(客户流失.xlsx) 2.统计已流失客户 参数设置 统计结果 3.数据流 三.贝叶斯预测客户流失 1.字符类型转换 将"流失"列转换为字符串类型 2.划分训练集和测试集 取30%作为训练数据,剩余70%作为测试数据,我们将预测这70%客户的流失率: 设置"流失&quo

KNIMI数据挖掘建模与分析系列_003_利用KNIMI做客户细分

利用KNIMI做客户细分 老帅 20150801 http://blog.csdn.net/shuaihj 一.测试数据              需要测试数据,请留下邮箱  二.计算消费金额和消费次数 1.读入(销售数据.csv) 读取列标题 2. 时间格式转换 按指定时间格式识别"订单创建日期"列 3.对金额分组加和 依据客户编号对"销售金额"加和   4.字段重命名更可读 统计结果 5. 对订单分组计数 依据客户编号对"销售订单编号"进行去

利用wordpress做淘宝推广之推荐插件

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 对于一个WP博客而言,有些插件是必须安装的,但是安装太多的插件,会相应地消耗服务器的宝贵资源,那么我们使用WP博客系统的站长该如何恰到好处地选取和使用插件呢?下面用旺旺馆的插件来举几个例子吧. 1.seo类插件 旺旺个人建议,还是安装一个插件比较好,有些朋友主张手工写,但是对于时间就是金钱来说,安装一个这样插件有助于提高网站的更新速度.那么这

《数据挖掘:实用案例分析》——3.2 数据挖掘建模过程

3.2 数据挖掘建模过程 广州TipDM团队在多年的数据挖掘项目实施过程中,积累了一套行之有效的数据挖掘方法论,数据挖掘建模过程如图3-2所示. 3.2.1 定义挖掘目标 针对具体的数据挖掘应用需求,首先要非常清楚:本次的挖掘目标是什么?系统完成后能达到什么样的效果?因此我们必须分析应用领域,包括应用中的各种知识和应用目标.了解相关领域的有关情况,熟悉背景知识,弄清用户需求.要想充分发挥数据挖掘的价值,必须要对目标有一个清晰明确的定义,即决定到底想干什么.否则,很难得到正确的结果. 3.2.2

《数据挖掘:实用案例分析》——第3章 数据挖掘建模 3.1 数据挖掘的过程

第3章 数据挖掘建模 数据挖掘是从海量数据中提取隐含在其中的有用信息和知识的过程.各运营支撑系统所积累的海量历史数据是企业的一笔宝贵财富,谁能正确地挖掘与分析隐含在数据中的信息,谁就能更好地向用户提供产品与服务,从而在竞争中脱颖而出. 3.1 数据挖掘的过程 数据挖掘提供了从数据到价值的解决方案: 数据+工具+方法+目标+行动=价值 目前,数据挖掘已有一系列应用:分类分析.聚类分析.预测分析.偏差分析.关联分析和时序模式等,这些应用涉及的技术和工具各不相同,然而却可以依据统一的方法论来实行,并可

《Hadoop大数据分析与挖掘实战》——1.4节数据挖掘建模过程

1.4 数据挖掘建模过程从本节开始,将以餐饮行业的数据挖掘应用为例来详细介绍数据挖掘的建模过程,如图1-1所示. 1.4.1 定义挖掘目标针对具体的数据挖掘应用需求,首先要明确本次的挖掘目标是什么?系统完成后能达到什么样的效果?因此必须分析应用领域,包括应用中的各种知识和应用目标,了解相关领域的有关情况,熟悉背景知识,弄清用户需求.要想充分发挥数据挖掘的价值,必须要对目标有一个清晰明确的定义,即决定到底想干什么. 针对餐饮行业的数据挖掘应用,可定义如下挖掘目标:实现动态菜品智能推荐,帮助顾客快速

破解索尼PS4系列:利用网页漏洞实现相关的ROP攻击(一)

本文讲的是破解索尼PS4系列:利用网页漏洞实现相关的ROP攻击(一), 目前关于PS4的黑客攻击还非常的少,但这并不能说明PS4 系统非常安全,黑客不会对其发动攻击.本文的目的就是找出PS4的一系列漏洞,最终来获得PS4的内核执行代码. PlayStation 4(简称PS4),是索尼电脑娱乐公司(SCE)推出的家用游戏机.是PlayStation游戏机系列的第四代游戏主机.PlayStation 4采用以AMD为基础的x86-64架构处理器(8核) 除了有一个记录良好的架构处理器,PS4中使用

dubbo源码分析系列(3)服务的引用

1 系列目录 dubbo源码分析系列(1)扩展机制的实现 dubbo源码分析系列(2)服务的发布 dubbo源码分析系列(3)服务的引用 dubbo源码分析系列(4)dubbo通信设计 2 服务引用案例介绍 先看一个简单的客户端引用服务的例子,dubbo配置如下: <dubbo:application name="consumer-of-helloService" /> <dubbo:registry protocol="zookeeper" ad