R语言数据挖掘2.1.2.1 关联规则

2.1.2.1 关联规则

关联分析可以从海量数据集中发现有意义的关系,这种关系可以表示成关联规则的形式或频繁项集的形式。具体的关联分析算法将在后面一个章节中给出。

关联规则挖掘旨在发现给定数据集(事务数据集或其他序列-模式-类型数据集)中的结果规则集合。给定预先定义的最小支持度计数s和置信度c,给定已发现的规则X→Y support_count
(X→Y)≥s且confidence (X→Y)≥c。

当X∩Y=(X、Y不相交),则X→Y是关联规则。规则的兴趣度通过支持度(support)和置信度(confidence)来测量。支持度表示数据集中规则出现的频率,而置信度测量在X出现的前提下,Y出现的可能性。

对于关联规则,衡量规则可用性的核心度量是规则的支持度和置信度。两者之间的关系是:

 

support_count(X)是数据集中包含X的项集数。

通常,在support_count(X)中,支持度和置信度的值表示为0~100的百分数。

给定最小支持度阈值s和最小置信度阈值c。如果support_count (X→Y) > s且confidence (X→Y)≥c,则关联规则X→Y称为强规则。

对于关联规则含义的解释应当慎重,尤其是当不能确定地判断规则是否意味着因果关系时。它只说明规则的前件和后件同时发生。以下是可能遇到不同种类的规则:

布尔关联规则:若规则包含项出现的关联关系,则称为布尔关联规则。

单维关联规则:若规则最多包含一个维度,则为单维关联规则。

多维关联规则:若规则至少涉及两个维度,则为多维关联规则。

相关关联规则:若关系或规则是通过统计相关进行测量的,满足给定的相关性规则,则称为相关关联规则。

定量关联规则:若规则中至少一个项或属性是定量的,则称为定量关联规则。

时间: 2024-09-28 06:06:33

R语言数据挖掘2.1.2.1 关联规则的相关文章

《R语言数据挖掘》——2.3 混合关联规则挖掘

本节书摘来自华章出版社<R语言数据挖掘>一书中的第2章,第2.3节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 2.3 混合关联规则挖掘 关联规则挖掘有两个有意义的应用:一是多层次和多维度关联规则挖掘:二是基于约束的关联规则挖掘. 2.3.1 多层次和多维度关联规则挖掘 对于给定的事务数据集,若数据集的某些维度存在概念层次关系,则需要对该数据集进行多层次关联规则挖掘.对事物数

《R语言数据挖掘》----第2章 频繁模式、关联规则和相关规则挖掘 2.1关联规则和关联模式概述

本节书摘来自华章出版社<R语言数据挖掘>一书中的第2章,第2.1节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 第2章 频繁模式.关联规则和相关规则挖掘 本章中,我们将首先学习如何用R语言挖掘频繁模式.关联规则及相关规则.然后,我们将使用基准数据评估所有这些方法以便确定频繁模式和规则的兴趣度.本章内容主要涵盖以下几个主题: 关联规则和关联模式概述 购物篮分析 混合关联规则挖掘

R语言数据挖掘

数据分析与决策技术丛书 R语言数据挖掘 Learning Data Mining with R [哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel) 著 李洪成 许金炜 段力辉 译 图书在版编目(CIP)数据 R语言数据挖掘 / (哈)贝特·麦克哈贝尔(Bater Makhabel)著:李洪成,许金炜,段力辉译. -北京:机械工业出版社,2016.9 (数据分析与决策技术丛书) 书名原文:Learning Data Mining with R ISBN 978-7-111-54769-

《R语言数据挖掘》——2.2 购物篮分析

本节书摘来自华章出版社<R语言数据挖掘>一书中的第2章,第2.2节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 2.2 购物篮分析 购物篮分析(Market basket analysis)是用来挖掘消费者已购买的或保存在购物车中物品组合规律的方法.这个概念适用于不同的应用,特别是商店运营.源数据集是一个巨大的数据记录,购物篮分析的目的发现源数据集中不同项之间的关联关系. 2

《R语言数据挖掘》----1.3 数据挖掘

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.3节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 1.3 数据挖掘 数据挖掘就是在数据中发现一个模型,它也称为探索性数据分析,即从数据中发现有用的.有效的.意想不到的且可以理解的知识.有些目标与其他科学,如统计学.人工智能.机器学习和模式识别是相同的.在大多数情况下,数据挖掘通常被视为一个算法问题.聚类.分类.关联

《R语言数据挖掘》——2.8 总结

本节书摘来自华章出版社<R语言数据挖掘>一书中的第2章,第2.8节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 2.8 总结 本章主要学习了以下内容: 购物篮分析. 作为关联规则挖掘的第一步,频繁项集是一个主要因素.除算法设计外,定义了闭项集.最大频繁项集. 作为关联规则挖掘的目标,通过支持计数.置信度等度量来挖掘关联规则.除支持计数外,使用相关公式挖掘相关规则. 频繁项集的

《R语言数据挖掘》----1.13 数据降维

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.13节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 1.13 数据降维 在分析复杂的多变量数据集时,降低维度往往是必要的,因为这样的数据集总是以高维形式呈现.因此,举例来说,从大量变量来建模的问题和基于定性数据多维分析的数据挖掘任务.同样,有很多方法可以用来对定性数据进行数据降维. 降低维度的目标就是通过两个或者多

《R语言数据挖掘》----1.10 数据属性与描述

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.10节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 1.10 数据属性与描述 属性(attribute)是代表数据对象的某些特征.特性或者维度的字段. 在大多数情况下,数据可以用矩阵建模或者以矩阵形式表示,其中列表示数据属性,行表示数据集中的某些数据记录.对于其他情况,数据不能用矩阵表示,比如文本.时间序列.图像.

《R语言数据挖掘》----1.2 数据源

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.2节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 1.2 数据源 数据充当数据挖掘系统的输入,因此数据存储库是非常重要的.在企业环境中,数据库和日志文件是常见来源:在网络数据挖掘中,网页是数据的来源:连续地从各种传感器中提取数据也是典型的数据源. 这里有一些免费的在线数据源十分有助于学习数据挖掘: 频繁项集挖掘数据

《R语言数据挖掘》——1.4 社交网络挖掘

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.4节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 1.4 社交网络挖掘 正如我们前面提到的,数据挖掘是从数据中发现一个模型,社交网络挖掘就是从表示社交网络的图形数据中发现模型. 社交网络挖掘是网络数据挖掘的一个应用,比较流行的应用有社会科学和文献计量学.PageRank和HITS算法.粗粒度图模型的不足.增强模型和