《R语言数据挖掘：实用项目解析》——第2章，第2.5节解读分布

2.5　解读分布
计算概率分布、将数据点拟合于一些特定类型的分布以及后续的解读有助于建立假设。此假设可用于在给定一组参数下估算事件的概率。我们来看看对不同类型分布的解读。
解读连续型数据
一个数据集的任何变量都可通过拟合一个分布来得到其分布参数的最大似然估计。密度函数适用于诸如“贝塔”“柯西”“卡方”“指数”“f”“伽马”“几何”“对数正态”“logistic”“负二项”“正态”“泊松”“t”和“威布尔”等分布。这些分布都是常用的，这里不给出示例。对于连续型数据，我们采用正态分布和t分布：

在上面的代码中，我们用的是Cars93数据集中的MPG.highway变量。通过让t分布拟合这个变量，我们得到参数估计、标准误差估计、协方差矩阵估计、对数似然值还有总数。类似的操作也适用于对连续型变量执行正态分布拟合：

现在我们来看如何图形化地表示变量的正态性：

可以看到，所表示的偏离的数据点距离直线很远。
下面解读离散数据，因为其中有所有分类：

为了将结果可视化，我们需要用到下图所示的盒状图：

时间： 2024-12-10 00:50:00

《R语言数据挖掘：实用项目解析》——第2章，第2.5节解读分布的相关文章

R语言数据挖掘

数据分析与决策技术丛书 R语言数据挖掘 Learning Data Mining with R ［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel) 著李洪成许金炜段力辉译图书在版编目(CIP)数据 R语言数据挖掘 / (哈)贝特·麦克哈贝尔(Bater Makhabel)著:李洪成,许金炜,段力辉译. -北京:机械工业出版社,2016.9 (数据分析与决策技术丛书) 书名原文:Learning Data Mining with R ISBN 978-7-111-54769-

《R语言数据挖掘》----第2章频繁模式、关联规则和相关规则挖掘 2.1关联规则和关联模式概述

本节书摘来自华章出版社<R语言数据挖掘>一书中的第2章,第2.1节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 第2章频繁模式.关联规则和相关规则挖掘本章中,我们将首先学习如何用R语言挖掘频繁模式.关联规则及相关规则.然后,我们将使用基准数据评估所有这些方法以便确定频繁模式和规则的兴趣度.本章内容主要涵盖以下几个主题: 关联规则和关联模式概述购物篮分析混合关联规则挖掘

《R语言数据挖掘》——2.2 购物篮分析

本节书摘来自华章出版社<R语言数据挖掘>一书中的第2章,第2.2节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 2.2 购物篮分析购物篮分析(Market basket analysis)是用来挖掘消费者已购买的或保存在购物车中物品组合规律的方法.这个概念适用于不同的应用,特别是商店运营.源数据集是一个巨大的数据记录,购物篮分析的目的发现源数据集中不同项之间的关联关系. 2

《R语言数据挖掘》----1.3 数据挖掘

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.3节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 1.3 数据挖掘数据挖掘就是在数据中发现一个模型,它也称为探索性数据分析,即从数据中发现有用的.有效的.意想不到的且可以理解的知识.有些目标与其他科学,如统计学.人工智能.机器学习和模式识别是相同的.在大多数情况下,数据挖掘通常被视为一个算法问题.聚类.分类.关联

《R语言数据挖掘》----1.6 网络数据挖掘

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.6节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 1.6 网络数据挖掘网络挖掘的目的是从网络超链接结构.网页和使用数据来发现有用的信息或知识.网络是作为数据挖掘应用输入的最大数据源之一. 网络数据挖掘基于信息检索.机器学习(Machine Learning,ML).统计学.模式识别和数据挖掘.尽管很多数据挖掘方法

《R语言数据挖掘》----1.9 机器学习

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.9节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 1.9 机器学习应用于机器学习算法的数据集称为训练集,它由一组成对的数据(x, y)构成,称为训练样本.成对的数据解释如下: x:这是一个值向量,通常称为特征向量.每个值或者特征,要么是分类变量(这些值来自一组离散值,比如{S, M, L}),要么是数值型. y:

《R语言数据挖掘》----1.13 数据降维

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.13节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 1.13 数据降维在分析复杂的多变量数据集时,降低维度往往是必要的,因为这样的数据集总是以高维形式呈现.因此,举例来说,从大量变量来建模的问题和基于定性数据多维分析的数据挖掘任务.同样,有很多方法可以用来对定性数据进行数据降维. 降低维度的目标就是通过两个或者多

《R语言数据挖掘》----1.10 数据属性与描述

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.10节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 1.10 数据属性与描述属性(attribute)是代表数据对象的某些特征.特性或者维度的字段. 在大多数情况下,数据可以用矩阵建模或者以矩阵形式表示,其中列表示数据属性,行表示数据集中的某些数据记录.对于其他情况,数据不能用矩阵表示,比如文本.时间序列.图像.

《R语言数据挖掘》----1.2 数据源

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.2节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 1.2 数据源数据充当数据挖掘系统的输入,因此数据存储库是非常重要的.在企业环境中,数据库和日志文件是常见来源:在网络数据挖掘中,网页是数据的来源:连续地从各种传感器中提取数据也是典型的数据源. 这里有一些免费的在线数据源十分有助于学习数据挖掘: 频繁项集挖掘数据

《R语言数据挖掘》——1.4 社交网络挖掘

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.4节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 1.4 社交网络挖掘正如我们前面提到的,数据挖掘是从数据中发现一个模型,社交网络挖掘就是从表示社交网络的图形数据中发现模型. 社交网络挖掘是网络数据挖掘的一个应用,比较流行的应用有社会科学和文献计量学.PageRank和HITS算法.粗粒度图模型的不足.增强模型和

猜你喜欢

初学ASP之领略IIS的几则新鲜应用

iis|初学引:利用IIS发布网站信息,已经不是什么新鲜的话题了;不过除了具有发布网站功能之外,IIS还有许多并不引人注意细节功能,巧妙地利用这些功能,可以实现对网站进行高效管理的目的.不信的话,就 ...

为什么百度显示查看更多关于“关键词”的内容

作为一名SEOer,百度的一举一动都牵动我们的心.因为竞争压力的增加,百度的变动算是越来越频繁.绿萝算法上线.外链的新判断和原创项目等等.不难看出,一系列的动作的最终目的都是为了给用户提供更加有价值的 ...

汇编的任务状态段和控制门

每个任务有一个任务状态段TSS,用于保存任务的有关信息,在任务内变换特权级和任务切换时,要用到这些信息.为了控制任务内发生特权级变换的转移,为了控制任务切换,一般要通过控制门进行这些转移.本文将介绍任 ...

Windows Azure Virtual Network(4)

创建Web Server 001并添加至Virtual Network 在上一章内容中,笔者已经介绍了以下两个内容: 1.创建Virtual Network,并且设置了IP range 2.创建Azu ...

数据结构教程第九课循环链表与双向链表

本课主题: 循环链表与双向链表教学目的: 掌握循环链表的概念,掌握双向链表的的表示与实现教学重点: 双向链表的表示与实现教学难点: 双向链表的存储表示授课内容: 一.复习线性链表的存储结构二 ...

Head First C#中文版（page11）

问:如果IDE为我写了那么多代码的话,学C#就是学怎么用IDE喽?答:不,IDE在自动生成代码方便很棒,但是它也只能做那么多了.有些事情它确实很在行,比如为你设置好的起点,自动改变窗体上控件的属性.但 ...

X3D实战基础讲座之十一

我们知道,对于Visual C++而言,交互的实现是通过消息映射来进行的.同样,X3D的交互实现也是通过类似的映射机制.用户事件的产生是通过相应的传感器产生的,而ROUTE语句就是相当于事件的映射,它 ...

JAVA提高教程(14)-认识Map之LinkedHashMap

Java基础及提高教程目录 Map 接口的哈希表和链接列表实现,具有可预知的迭代顺序.此实现与 HashMap 的不同之处在于,后者维护着一个运行于所有条目的双重链接列表.此链接列表定义了迭代顺序,该 ...

win8.1怎么修改标题栏和提示框的字体

win8.1怎么修改标题栏和提示框的字体 1.按下"Win+X"组合键呼出系统快捷菜单,点控制面板; 2.在控制面板点击"外观和个性化" ...

powerpoint中的自动缩略图效果

你相信用一张幻灯片就可以实现多张图片的演示吗?而且单击后能实现自动放大的效果,再次单击后还原.其方法是: 新建一个演示文稿,单击"插入"菜单中的"对象"命令, ...

c语言课程设计总结心得大全

c语言课程设计心得体会范文一: 课程设计是培养学生综合运用所学知识,发现,提出,分析和解决实际问题,锻炼实践能力的重要环节,是对学生实际工作能力的具体训练和考察过程.随着科学技术发展的日新日异,单片机 ...

PS打造人物外景复古色调

打造人物外景复古色调!大家好,这个色调的灵感来自于原图在ps软件中的缩略图,看起来比较有种复古感觉,然后就凭感觉做了这个调色,个人感觉还不错.本人没有系统学过,所以对调色了解不多分类: PS调色 ...

Win7中如何进行批量修改文件属性

问:以前我用Windows XP时,因嫌显示器上的字小,所以将小说下载到本地硬盘,再修改源文件,将字体放大后再看.现在我新买了一台电脑,预装的是Windows 7 家庭普通版,却发现文件的属性一直是只 ...

如何在iPad上使用WPS移动版创建和使用Word文档

现在的职场朋友每天都离不开移动终端,手机.iPad都是"机不离身",有了iOS 版WPS办公软件,出差旅行用iPad办公很方便.但要用iPad创建并编辑Office文稿,必须掌握一 ...

cookie-后台模拟登陆成功，是否可以直接在浏览器打开登陆后的页面

问题描述后台模拟登陆成功,是否可以直接在浏览器打开登陆后的页面使用的苏飞论坛的HttpHelper模拟登陆,需要cookie,后台登录成功. 现在我们的需求是客户有很多个系统,每个登陆嫌太麻烦,想 ...

div布局-DIV + CSS设计中的DIV是指的html中的div标签吗？

问题描述 DIV + CSS设计中的DIV是指的html中的div标签吗? 在DIV+CSS设计中的DIV如果是div标签的话, 那么DIV+CSS的意思就是换行标签与层叠样式表. 这个意思好像有些别 ...

JavaWeb将图片显示在浏览器中

一.背景用户上传了一张图片,图片到服务器后用户得到一个链接,可以将图片显示在浏览器上. 二.实现假设项目名叫TestProject,文件放在项目根目录下的uploadImages文件夹下. ①图片 ...

Redis + Jedis + Spring整合遇到的异常（转）

项目中需要用到缓存,经过比较后,选择了redis,客户端使用jedis连接,也使用到了spring提供的spring-data-redis.配置正确后启动tomcat,发现如下异常: Caused ...

cdh5安装spark的问题

问题描述大家好:我用cdh5安装了下hdfs和spark,启动后,想在spark-shell中写一个wordcount的例子,结果在最后job的时候,出现如下问题:网上找了一些答案,我试验都不好使, ...

计算机编程-弱渣问个基础问题。。大神勿笑。。

问题描述弱渣问个基础问题..大神勿笑.. unicode letter 和 unicode digit 长什么样..能举个例子吗..实在不会解决方案新建一个文本文件,输入字母,数字,用unico ...

我想在标签里面输入一段连续的字符串如何实现

问题描述我想在标签里面输入一段连续的字符串如何实现但是连续的字符串中间有一个位置我想输出换行符,就是说输出后文本是两行,我该在那个地方加什么解决方案 rn 解决方案二: .....html页面的 ...

win2008里IIS安装以及IIS7简单设置教程[图文]_win服务器

windows2008里面的IIS它默认安装好IIS服务后,集成了两种IIS,一种是IIS6.0,这个版本是以前2003上使用的,还有一种就是目前的新产品IIS7.0(当然了,你在安装IIS服务的时候 ...

关于上传控件的小疑惑

问题描述 stringurl=HttpContext.Current.Server.MapPath(fileurl);if(!Directory.Exists(url)){Directory.Crea ...

RMAN 数据库克隆文件位置转换方法

在使用RMAN克隆数据库时,如果辅助数据库(新数据库)使用了与目标数据库(原数据库)使用了不同的路径,那么就存在位置转换的问题.在Oracle中,控制文件用于定位数据文件以及联机重做日志文 ...

【知云】第六期：数据级异地容灾如何实现？阿里云帮你打通数据的“任督二脉”

摘要:国家要求网络借贷信息中介机构成立两年内,应当建立或使用与其业务规模相匹配的应用级灾备设施.那么如何规划容灾设施呢?本文中阿里云架构师半农将与大家分享阿里云异地容灾解决方案. 想要看视频版?请点击 ...

【hibernate框架】核心开发接口-load和get方法

Load方法,从数据库里取数据,并封装成JAVA对象. 示例: public void testLoad(){ Configuration cfg=new AnnotationConfiguratio ...

询问WCF问题

问题描述 WCF有几种方式调用,服务引用.Post或Get方式问题如下:[1]当将.svc文件设置为post或get方式引用时,是不是客户端就不可以以服务引用的方式进行调用了?(增加Factory=& ...

5G标准碎片化, 谁是幕后的推手？

最近,3GPP这个盟主有些坐不住了,重新拿起那张5G时间表,扶了扶老花镜,再次确认了一下. 这张时间表是几百名3GPP成员多夜熬战讨论的结果,也是全球通信精英们集体智慧的结晶.尽管只是一张简单的时间线 ...

C# 程序自动批量生成 google maps 的KML文件

原文:C# 程序自动批量生成 google maps 的KML文件 google maps 的 KML 文件可以用于静态的地图标注,在某些应用中,我们手上往往有成百上千个地址,我们需要把这些地址和描述 ...

产品组合策略

产品好比人一样,都有其由成长到衰退的过程.因此,企业不能仅仅经营单一的产品,世界上很多企业经营的产品往往种类繁多,如美国光学公司生产的产品超过3万种,美国通用电气公司经营的产品多达25万种.当然,并不 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.022 s.