《R语言数据挖掘：实用项目解析》——1.5　索引或切分数据框

1.5　索引或切分数据框

在处理一个有着大量观测记录的客户数据集时，需要根据一些筛选规则和有无放回取样来切分数据集。索引是根据一些逻辑条件从数据框中提取数据子集的过程。subset函数的功能与索引一样，可用于从数据框中提取元素。

上述代码的意思是：从audit数据集中选取那些性别为女且年龄超过65岁的观测记录。应该用哪个命令来提取基于这两条规则的audit数据子集呢？本例中有10条观测记录满足前面的条件，上面的代码中输出了数据框的行号。类似的结果也可以使用subset函数获得。这里不使用which 函数，而应使用subset函数，因为后者在传递多个条件参数时效率更高。让我们看看subset函数的使用方法：

subset函数中的附加参数使这个函数更为高效，因为它提供了仅从数据框中选取满足逻辑条件的特定列这个附加益处。

时间： 2024-10-22 11:55:57

《R语言数据挖掘：实用项目解析》——1.5　索引或切分数据框的相关文章

《R语言数据挖掘：实用项目解析》——第1章，第1.5节索引或切分数据框

1.5 索引或切分数据框在处理一个有着大量观测记录的客户数据集时,需要根据一些筛选规则和有无放回取样来切分数据集.索引是根据一些逻辑条件从数据框中提取数据子集的过程.subset函数的功能与索引一样,可用于从数据框中提取元素. 上述代码的意思是:从audit数据集中选取那些性别为女且年龄超过65岁的观测记录.应该用哪个命令来提取基于这两条规则的audit数据子集呢?本例中有10条观测记录满足前面的条件,上面的代码中输出了数据框的行号.类似的结果也可以使用subset函数获得.这里不使用which

《R语言数据挖掘：实用项目解析》——导读

前言随着数据规模和种类的增长,应用数据挖掘技术从大数据中提取有效信息变得至关重要.这是因为企业认为有必要从大规模数据的实施中获得相应的投资回报.实施数据挖掘的根本性原因是要从大型数据库中发现隐藏的商机,以便利益相关者能针对未来业务做出决策.数据挖掘不仅能够帮助企业降低成本以及提高收益,还能帮助他们发现新的发展途径. 本书将介绍使用R语言(一种开源工具)进行数据挖掘的基本原理.R是一门免费的程序语言,同时也是一个提供统计计算.图形数据可视化和预测建模的软件环境,并且可以与其他工具和平台相集成.

《R语言游戏数据分析与挖掘》一2.2　数据对象

2.2 数据对象 R拥有许多用于存储数据的对象类型,包括向量.矩阵.数组.数据框和列表.它们在存储数据的类型.创建方式.结构复杂度,以及用于定位和访问其中个别元素的标记等方面均有所不同.多样化的数据对象赋予了R灵活处理数据的能力. R中有许多数据类型用来存储各种各样的数据,包括数值型(numeric).逻辑型(logical).日期型(date).字符型(character).复数型(complex).原味型(二进制形式保存数据raw).此外,也可能是缺省值(NA)和空值(NULL).其中最经常

R语言数据挖掘

数据分析与决策技术丛书 R语言数据挖掘 Learning Data Mining with R ［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel) 著李洪成许金炜段力辉译图书在版编目(CIP)数据 R语言数据挖掘 / (哈)贝特·麦克哈贝尔(Bater Makhabel)著:李洪成,许金炜,段力辉译. -北京:机械工业出版社,2016.9 (数据分析与决策技术丛书) 书名原文:Learning Data Mining with R ISBN 978-7-111-54769-

《R语言数据挖掘》----第2章频繁模式、关联规则和相关规则挖掘 2.1关联规则和关联模式概述

本节书摘来自华章出版社<R语言数据挖掘>一书中的第2章,第2.1节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 第2章频繁模式.关联规则和相关规则挖掘本章中,我们将首先学习如何用R语言挖掘频繁模式.关联规则及相关规则.然后,我们将使用基准数据评估所有这些方法以便确定频繁模式和规则的兴趣度.本章内容主要涵盖以下几个主题: 关联规则和关联模式概述购物篮分析混合关联规则挖掘

《R语言数据挖掘》——2.2 购物篮分析

本节书摘来自华章出版社<R语言数据挖掘>一书中的第2章,第2.2节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 2.2 购物篮分析购物篮分析(Market basket analysis)是用来挖掘消费者已购买的或保存在购物车中物品组合规律的方法.这个概念适用于不同的应用,特别是商店运营.源数据集是一个巨大的数据记录,购物篮分析的目的发现源数据集中不同项之间的关联关系. 2

《R语言数据挖掘》----1.3 数据挖掘

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.3节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 1.3 数据挖掘数据挖掘就是在数据中发现一个模型,它也称为探索性数据分析,即从数据中发现有用的.有效的.意想不到的且可以理解的知识.有些目标与其他科学,如统计学.人工智能.机器学习和模式识别是相同的.在大多数情况下,数据挖掘通常被视为一个算法问题.聚类.分类.关联

《R语言数据挖掘》----1.6 网络数据挖掘

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.6节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 1.6 网络数据挖掘网络挖掘的目的是从网络超链接结构.网页和使用数据来发现有用的信息或知识.网络是作为数据挖掘应用输入的最大数据源之一. 网络数据挖掘基于信息检索.机器学习(Machine Learning,ML).统计学.模式识别和数据挖掘.尽管很多数据挖掘方法

《R语言数据挖掘》----1.9 机器学习

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.9节,作者［哈萨克斯坦］贝特·麦克哈贝尔(Bater Makhabel),李洪成许金炜段力辉译,更多章节内容可以访问"华章计算机"公众号查看. 1.9 机器学习应用于机器学习算法的数据集称为训练集,它由一组成对的数据(x, y)构成,称为训练样本.成对的数据解释如下: x:这是一个值向量,通常称为特征向量.每个值或者特征,要么是分类变量(这些值来自一组离散值,比如{S, M, L}),要么是数值型. y:

猜你喜欢

中断中C函数调用C++

之前,我们在单片机程序开发时都会面对中断函数.众所周知的,这个中断函数肯定是要用C函数来定义的.我在用C++进行程序开发的时候就发现了一个需要解决了问题:在断函数中怎么调用C++的成员函数? ...

System V 消息队列

1.概述消息队列可以认为是一个消息链表,System V 消息队列使用消息队列标识符标识.具有足够特权的任何进程都可以往一个队列放置一个消息,具有足够特权的任何进程都可以从一个给定队列读出一个消息. ...

同名checkbox的分级操作

<html><head><title>this is a test!</title></head><body><h1> ...

BlogSpot模版资源列表

首先是关于Google Blogger的一则快讯,我站一位杨读者首先发现,今天下午17点的时候,BlogSpot又可以正常访问了,我于是立刻尝试了一下,证实深圳电信和上海电信都可以正常访问BlogSp ...

加载XX.dll时出错的一般解决方法

你有遇到开机时提示加载某某dll文件出错的情况么,来看看如何解决这个问题吧一.关闭启动程序法开始菜单→运行→输入"msconfig"→确定→打开系统配置实用程序→启动选择卡→在 ...

简单实用的用户界面设计10个原则

设计真正伟大的用户界面没有什么伟大的奥秘可言,做到保持简单易用就可以. '保持简单易用'意味着不要让用户分心.恰恰相反,好的UI让用户达成目标.结果如何?你的培训和维护费用降低,并获得更开心.满足和高 ...

Compression Helper Class using SharpZipLib

使用 SharpZipLib 进行压缩的辅助类,简化压缩字节数组和字符串的操作. using System; using System.Text; using System.IO; using ICS ...

angularjs 过滤器filter

在前面介绍angularjs已经很多了,中途由于工作和一切生活琐事,暂停了很久.今天在这里将继续angularjs讲解,这节我们来看看angularjs的过滤去filter. 在我们开发中经常需要在 ...

加速编译

利用C++Builder编译一个大的项目需要冗长的过程.但是,如果你有已经调试好的forms, 你可以把他们包含到一个库中,这个库连接到项目中.这将极大的减少编译时间.具体步骤如下: 1. 建立一个新 ...

Asp.net将数据库里的记录转换成json

在前面我已经写了asp的版本,最近一个项目中正好需要用json来填充下拉框,所以写了一个asp.net的将数据库里的记录转换成json,代码如下: 以下是引用片段: using System; usi ...

word2010怎么插入时间和日期

word2010插入时间和日期教程: 打开Word2010文档,将光标移动到合适的位置. 单击"插入"选项卡. 在"文本"区单击"日期和时间&qu ...

Powerpoint2007中建立带滚动条的文本框

①这里我们将会用到"开发工具",而这个功能一般不显示,所以我们需要进行一些设置,将"开发工具"调出来.单击"office按钮"--&qu ...

台式机电脑win7自动关机命令功能介绍

Windows XP(7)的关机是由Shutdown.exe程序来控制的,位于WindowsSystem32文件夹中.如果想让Windows 2000也实现同样的效果,可以把Shutdown.exe复 ...

电脑小白必看SSD手册从挑选到安装全流程

挑选SSD注意事项及选购技巧整理出来给小白用户做参考,并以三星300E5K更换SSD流程为例为大家实机演示. 在决定升级SSD之前,首先要对自己电脑是否适合安装SSD进行评估.这里需要解释一下,并 ...

PS用套头锁住梦幻秋色

关于后期,每个人有自己的目标与观念,我不是修图高手,这张作品旨在一边练习,一边分享个人看法及做法,希望抛砖引玉,如果因此而吸引到真正高手留言指教,那对我而言就是很理想的结果了. 上图是这次的对比图 ...

win7电脑的cmd命令无法使用怎么办？

cmd是windows系统用来执行命令的一个操作方式,在cmd模式下我们可以查看电脑中的诸多情况,但是,最近有朋友提示,win7电脑在使用cmd命令时老是跳出不是内部或外部的命令,让cmd无法正常 ...

ImageMagick图像魔术师基本使用指南

图像魔术师ImageMagick是一款命令行图像处理软件,某些在Photoshop之类的图像软件中要进行一系列步骤的繁琐操作,它只需要输入一行命令就可以解决,效率奇高.当然,命令行操作毕竟有着很大的局 ...

GeekUninstaller帮你卸载软件并清理残留文件与注册表

常规情况下卸载windows中安装的软件可通过自带的卸载程序和控制面板的卸载程序功能,但是大部分时候卸载后会在系统中残留文件和注册表,如果你想卸载程序后顺便能清理残留文件和注册表,你可以试试Gee ...

win8系统下怎样隐藏指定驱动器盘符

在使用Win8系统过程中,不同用户有着不同的需求,即使一些需求很小众但也能实现.就有一些用户希望隐藏本地磁盘驱动器号,这该如何操作呢? 操作方法 1.打开文件夹选项. 2.在查看选项卡中,取消勾选显示 ...

CMake 简单介绍

CMake特点 CMake需要用户用CMake规范的语法编写CMake脚本,该语法简单易用,入门极其顺手原生支持 C/C++/Fortran/Java 的相依性的自动分析功能,免除了程序员对代码依赖 ...

java问题新手求帮助，运行有问题

问题描述 java问题新手求帮助,运行有问题我正在学习java,自己写了一个程序,运行时选择第七点出错,不知道是不是ShowHTD类有错还是怎么回事,求大神帮忙解决,代码和报错信息附上, 代码: / ...

电子+硬件+单片机-MPU6050可以持续工作多长时间？？？？有人知道吗

问题描述 MPU6050可以持续工作多长时间????有人知道吗我是晚上开机放着,到第二天早上发现MPU6050死机了,LCD读数没有变化,串口没有数据接收...还有一次是放了大概4小时,Roll角从 ...

Git 命令大全

一. Git 常用命令速查 git branch 查看本地所有分支git status 查看当前状态 git commit 提交 git branch -a 查看所有的分支git branch -r ...

MySQL外键-涉及天气预报的小小思考

MySQL中"键"和"索引"的定义相同, 所以外键和主键一样也是索引的一种.不同的是MySQL会自动为所有表的主键进行索引,但是外键字段必须由用户进行明确的索 ...

css-怎么学习Css才能快速有效

问题描述怎么学习Css才能快速有效发现看了一些书和视频,但是都觉得很不系统.因为看到视频中通过css实现的效果,自己并不会.虽然代码可以理解但是就是觉得所知道的东西不系统怎么才能系统性学习cs ...

浅谈今后源码类网站应该如何运营

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅如今A5论坛中有多家源码论坛在进行 ...

模拟电路多功能数字时钟

问题描述模拟电路多功能数字时钟如何通过用 74160芯片制作电子数字时钟. 可能的话, 带整点报时, 闹钟等功能!! 求电路图?

程序员很穷

文/池建强程序员很穷,他们要么是显得很穷,要么是真的很穷. 前几天一位做市场的同事跑过来问,池老师,我有一位朋友,快 30 了,想转行写程序,您觉得有戏吗?我看了看满目疮痍的他说,如果是你就没戏. ...

航美传媒3月1日发布第四季及全年财报

美国东部时间2月8日6:00(北京时间2月8日19:00)消息,航美传媒(Nasdaq:AMCN)今天宣布,该公司将于美国东部时间3月1日(北京时间3月2日)美国股市收盘后发布截至12月31日的200 ...

《低功耗蓝牙开发权威指南》——2.1节纽扣电池

2.1 纽扣电池纽扣电池是低功耗蓝牙的主要设计目标.这类电池(见图2-1)在使用时有非常严格的限制.图中的电池型号为CR2032,标签上的"CR"表示这是一个3V锂二氧化锰电池, ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.035 s.