《R语言数据挖掘:实用项目解析》——第1章,第1.3节数据类型转换

1.3 数据类型转换
数据类型有很多种,比如数值型、因子型、字符型、逻辑型等。即使数据的格式没有预先处理得很好,用R把一种数据类型转换成另一种也并不困难。在改变变量类型之前,先查看现在的数据类型很关键,这可以用下面的命令实现:

当检查一个数值变量是否为数值型时,输出结果会显示为TRUE或FALSE。其他数据类型也是如此。如果任何数据类型不符合,可以通过以下代码进行转换:

在使用as.character()时,即使是一个逻辑向量,也会由逻辑型变成字符型。如果是一个数值变量,比如变量x1,因为它已经是数值格式,所以不会被转换。一个逻辑向量也可以从逻辑型转换成因子型,见以下代码:

时间: 2024-08-02 07:37:21

《R语言数据挖掘:实用项目解析》——第1章,第1.3节数据类型转换的相关文章

《R语言数据挖掘:实用项目解析》——1.4 排序与合并数据框

1.4 排序与合并数据框 在做数据管理时,排序与合并是两个重要概念.它们的操作对象可以是单一向量或者是一个数据框,还可以是一个矩阵.R语言中的sort()用于对向量进行排序.降序命令选项可用以改变排序的方向(升序或降序).在处理像ArtPiece.csv这样的数据框时,用order命令对数据进行排序,可以设置多个变量是升序还是降序.如要执行降序,可以在一个变量名前加一个负号.下面利用一个数据集来阐释R语言中的排序概念,代码如下: ArtPiece数据集里有16个变量:10个数值变量和6个分类变量

《R语言数据挖掘:实用项目解析》——1.5 索引或切分数据框

1.5 索引或切分数据框 在处理一个有着大量观测记录的客户数据集时,需要根据一些筛选规则和有无放回取样来切分数据集.索引是根据一些逻辑条件从数据框中提取数据子集的过程.subset函数的功能与索引一样,可用于从数据框中提取元素. 上述代码的意思是:从audit数据集中选取那些性别为女且年龄超过65岁的观测记录.应该用哪个命令来提取基于这两条规则的audit数据子集呢?本例中有10条观测记录满足前面的条件,上面的代码中输出了数据框的行号.类似的结果也可以使用subset函数获得.这里不使用whic

R语言数据挖掘

数据分析与决策技术丛书 R语言数据挖掘 Learning Data Mining with R [哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel) 著 李洪成 许金炜 段力辉 译 图书在版编目(CIP)数据 R语言数据挖掘 / (哈)贝特·麦克哈贝尔(Bater Makhabel)著:李洪成,许金炜,段力辉译. -北京:机械工业出版社,2016.9 (数据分析与决策技术丛书) 书名原文:Learning Data Mining with R ISBN 978-7-111-54769-

《R语言数据挖掘》----第2章 频繁模式、关联规则和相关规则挖掘 2.1关联规则和关联模式概述

本节书摘来自华章出版社<R语言数据挖掘>一书中的第2章,第2.1节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 第2章 频繁模式.关联规则和相关规则挖掘 本章中,我们将首先学习如何用R语言挖掘频繁模式.关联规则及相关规则.然后,我们将使用基准数据评估所有这些方法以便确定频繁模式和规则的兴趣度.本章内容主要涵盖以下几个主题: 关联规则和关联模式概述 购物篮分析 混合关联规则挖掘

《R语言数据挖掘》——2.2 购物篮分析

本节书摘来自华章出版社<R语言数据挖掘>一书中的第2章,第2.2节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 2.2 购物篮分析 购物篮分析(Market basket analysis)是用来挖掘消费者已购买的或保存在购物车中物品组合规律的方法.这个概念适用于不同的应用,特别是商店运营.源数据集是一个巨大的数据记录,购物篮分析的目的发现源数据集中不同项之间的关联关系. 2

《R语言数据挖掘》----1.3 数据挖掘

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.3节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 1.3 数据挖掘 数据挖掘就是在数据中发现一个模型,它也称为探索性数据分析,即从数据中发现有用的.有效的.意想不到的且可以理解的知识.有些目标与其他科学,如统计学.人工智能.机器学习和模式识别是相同的.在大多数情况下,数据挖掘通常被视为一个算法问题.聚类.分类.关联

《R语言数据挖掘》----1.6 网络数据挖掘

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.6节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 1.6 网络数据挖掘 网络挖掘的目的是从网络超链接结构.网页和使用数据来发现有用的信息或知识.网络是作为数据挖掘应用输入的最大数据源之一. 网络数据挖掘基于信息检索.机器学习(Machine Learning,ML).统计学.模式识别和数据挖掘.尽管很多数据挖掘方法

《R语言数据挖掘》----1.9 机器学习

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.9节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 1.9 机器学习 应用于机器学习算法的数据集称为训练集,它由一组成对的数据(x, y)构成,称为训练样本.成对的数据解释如下: x:这是一个值向量,通常称为特征向量.每个值或者特征,要么是分类变量(这些值来自一组离散值,比如{S, M, L}),要么是数值型. y:

《R语言数据挖掘》----1.13 数据降维

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.13节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 1.13 数据降维 在分析复杂的多变量数据集时,降低维度往往是必要的,因为这样的数据集总是以高维形式呈现.因此,举例来说,从大量变量来建模的问题和基于定性数据多维分析的数据挖掘任务.同样,有很多方法可以用来对定性数据进行数据降维. 降低维度的目标就是通过两个或者多

《R语言数据挖掘》----1.10 数据属性与描述

本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.10节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问"华章计算机"公众号查看. 1.10 数据属性与描述 属性(attribute)是代表数据对象的某些特征.特性或者维度的字段. 在大多数情况下,数据可以用矩阵建模或者以矩阵形式表示,其中列表示数据属性,行表示数据集中的某些数据记录.对于其他情况,数据不能用矩阵表示,比如文本.时间序列.图像.