安装和加载R程序包

安装和加载R程序包

目前已有很多精心设计、维护良好且广泛支持的与机器学习相关的R程序包。在我们要进行的案例研究中,涉及的程序包主要用于:处理空间数据、进行文本分析、分析网络拓扑等,还有些程序包用于与网络API进行交互,当然还有其他很多功能,不胜枚举。因此,我们的任务很大程度上会依赖内置在这些程序包的函数功能。

加载R程序包很简单。实现加载的两个函数是:library和require。两者之间存在细微差别,在本书中,主要差别是:后者会返回一个布尔值(TRUE或FALSE)来表示是否加载成功。例如,在第6章中,我们会用到tm程序包来分词。要加载该程序包,我们既可以用library也可以用require。在下面所举例子中,我们用library来加载tm包,用require来加载XML包,再用print函数来显示require函数的返回值。可以看到,返回的布尔值是“TRUE”,可见XML包加载成功了。


  1. library(tm)  
  2. print(require(XML))  
  3. #[1] TRUE 

假如XML包还未安装成功,即require函数返回值为“FALSE”,那么我们在调用之前仍需先安装成功这个包。

注意: 如果你刚安装成功R环境,那么你还需要安装较多的程序包才能完成本书的所有案例研究。

在R环境中安装程序包有两种方法:可以用图形用户界面进行安装,也可以用R控制台中的install.packages函数来安装。考虑到本书目标读者的水平,我们在本书的案例研究中会全部采用R控制台进行交互,但还是有必要介绍一下怎么用图形用户界面安装程序包。在R应用程序的菜单栏上,找到Packages & Data→Package Installer(程序包→安装程序包),点击之后弹出如图1-4所示的窗口。从程序包资源库的下拉列表中选择CRAN(binaries)(CRAN(二进制))或者CRAN(sources)(CRAN(源代码)),点击Get List(获取列表)按钮,加载所有可安装的程序包,最新的程序包版本可以从CRAN (sources)(CRAN(源代码))资源库中获取。如果你的计算机上已经安装了所需的编译器,我们推荐用源代码安装。接着,选择要安装的包,然后点击Install Selected(安装所选包),即可安装。

相比而言,用install.packages函数来安装是一种更佳的方法,因为它在安装方式和安装路径上更为灵活。这种方法的主要优势之一就是既可以用本地的源代码,也可以用CRAN上的源代码来安装。虽然以下这种情况不太常见,但仍然有可能会需要。有时你可能要安装一些CRAN上还未发布的程序包,比如你要将程序包更新到测试版本,那么你必须用源代码进行安装:


  1. install.packages("tm", dependencies=TRUE)  
  2. setwd("~/Downloads/")  
  3. install.packages("RCurl_1.5-0.tar.gz", repos=NULL, type="source") 

第一行代码中,我们用默认参数从CRAN上安装了tm程序包。tm程序包用于文本挖掘,在第3章将用它来对电子邮件文本进行分类。install.packages中一个很有用的参数是suggests,这个参数默认值是FALSE,如果设置为TRUE,就会在安装过程中通知install.packages函数下载并安装初始安装过程所依赖的程序包。为了得到最佳实践,我们推荐将此参数值一直设置为TRUE,当R应用程序上没有任何程序包的情况下更要如此。

同样还有另一种安装方法,那就是直接使用源代码的压缩文件进行安装。在上一个例子中,我们用作者网站上的源代码安装了RCurl程序包。用setwd函数确保R的工作路径已设置为保存源代码的目录,然后就可以简单地执行前面的命令从源代码安装了。注意,这里需要改动两个参数。首先,我们必须设置repos=NULL来告诉函数不要使用CRAN中任意一个资源库,然后要设置type=”source”来告诉函数使用源代码安装。

表1-2:本书中用到的程序包

前文已经提到过,在本书中我们会使用一些程序包。表1-2列出了本书的案例研究所用到的所有程序包,包括对其用途的简单介绍,以及查看每个包详细信息的链接。安装所需程序包的数量不少,为了加快安装过程,我们创建了一个简短的脚本来检查每个必需的程序包是否已安装,若没有安装,它会通过CRAN进行安装。要运行该脚本,先用setwd函数将工作目录设置为本章代码所在的文件夹,再执行source命令,如下所示:


  1. source("package_installer.R") 

如果你还没有安装过程序包,系统可能要求你选择一个CRAN的库。一旦设置完成,脚本就开始运行,你就可以看到所有需要安装的程序包的安装进度。现在,我们就要用R开始机器学习之旅了!在我们开始案例分析之前,我们仍需要回顾一些常用的R相关的函数与操作。

时间: 2024-10-05 03:21:19

安装和加载R程序包的相关文章

干货 | MIT手把手教你一步步创建自己的R程序包

R语言对于数据科学家的重要性不言而喻,但配置R程序包的过程往往让一些菜鸟学习者望而却步,这篇文章将带着你跟着MIT的指导一步步的创建自己的R程序包. 1.首先打开一个新的R文件,确保你的默认目录是清楚的通过rm进行输入的(list=ls()).查看Is(),确保它是空的(你应该能够清楚的看见(0)). 2.在R文件中可以为你的程序编写代码.你可以创建一个包含所有函数的文件,或者是为每个函数都创建单独的文件.将文件保存到你能快速找到的地方. 3.安装'devtools' 安装包,(代码:insta

编译安装hadoop-2.5.0-rc1,程序包com.sun.javadoc不存在

问题描述 编译安装hadoop-2.5.0-rc1,程序包com.sun.javadoc不存在 编译安装hadoop-2.5.0-rc1,报如下错,求指点: [ERROR] Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:2.5.1:compile (default-compile) on project hadoop-annotations: Compilation failure: Compilati

app-APP签名后安装报错“解析程序包时出现错误”

问题描述 APP签名后安装报错"解析程序包时出现错误" 今天升级应用时,被告之签名发生变化--要知道我根本没有做过相关的任何操作,即使有签名也一定是MyEclipse帮我做的,而我对此一无所知.在网上查了一下,感觉还是有很多问题没有答案,所以问一下: 1.我之前生成的应用,发布了,现在我的笔记本换了,各应用包括Java.SDK.ADT等也换了.只有SDK和ADT.所有源码有备份,不知道还是否可以得到原应用文件的相关签名文件,包括如果存在的密钥或密码? 2.如果还有办法得到,应该也有办法

《数据科学:R语言实现》——第2章 数据抽取、转换和加载 2.1 引言

第2章 数据抽取.转换和加载 2.1 引言 在使用数据回答关键业务问题之前,最重要的事情是准备数据.数据通常存在文件中,使用Excel或者文本编辑器可以轻松地获取.但是数据也可以来自于其他来源,例如数据库.网站和各种文件格式.能够从这些源中引入数据很重要. 数据主要有4种类型.以文本形式存储的数据最简单.由于一些用户需要把数据存在结构化的文件中,因此带有.tab或.csv扩展名的文件可以用来存放一定列的数据.很多年以来,Excel在数据处理领域占据主导地位,这个软件使用.xls和.xlsx文件格

word2007加载或卸载模板或加载项程序

  模板可以存储样式."自动图文集"词条."自动更正"词条.宏.工具栏.自定义菜单设置和快捷键.加载一个模板可以使其成为共用模板,这样,在使用基于任何其他模板的文档时,还可以使用这个共用模板. 加载项是一些补充程序,安装这些补充程序可以添加自定义命令和专用功能,从而扩展 Microsoft Office Word 的功能.例如,加载项程序可以是由公司 IT 部门设计并发布的一个程序,用来在计算机上打开的文档中突出显示公司名称. 您要做什么? ●加载模板或加载项 ●卸

rstudio-RStudo无法安装程序包

问题描述 RStudo无法安装程序包 用RStudio无法加载程序包,不论安装什么包都会报错 Warning in install.packages : downloaded length 274432 != reported length 283427Warning in install.packages : error 1 in extracting from zip fileWarning in install.packages : cannot open compressed file

NuGet程序包安装SQLite后完全抽离出SQLite之入门介绍及注意事项,你真的懂了吗?

前言 近几天的几篇文章讲的内容非前面内容如系列的讲解,这几天文章都是我在项目中遇到的问题以及重新学习的知识,所以和大家分享一下,关于SQLite的文章多如牛毛,但是有些大多已经过时,为什么说过时,之前都是在SQLite官网中下载dll或者exe来实现,现如今我们可以直接安装SQLite程序包,又方便了我们,同时作者对于SQLite也没用过,这也是项目需要才去学习SQLite的使用,欢迎和大家一起探讨. 安装SQLite 通过NUGet来安装SQlite程序包,如下: 此时自然而然在包中会有如下S

解决安装Office2013时提示“该程序包安装失败”

解决安装 Office2013 时提示"该程序包安装失败",如果你在使用了 Ramdisk,并修改了TEMP临时文件夹的变量路径,那么安装Office2013时就会提示"该程序包安装失败". 主要 Ramdisk 分配的容量不够解压Office2013. 解决方法:把TEMP临时文件夹的变量路径修改回默认就可以解决啦.安装完毕后建议重新修改TEMP临时文件夹到Ramdisk.

“无法通过windows installer服务安装此安装程序包”错误如何解决

  今天小编安装一个文件时,出现了一个"无法通过windows installer服务安装此安装程序包.您必须安装带有更新版本windows Installer服务的Windows Service Pack"的错误 我去,好坑啊,好像貌似是从来不更新补丁的,但以前也没遇过到啊.intaller版本太低了,下一个新一点的windows installer程序装上就可以了.