《R语言编程艺术》——2.8　筛选

2.8　筛选

反映R函数式语言特性的另一个特征是“筛选”（filtering）。这使我们可以提取向量中满足一定条件的元素。筛选是R中常用的运算之一，因为统计分析往往关注满足一定条件的数据。
2.8.1　生成筛选索引
我们先看一个简单的例子：

查看这段代码，凭直觉想想 “我们的目的是什么？”。可以看出我们要求R提取z中平方大于8的所有元素，然后将这些元素构成的子向量赋值给w。
筛选是R中很关键的运算，因此我们有必要从技术细节上探究一下R是怎样实现上述意图的。我们来逐步研究：

表达式z*z > 8得出的是布尔值向量。对你而言，弄清楚这个结果如何产生是非常重要的。
首先，注意表达式z*z > 8中所有东西都是向量或向量运算符：
因为z是向量，所以z*z同样是向量（并且长度与z一致）。
通过循环补齐，这里的数字8（长度为1的向量）补齐为向量(8,8,8,8)。
运算符>，像+一样，实际上是个函数。
对于最后这一点，我们看个例子：

换句话说，我们对向量使用函数—它也是向量化的另一个例子，与你看到的其他向量化一样。在本例中，结果是一个布尔值向量。然后用得到的布尔值向量筛选出z中所需的元素：

下一个例子将更有针对性。在这里，我们将再次用z定义提取条件，但接着用该结果从另一个向量y，而不是从z中提取子向量，如下所示：

或者，可以像下面这样写更简洁：

再次强调，这个例子要说的是，我们使用向量z决定筛选另一个向量y的索引。相反，前面的例子是使用z筛选它自身。
下面是另一个例子，其中涉及赋值。设我们有一个向量x，要将其中所有比3大的元素替换为0。事实上，我们可以非常简洁地使用一行代码。

2.8.2　使用subset()函数筛选
也可以使用subset()函数做筛选。当对向量使用该函数时，它与普通的筛选方法的区别在于处理NA值的方式上。

我们使用前一节提到的普通筛选方法，R会认为“x[5]是未知的，因此其平方是否大于5同样是未知的。”但也许你不希望NA出现在结果中。当你希望在结果中剔除NA值时，使用subset()将免去自己移除NA的麻烦。
2.8.3　选择函数which()
正如你所看到的，筛选是从向量z中提取满足一定条件的元素。但是，在某些情况下，我们希望找到z中满足条件元素所在的位置。此时可以使用which()，如下所示：

结果表明z中的第一、第三和第四元素平方大于8。
和筛选一样，了解前面的代码到底发生了什么是很重要的。下面的表达式：

计算得到（TRUE,FALSE,TRUE,TRUE）。which()函数简单地报告出在后面的表达式中哪些元素为TRUE。
which()有一个非常方便（尽管有点浪费）的用法，是在一个向量中找出满足一定条件的元素首次出现的位置。例如，回顾本书2.1.2节代码，找出向量中的第一个1。

调用which()产生x中所有1的索引。这些索引将以向量形式给出，然后我们取该向量中的第一个元素，即是第一个1的索引。
这一代码更加简洁。但另一方面，它也比较浪费，因为它找出了x中所有的1，而我们只需要第一个。因此，尽管它是向量化方法，可能更快，但如果x中第一个1出现在靠前的位置，则此方法实际上要慢一些。

时间： 2024-11-16 14:13:50

《R语言编程艺术》——2.8　筛选的相关文章

《R语言编程艺术》——1.3　函数入门

1.3 函数入门和大多数编程语言一样,R语言编程的核心是编写"函数".函数就是一组指令的集合,用来读取输入.执行计算.返回结果.我们先定义一个函数oddcount(),以此简单介绍函数的用法.这个函数的功能是计算整数向量中奇数的个数.一般情况下,我们会用文本编辑器编写好函数代码并保存在文件中,不过在这个简单粗略的例子中,我们只需要在R的交互模式中一行行输入代码.接下来,我们还会在几个测试案例中调用这个函数: 首先,我们告诉R想定义一个名为oddcount的函数,该函数有一个参数x.左

《R语言编程艺术》——导读

前言 R是一种用于数据处理和统计分析的脚本语言,它受到由AT&T实验室开发的统计语言S的启发,且基本上兼容于S语言.S语言的名称代表统计学(statistics),用来纪念AT&T开发的另一门以一个字母命名的编程语言,这就是著名的C语言.后来一家小公司买下了S,给它添加了图形用户界面并命名为S-Plus. 由于R是免费的,而且有更多的人贡献自己的代码,R语言变得比S和S-Plus更受欢迎.R有时亦称为GNU S,以反映它的开源属性.(GNU项目是开源软件的一个重要集合.) 为什么在统计工作

《R语言编程艺术》——第2章 2.0 向量

第2章 2.0 向量 R语言最基本的数据类型是向量(vector).第1章已经给出了向量的一些例子,本章将详细介绍向量.首先考察向量与R语言的其他数据类型之间的关系.与C语言家族不同,R语言中,单个数值(标量)没有单独的数据类型,它只不过是向量的一种特例.而另一方面,R语言中矩阵是向量的一种特例,这一点与C语言家族相同.接下来我们会用大量时间关注以下话题:循环补齐:在一定情况下自动延长向量.筛选:提取向量子集.向量化:对向量的每一个元素应用函数.这些运算是R编程的核心,在本书的其他部分也会经常提

《R语言编程艺术》——2.1　标量、向量、数组与矩阵

2.1 标量.向量.数组与矩阵在许多编程语言中,向量与标量(即单个数值)不同.例如,考虑下面的C代码: 这段代码请求编译器给一个x的整型变量x分配空间,并给一个名为y的三元素整型数组(C语言中的术语,类似于R中的向量)分配内存空间.但在R中,数字实际上被当做一元向量,因为数据类型里没有标量.R语言中变量类型称为模式(mode).回顾第1章,同一向量中的所有元素必须是相同的模式,可以是整型.数值型(浮点数).字符型(字符串).逻辑型(布尔逻辑).复数型等等.如果在程序中查看变量x的类型,可以调用

《R语言编程艺术》——1.4　R语言中一些重要的数据结构

1.4 R语言中一些重要的数据结构 R有多种数据结构.本节将简单介绍几种常用的数据结构,使读者在深入细节之前先对R语言有个大概的认识.这样,读者至少可以开始尝试一些很有意义的例子,即使这些例子背后更多的细节还需要过一段时间才能揭晓.1.4.1 向量,R语言中的战斗机向量类型是R语言的核心.很难想象R语言代码或者R交互式会话可以一点都不涉及向量. 向量的元素必须属于某种"模式"(mode),或者说是数据类型.一个向量可以由三个字符串组成(字符模式),或者由三个整数元素组成(整数模式),

《R语言编程艺术》——1.7　获取帮助

1.7 获取帮助有很多种资源可以帮你学习关于R的更多知识,其中包括R自身的一些工具,当然,还有网上的资料. 开发者们做了很多工作使R更加自文档化.下面我们将介绍一些R内置的帮助工具,以及互联网上的资源.1.7.1 help()函数想获取在线帮助,可调用help().例如,要获取seq()函数的信息,就键入下面的命令: 1.7.2 example()函数每个帮助条目都附带有例子.R的一个非常好用的特性是,example()函数会为你运行例子代码.示例如下: sep()函数可以生成多种等差数值

《R语言编程艺术》——3.4　增加或删除矩阵的行或列

3.4 增加或删除矩阵的行或列严格来说,矩阵的长度和维度是固定的,因此不能增加或删除行或列.但是可以给矩阵重新赋值,这样可以得到和增加或删除一样的效果.3.4.1 改变矩阵的大小回忆之前通过重新赋值改变向量大小的方法: 第一个例子里,x原来长度为5,通过拼接和重新赋值,将其长度变为6.事实上我们没有改变x的长度,而是生成一个新的向量,然后赋值给x. 注意重新赋值的过程可能会在用户看不见的情况下进行,在14章我们将会介绍.例如,即使是x[2]<-12这种小操作事实上都是一个重新赋值的过程.

《R语言编程艺术》——2.12　关于c()的更多内容

2.12 关于c()的更多内容在本节中,我们将讨论与连接函数c()相关的一些其他内容,有时经常用到.如果传递到c()中的参数有不同的类型,则它们将被降级为同一类型,该类型最大限度地保留它们的共同特性,如下所示: 在第一个例子中,我们混合了整数型和字符型,R会选择把它们都转换为后者的类型.在第二个例子中,对于混合的表达式,R认为列表类型有较低的优先级.本书4.3节将对这一点作深入探讨.你可能不会写如此组合的代码,但你可能会遇到发生这种情况的代码,因此理解它的效果显得尤为重要.另一个需要注意的关键

《R语言编程艺术》——1.2　第一个R会话

1.2 第一个R会话用数字1.2.4生成一个简单的数据集(用R的说法就是"向量"),将其命名为x: R语言的标准赋值运算符是<-.也可以用=,不过并不建议用它,因为在有些特殊的情况下它会失灵.注意,变量的类型并不是固定不变的.在这里,我们把一个向量赋值给x,也许之后会把其他类型的值赋给它.我们会在1.4节介绍向量和其他类型.c表示"连接"(英文是concatenate).在这里,我们把数字1.2.4连接起来.更精确地说,连接的是分别包含三个数字的三个一元向量

猜你喜欢

用AJAX调用SOAP Web服务：构建Web服务客户机(3)

ajax|web|web服务|客户机一个简单示例我已经提供了一个示例项目来阐释 Web Services JavaScript Library 的基本功能.该演示所使用的 Web 服务(如清单 1 ...

视觉设计:60个苹果风Web设计案例

优雅的设计贯串苹果所有的产品,也包括网站,不仅苹果自己的网站,世界上有无数模仿苹果的网站设计,然而是什么构成了苹果式网站设计风格?浅淡的配色,大面积留白,清晰统一的导航,雅致的图标,还有,拒绝使用 F ...

.net控件FreeTextBox使用方法

控件 1.先把freetextbox.dll添加到项目中 2.把 - ftb.colorpicker.aspx - ftb.imagegallery.aspx - ftb.inserttable.as ...

C#钩子本线程内消息拦截

钩子其实就是调用一下API而已: 1.安装钩子: SetWindowsHookEx 函数原形:HHOOK SetWindowsHookEx( int idHook, // 钩子类型, HOOKPROC ...

ASP.NET中的XML表单控件

asp.net|xml|控件导读:介绍了有关ASP.NET中XML控件的使用,有个小BUG:在WEBFORM.ASPX中出现的XML控件,其中的transformsource属性设定了样式表文件路 ...

看实例学VFP：利用多个表中的字段创建新表

本例中再来复习一下select语句中的inner join子句的知识,关于select语句请参考:select SQL 命令或sql语言教程.本例的主要操作是在表单的init事件中完成的,在该事件中 ...

瑞星2008防火墙让Vista变成盗版讹传！

近一段时间,有关Windows Vista系统兼容性的问题似乎又有所抬头.有网友称瑞星2008防火墙会造成Windows Vista会被识别为盗版!事情真的是这样吗?我想我们还是一起来看个究竟吧. 首 ...

小巧的多功能播放器CHKen Player

期盼以久的CHKen Player 播放器终于发布了,其特点30KB超小容量,免安装绿色软件,占用资源少,支持多种播放格式,听歌.FLASH.看电影样样都在行.工作带休闲,谁说鱼和熊掌不可兼得. CH ...

稳扎稳打Silverlight(24)

介绍 Silverlight 2.0Socket通信.开发一个多人聊天室服务端:实例化Socket, 绑定, 监听, 连接, 接收数据, 发送数据客户端:实例化Socket, 指定服务端地址, 连 ...

搜狗拼音输入法新手教程

搜狗拼音输入法快速上手指南(1) 怎样进行翻页选字? 搜狗拼音输入法默认的翻页键是"逗号(,)句号(.)",即输入拼音后,按句号(.)进行向下翻页选字,相当于PageDown键,找 ...

网线接头顺序是什么

线的排序一般分为两种标准,一种是568A标准,另外一种则是568B标准,一般我们用的网线也都是最常用的568B标准,其网线接头顺序分别为: 568B标准:橙白,橙,绿白,蓝,蓝白,绿,棕白,棕. ...

地图-编程中的精准定位问题

问题描述编程中的精准定位问题自主编写一个地图软件APP,将来安装到手机上后如何利用手机进行定位,怎么能利用信号放大器实现小区域更精准的定位解决方案分几次定位,第一次粗略定位,第二次准确定位,第 ...

最全的 Twitter Bootstrap 开发资源清单

Bootstrap是Twitter推出的一个开源的用于前端开发的工具包,由Twitter的设计师Mark Otto和Jacob Thornton合作开发.Bootstrap提供了优雅的HTML和CSS ...

项目中需要多次上传文件,怎么实现比较好？

问题描述一个表单内要上传多个文件,如:营业执照:上传,产品证书:上传,产品报告:上传,......上传后我要得到相应的文件地址并保存到数据库,还有比如营业执照只能上传一个文件而证书可以上传多个文件怎 ...

反盗版的胜利：Hackulous关闭

近日,知名破解应用社区 Hackulous 悄然关闭,同时与之伴随的是,AppTrackr. Installous 不再可用,Appsync 停止开发.Hackulous 团队在官网上发布声明,对社区 ...

程序员的量化交易之路（39）--Lean之BacktestingRealTimeHandler回测实时时间事件处理7

</pre>转载需注明出处:<a target=_blank href="http://blog.csdn.net/minimicall?viewmode=contents ...

编程-关于Qt Creator运行库的问题在线等窝心

问题描述关于Qt Creator运行库的问题在线等窝心 C++编程,之前一直在用微软的Visual Studio,然后学到界面编程的时候, 发现用源生的winmain写太累,于是去学MFC, 然 ...

算法入门-第一天-字符串处理

系统:Linux Fedora 22 IDE: CodeBlocks 编译器:gcc 1,TeX中的引号在Tex中,左双引号是" `` ",右双引号是" ' ' &qu ...

站长经验网站的成败往往决定于小细节

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅做网站是件非常累的事,特别是刚开始 ...

网民突破4亿网购需加强信息确认

中国互联网络信息中心(CNNIC)发布了<第26次中国互联网络发展状况统计报告>(以下简称<报告>).<报告>显示,截至2010年6 月底,我国网民规模达4.2亿人 ...

重磅发布：史上首份揭秘微信公众号用户行为习惯研究报告

目录:一.前情提要二:数据来源及样本详情三:用户使用普通微信公众号行为习惯四:用户使用商家微信公众号行为习惯一.前情提要微信已成长为国内最大的超级App,全球拥有超11亿的用户,月活跃用户接近5亿. ...

用asio的定时器实现带超时的connect，备忘

// test.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" #include <boost/asio.hpp&g ...

MySQL metadata lock的前世今生(5.1=>5.7)

最近有同事经常问到一些metadata lock相关的问题,就顺便理一下吧,主要是整理下相关的连接和文档,标题写的有点大 ----------– 最初为了解决著名的bug#989,在MySQL5.5 ...

Javascript学习笔记一之数据类型_基础知识

一.数据类型 Javascript是一种弱类型的脚本语言,它一共有6种数据类型,又被分为基础数据类型,特殊数据类型,复合数据类型. 1.基础数据类型:数值型,字符串型,布尔型 2.特殊数据类型:nul ...

Android 布局文件Layout XML属性_Android

Layout对于迅速的搭建界面和提高界面在不同分辨率的屏幕上的适应性具有很大的作用.这里简要介绍Android的Layout和研究一下它的实现. Android有Layout:FrameLayout ...

我的电脑上怎么.jar文件打不开啊

问题描述我要把sqlJDBC.jar文件导入到myeclipse中,为什么windos无法打开此文件,而且也无法导入啊?怎么解决?怎么导入?求正确详细的方法. 解决方案打开的话用WinRAR就可以 ...

sql server-java 连接不上SQL SERVER!

问题描述 java 连接不上SQL SERVER! import java.sql.*; public class DBOperation { public static void main (Str ...

服务器端集成-添加黑名单（出现service_resource_not_found）

问题描述请求其他接口都正常,也仔细对比了一些参数,暂时没有发现问题,想问问,一般来说这个是什么引起的解决方案可能是用户不存在,你可以先调用rest接口,获取一下这个成员

在这发贴不能发文件吗？

问题描述在这发贴不能发文件吗? 解决方案解决方案二:可以的,在左边"我的资源"里,可以上传文件.解决方案三:帖里面是不能发文件的,发文件要去资源区

使用新买的三星i9308手机打电话时，手机屏幕突然碎裂

刘先生将手机送到青岛威海路三星售后服务中心进行维修时,却被告知,手机屏幕不可能无故碎裂,刘先生要想维修手机,需交纳1600元钱,刘先生认为,手机质量问题导致屏幕碎裂,其维修费不应该由消费者自己掏腰包. ...

热搜

《R语言编程艺术》——2.8 筛选

2.8 筛选

《R语言编程艺术》——2.8 筛选的相关文章

《R语言编程艺术》——2.8　筛选

2.8　筛选

《R语言编程艺术》——2.8　筛选的相关文章