《R语言编程艺术》——3.4　增加或删除矩阵的行或列

3.4　增加或删除矩阵的行或列

严格来说，矩阵的长度和维度是固定的，因此不能增加或删除行或列。但是可以给矩阵重新赋值，这样可以得到和增加或删除一样的效果。
3.4.1　改变矩阵的大小
回忆之前通过重新赋值改变向量大小的方法：

第一个例子里，x原来长度为5，通过拼接和重新赋值，将其长度变为6。事实上我们没有改变x的长度，而是生成一个新的向量，然后赋值给x。
注意　重新赋值的过程可能会在用户看不见的情况下进行，在14章我们将会介绍。例如，即使是x[2]<-12这种小操作事实上都是一个重新赋值的过程。
类似的操作可以用来改变矩阵的大小。例如，函数rbind()（代表row bind，按行组合）和函数cbind()（代表column bind，按列组合）可以给矩阵增加行或列。

这里，cbind()把一列由1组成的向量和z组合在一起，创建了一个新矩阵。上面我们只是直接输出了结果，实际上也可以把这个新的矩阵赋值给z（或其他变量），如下所示：

不过，请谨慎使用cbind()！和创建向量一样，创建一个新的矩阵是很耗时间的（毕竟矩阵也属于向量）。在下面的代码中，cbind()创建了一个新矩阵：

新的矩阵正好被赋值给z，也就是说我们给这个新矩阵取名为z，与原来的矩阵同名，而原来的矩阵被覆盖了）。问题是创建新矩阵会减低程序速度，如果在循环中重复创建矩阵，将浪费大量的时间。
因此在循环中每次往矩阵中添加一行（列），最后矩阵会变成一个大矩阵，这种做法是不可取的，最好一开始就定义好一个大矩阵。这个事先定义的矩阵是空的，但是在循环过程中逐行或列进行赋值，这种做法避免了循环过程中每次进行耗时的矩阵内存分配。
也可以通过重新赋值来删除矩阵的行或列：

3.4.2　扩展案例：找到图中距离最近的一对端点
计算图中多个端点之间距离是计算机或统计学中常见的例子。这类问题在聚类算法和基因问题中经常出现。
我们以计算城市之间的距离为例，这比计算DNA链间距离更直观。
假设有一个距离矩阵，其第i行第j列的元素代表城市i和城市j间的距离。我们需要写一个函数，输入城市距离矩阵，输出城市间最短的距离，以及对应的两个城市。代码如下：

以下是一个调用该函数的例子：

最小值是6，位于在第3行第4列。可以看到apply()函数在这里起重要作用。
我们的任务很简单：找到矩阵中最小的非零元素。首先找到每行中的最小值—仅一个命令apply()即可对所有行达到此目的—然后找到这些最小值中最小的那一个。但如你所见，这段代码的逻辑还是略微有些复杂。
注意一个很关键的地方，这个矩阵是对称的，因为城市i到城市j的距离与从城市j到城市i的距离相等。因此在找第i行最小值时，只需要在第i+1,i+2,……n等元素中搜索（n是矩阵的总列数）。因此在调用apply()时，矩阵d的最后一行是可以跳过不用管的。
由于矩阵可能很大，如果有1000个城市的话，那么矩阵就有100万个元素。所以我们要利用矩阵的对称性来节省时间。但是这样也带来一个问题：在计算每行最小值时，我们需要知道该行在原矩阵中的行号，而apply()函数不能直接提供给它所调用的函数。所以在代码的第6行，我们给原矩阵增加了一列，为相应的行号，目的是让apply()函数所调用的函数能够识别出行号。
apply()所调用的函数是imin()函数，它的定义开始于代码第15行，该函数寻找形式参数x所代表的这一行的最小元素及其所在位置的索引。例如，对例子中矩阵q的第一行调用函数imin()，可求出最小值是8，出现在该行第4列的位置。为求得最小元素的位置，第18行使用了函数which.min()，这是R语言中非常方便的函数。
请注意第19行。之前我们利用矩阵的对称性，在寻找最小值的时候跳过了每行的前半部分，这一点可从第18行表达式中的(i+1):(lx-1)看出。但是这也意味着which.min()返回的最小值的位置索引是相对于范围(i+1): (lx-1)的。例如在q的第三行，尽管第4个元素最小，但是which.min()返回的是1。因此我们需要在which.min()的结果上增加i，如第19行所示。
最后，要正确使用apply()的输出结果需要费点儿功夫。对于上面例子中的矩阵q,apply()函数将会返回一个矩阵wmins:

这个矩阵的第二行包含d矩阵的上三角部分各行最小值，第一行则是这些值的索引。例如wmins的第一列表明，q的第一行中最小值是8，位于第4列。
第9行代码选出整个矩阵最小值所在的行号i，在矩阵q的例子中结果为6。第10行则求出该行最小值在第j列，在矩阵q的例子中结果为4。就是说整个矩阵的最小值在第i行第j列，这个信息在11行将会被用到。
同时，apply()输出结果的第一行是各行最小值所在的列。这样我们就可以找出距离最近的城市分别是什么了。我们已经知道城市3是两个城市之一，而wmins第一行第三列对应的是4，因此城市3和城市4是距离最近的，程序第9行和第10行表示了这一推理过程。
如果该矩阵中最小值是唯一的，那么就有更简单的方法：

这段代码直接找到d的最小元素的所在位置。其中参数arr.ind=TRUE指定，which()函数返回的坐标必须是矩阵下标—也就是行号和列号，而不是一个单一的向量索引。如果没有这个参数，d就会被当作向量来处理。
前面提到过，这段新代码只有当最小值唯一时才有用。如果此条件不成立，which()函数会返回多个行/列数对，与我们的目标相悖。如果我们用原来那版代码，当d有多个最小值时，只会返回其中一个。
另外一个问题是效率。新的代码实质上包含两个（隐性的）循环：一个是计算最小值smallest，另一个是调用which()。因此新的代码会比原来那版更慢。
在这两种方法中，如果特别关注运行速度，并且可能有多个最小值，那么最好选择原来那版代码，否则就选用另一个。而后者的简洁性使之更容易阅读和维护。

时间： 2024-08-29 12:15:21

《R语言编程艺术》——3.4　增加或删除矩阵的行或列

3.4　增加或删除矩阵的行或列

《R语言编程艺术》——3.4　增加或删除矩阵的行或列的相关文章

《R语言编程艺术》——3.1　创建矩阵

《R语言编程艺术》——3.3　对矩阵的行和列调用函数

《R语言编程艺术》——导读

《R语言编程艺术》——1.3　函数入门

《R语言编程艺术》——第2章 2.0 向量

《R语言编程艺术》——2.1　标量、向量、数组与矩阵

《R语言编程艺术》——1.4　R语言中一些重要的数据结构

《R语言编程艺术》——1.7　获取帮助

《R语言编程艺术》——3.5　向量与矩阵的差异

《R语言编程艺术》——3.4 增加或删除矩阵的行或列

3.4 增加或删除矩阵的行或列

《R语言编程艺术》——3.4 增加或删除矩阵的行或列的相关文章

《R语言编程艺术》——3.4　增加或删除矩阵的行或列

3.4　增加或删除矩阵的行或列

《R语言编程艺术》——3.4　增加或删除矩阵的行或列的相关文章