数组排序方法的性能比较（1）：注意事项及试验

昨天有朋友写了一篇文章，其中比较了List<T>的Sort方法与LINQ中排序方法的性能，而最终得到的结果是“LINQ排序方法性能高于 List<T>.Sort方法”。这个结果不禁让我很疑惑。因为 List<T>.Sort方法是改变容器内部元素的顺序，而 LINQ排序后得到的是一个新的序列。假如两个排序方法的算法完全一致，LINQ排序也比对方多出元素复制的开销，为什么性能反而会高？如果LINQ排序的算法/实现更为优秀，那为什么.NET Fx不将List<T>.Sort也一并优化一下呢？于是今天我也对这个问题进行了简单的试验。

注意事项

在后面的评论中有人说，List<T>.Sort是“内部排序”，而LINQ排序是“外部排序”。但是根据外部排序的定义，这个说法是不正确的。“外部排序”是指在排序目标规模太大，导致主存相对太小（如内存）而不够放，不得不利用外部存储（如硬盘）做一些“过渡”的排序方式。因此，LINQ排序虽然生成了新的序列，但还是内部排序。事实上，从定义中我们也可以很容易推断出，如果数据规模相同，外部排序的性能一般总是比内部排序要差——不过事实上我们不太好做这样的比较，因为如果是能够进行内部排序的情况下，谁会利用麻烦的外部排序呢？

那篇文章中得到的结果是不对的，那么问题究竟出在什么地方呢？在我看来，问题主要出在以下两点。

首先，原文作者使用了ASP.NET作为测试环境。值得注意的是，ASP.NET执行.NET代码的时候，使用的是IIS进程中托管的CLR，它的配置和直接运行.NET应用程序时不同（不同的CLR托管方式配置很可能不一样——例如SQL Server里托管的CLR）。例如，ASP.NET中每个线程的调用栈为250K，而直接运行.NET应用程序时这个大小为1M。根据我的经验（也就是说我无法确切地“证明”这个说法），在ASP.NET中执行此类性能测试得到的结果可能很不稳定。因此，一般我建议使用一个最普通的Console应用程序来进行性能测试。

其次，也是更重要的原因，便是原作者只测试了一次排序的性能。这是性能测试中的大忌讳，因为这么做的话误差实在太大。例如，会不会在进行某一个方法的测试时，忽然系统起了一个后台进程进行维护，动用了一部分CPU和内存资源，从而导致测试消耗的时间很冤枉地增加。而且，.NET程序是有一个“预热”过程的，这导致代码在第一次执行时需要有一个生成本机代码的过程（俗称“预热”）。这个过程和代码的执行效率是无关的，因为它无论如何只会产生一次消耗，而代码是会被执行无数次的。因此，在进行测试的时候，一定要将测试目标反复执行N次，至少要让执行耗时到达“秒”级别，这样的结果才有一定参考价值。如果执行时间太少的话测试也可能不准确——要知道“计时器”也是有开销，也是有误差的，我们要得到尽量准确的结果。

最后，我强烈建议使用CodeTimer进行计时，因为在它的Initialize方法中会将当前进程及线程的优先级设置到最高，以此减少其他无关因素所造成的干扰。如果可以的话，其实也应该尽量关闭系统中其他应用程序或服务，并且最好可以断开网络（也是一个道理）。当然Release编译也是一定需要的。而且，如果您一定需要使用ASP.NET 进行性能测试的话，也千万记得要在web.config中将<compilation /> 节点的debug属性设为false——考虑到原作者忽略了之前犯了很明显的忌讳，我强烈怀疑这点也没有满足。:)

因此，我认为那篇文章中的测试结果是不准确的，参考价值很低。

时间： 2025-01-26 14:37:09

数组排序方法的性能比较（1）：注意事项及试验

数组排序方法的性能比较（1）：注意事项及试验的相关文章

数组排序方法的性能比较（上）：注意事项及试验

艾伟_转载：数组排序方法的性能比较（上）：注意事项及试验

数组排序方法的性能比较（中）：Array.Sort 实现分析

一起谈.NET技术，数组排序方法的性能比较（中）：Array.Sort<T> 实现分析

艾伟_转载：数组排序方法的性能比较（中）：Array.Sort<T> 实现分析

一起谈.NET技术，数组排序方法的性能比较（3）：LINQ排序实现分析

数组排序方法的性能比较（5）：对象大小与排序性能

数组排序方法的性能比较（4）：LINQ方式的Array排序

数组排序方法的性能比较（3）：LINQ排序实现分析