一起谈.NET技术,总结字符串比较函数

  最近一段时间一直在重看CLR via C# , 这次把字符串比较的函数总结下。

  1.Compare和CompareTo大PK

  首先是我们最常用的String.Compare和CompareTo实例方法,先来看看这两个方法:

  我们通过这个可以直观地看到,String的静态方法要比CompareTo多出好多的方法重载,其实这也是两者的最大区别,也就是说String.Compare有着更多的功能选项供我们控制。

  其中主要包含着三个方面:

  A. 文化信息

  B. CompareOptions

  C. 比较的开始和结束位置

  对于文化信息,我们可以看下Compare的反编译结果:

  对于Compare来说,他会通过传递进来的文化信息来调用对应的比较。

  而CompareTo则是:

  CompareTo则会调用与当前线程相关联的文化信息。

  对于文化信息来说,还有着这样一个枚举选项:StringComparison:

  下面让我们来看下StringComparison枚举:

  对于该枚举,共有如上六个枚举值。该枚举主要对应着当前的文化信息,大小写,以及排序规则。

 

  这就意味着,如果我们进行国际化的时候,字符串比较必须使用String.Compare静态方法。

  下面来看下CompareOptions:

  最后看下含开始和结束位置的String.Compare方法:

  方法本身很简单,而方法链的最末端使用的是:

  一个内部比较字符串的非托管方法,而方法的具体内容,我无从而知,但是可以明确的是,这一定是一个高效的比较算法。

  因此,当我们每次SubString的时候,当我们ToLower的时候,我们不妨都在这里使用String.Compare,是不是为我们节省了很多空间,提高了很大效率呢?

  因此,我在这里建议,如果可能,我们尽可能地使用String.Compare方法来代替CompareTo方法!

  2. 被遗忘的CompareOrdinal

  让我们先来看下CompareOrdinal的源码:

private static unsafe int CompareOrdinalHelper(string strA, string strB)
{
    int num = Math.Min(strA.Length, strB.Length);
    int num2 = -1;
    fixed (char* chRef = &strA.m_firstChar)
    {
        fixed (char* chRef2 = &strB.m_firstChar)
        {
            char* chPtr = chRef;
            char* chPtr2 = chRef2;
            while (num >= 10)
            {
                if (*(((int*)chPtr)) != *(((int*)chPtr2)))
                {
                    num2 = 0;
                    break;
                }
                if (*(((int*)(chPtr + 2))) != *(((int*)(chPtr2 + 2))))
                {
                    num2 = 2;
                    break;
                }
                if (*(((int*)(chPtr + 4))) != *(((int*)(chPtr2 + 4))))
                {
                    num2 = 4;
                    break;
                }
                if (*(((int*)(chPtr + 6))) != *(((int*)(chPtr2 + 6))))
                {
                    num2 = 6;
                    break;
                }
                if (*(((int*)(chPtr + 8))) != *(((int*)(chPtr2 + 8))))
                {
                    num2 = 8;
                    break;
                }
                chPtr += 10;
                chPtr2 += 10;
                num -= 10;
            }
            if (num2 == -1)
            {
                goto Label_00F1;
            }
            chPtr += num2;
            chPtr2 += num2;
            int num3 = chPtr[0] - chPtr2[0];
            if (num3 != 0)
            {
                return num3;
            }
            return (chPtr[1] - chPtr2[1]);
        Label_00D7:
            if (*(((int*)chPtr)) != *(((int*)chPtr2)))
            {
                goto Label_00F5;
            }
            chPtr += 2;
            chPtr2 += 2;
            num -= 2;
        Label_00F1:
            if (num > 0)
            {
                goto Label_00D7;
            }
        Label_00F5:
            if (num > 0)
            {
                int num4 = chPtr[0] - chPtr2[0];
                if (num4 != 0)
                {
                    return num4;
                }
                return (chPtr[1] - chPtr2[1]);
            }
            return (strA.Length - strB.Length);
        }
    }
}

  方法很长,但是很简单,即使是Reflector 出来的变量名很BT,但是我们也可以大致看个究竟。

  他是将整个字符串每5个字符(10个字节)分成一组,然后逐个比较,找到第一个不相同的ASCII码后退出循环。并且求出两者的ASCII码的差。不过我很费解的是微软为什么要把这个实现的如此麻烦。只能等到周一再求解了。

  但是在CLR via C#上有这样的话:这个方法比其他方法都要快。我想应该是有一定道理的吧。

  所以当我们比较大小的时候,尽量使用CompareOrdinal方法。

  3. 常用的Equals方法

  先来看Equals实例方法:

  方法会首先进行合法性判断,然后比较两者是否指向同一块引用,接下来调用EqualsHelper方法(不清楚微软为什么很沉迷于XXXHelper这个命名,难道XXXHelper这个名词不应该是一个类名么?)

private static unsafe bool EqualsHelper(string strA, string strB)
{
    int length = strA.Length;
    if (length != strB.Length)
    {
        return false;
    }
    fixed (char* chRef = &strA.m_firstChar)
    {
        fixed (char* chRef2 = &strB.m_firstChar)
        {
            char* chPtr = chRef;
            char* chPtr2 = chRef2;
            while (length >= 10)
            {
                if ((((*(((int*)chPtr)) != *(((int*)chPtr2))) || (*(((int*)(chPtr + 2))) != *(((int*)(chPtr2 + 2))))) || ((*(((int*)(chPtr + 4))) != *(((int*)(chPtr2 + 4)))) || (*(((int*)(chPtr + 6))) != *(((int*)(chPtr2 + 6)))))) || (*(((int*)(chPtr + 8))) != *(((int*)(chPtr2 + 8)))))
                {
                    break;
                }
                chPtr += 10;
                chPtr2 += 10;
                length -= 10;
            }
            while (length > 0)
            {
                if (*(((int*)chPtr)) != *(((int*)chPtr2)))
                {
                    break;
                }
                chPtr += 2;
                chPtr2 += 2;
                length -= 2;
            }
            return (length <= 0);
        }
    }
}

  迷糊了,又是这样的算法,我实在不了解10字节究竟有什么奥秘,周一如果问到答案会对其进行解释。

  然而,值得肯定的是,由于是非安全代码的比较,所以效率要比我们用安全代码高得多。

  接下来看看Equals静态方法:

  (关于==的运算符重载之前有误,下文会解释清楚)

  4. 总结

  本文主要介绍了String类型的比较方法,也留下了一些疑问,也希望可以得到各位的解答。

时间: 2024-09-21 16:07:09

一起谈.NET技术,总结字符串比较函数的相关文章

浅谈C语言的字符串分割_C 语言

说起来很有意思,自认为对C语言理解得还是比较深刻的.但居然到今天才知道有个strtok函数,试用了一下突然感慨以前做了多少重复劳动.每次需要解析配置文件,每次需要分割字符串,居然都是自己去分割字符串,既累人又容易出错.感概技术学得不够全面啊!这里引用一段strtok用法: The strtok() function returns a pointer to the next "token" in str1, where str2 contains the delimiters that

php常用字符串比较函数实例汇总_php技巧

本文实例汇总了php常用字符串比较函数.分享给大家供大家参考.具体分析如下: substr_compare() 函数从指定的开始长度比较两个字符串,该函数返回: 0 - 如果两字符串相等,<0 - 如果 string1 (从开始位置)小于 string2,>0 - 如果 string1 (从开始位置)大于 string2. 语法:substr_compare(string1,string2,startpos,length,case),代码如下: 复制代码 代码如下: $str1="h

php字符串比较函数用法小结(strcmp,strcasecmp,strnatcmp及strnatcasecmp)_php技巧

本文实例分析了php字符串比较函数用法.分享给大家供大家参考,具体如下: 直接比较字符串是否完全一致,可以使用"=="来进行,但是有时候可能需要进行更加复杂的字符串比较,如部分匹配等. 1.strcmp()函数:该函数进行字符串之间的比较,在比较的时候,区分大小写. 声明: strcmp(string str1,string str2)   该函数对传入的两个字符串参数进行比较,如果两个字符串完全相同,则返回0;如果按照字典顺序str1在str2后面,则返回一个正数;如果str1小于s

《创业家》牛文文:少谈点模式多谈点技术

"模式"如同当年的"主义",流行于各种创业大赛.创业励志节目.论坛的"街头"式秀场 文/创业家 牛文文 "美国某某公司你知道吧?就是刚被戴尔.惠普.思科十几亿美元抢购的那家.我们的模式和它的一样,现在还没赢利,可将来起码有十几亿人民币的市值." "我开了小煤矿,但煤运不出去,上商学院之后受到启发,想搞模式创新,具体讲就是想在铁路边上搞个煤炭物流开发区,建一个大的物流和信息流平台,把分散的煤炭集中在我这个园区,这样和铁

浅谈C语言之字符串处理函数_C 语言

下面介绍8种基本的常用的字符串处理函数,在数值数组中也常常用到(部分函数).所有的C语言编译系统中一般都提供这些函数. 1.puts函数--输出字符串的函数  一般的形式为puts(字符串组) 作用:将一个字符串输出到终端.如,char一个string,并赋予初值.调用puts(string);进行字符串的输出. 2.gets函数--输入字符串的函数 一般的形式:gets(字符数组) 作用:从终端输入一个字符串到字符数组,并且得到一个函数值成为字符数组的起始地址. gets(str); 键盘输入

mysql 字符串比较函数

字符串函数 字符串比较函数 假如结果的长度大于 max_allowed_packet 系统变量的最大值时,字符串值函数的返回值为NULL.请参见7.5.2节,"调节服务器参数". 对于在字符串位置操作的函数,第一个位置的编号为 1. ASCII(str) 返回值为字符串str 的最左字符的数值.假如str为空字符串,则返回值为 0 .假如str 为NULL,则返回值为 NULL. ASCII()用于带有从 0到255的数值的字符. mysql> SELECT ASCII('2')

浅谈 DotNet 保护中字符串加密的技术

加密|字符串 学习过了名称混淆,最近又看了一些字符串加密方面的东西.在混淆保护和加密壳中都有字符串加密保护功能. 总体上字符串加密可以分为两类, 第一类是混淆保护中的字符串加密技术.主要特征是修改代码执行路径.大部分混淆保护工具的字符串加密都是这一类. 第二类就是加密壳中的字符串加密技术.这种不用修改IL代码,直接对元数据中的字符串加密.这一类以remotesoft,maxtocode为代表. 先看第一类,加密实现大致如下. 加密前: MessageBox.Show("Hellow World!

一起谈.NET技术,C#中字符串的内存分配与驻留池

刚开始学习C#的时候,就听说CLR对于String类有一种特别的内存管理机制:有时候,明明声明了两个String类的对象,但是他们偏偏却指向同一个实例.如下: String s1 = "Hello";String s2 = "Hello"; //s2和s1的实际值都是Hellobool same = (object) s1 == (object) s2;//这里比较s1.s2是否引用了同一个对象实例//所以不能写作bool same = s1 == s2; //因为

一起谈.NET技术,漫谈.NET开发中的字符串编码

         在< .NET 4.0面向对象编程漫谈>基础篇<13.2.1 序列化与流>中,向大家介绍了如何向流中序列化一个对象.          本篇扩充阅读将向读者介绍将字符串对象的序列化,这里面的关键是字符串应该如何编码和解码为二进制数值,从而可以把它们保存到文件流(FileStream)中,或者通过网络流(NetworkStream)将它们远程发送到另一台计算机上. 1 引子          在实际开发中,经常需要将一些字符串写入到文本文件中,或者从文本文件中读入字