1.5 字符与字符串
C语言中的单引号和双引号含义迥异,在某些情况下如果把两者弄混,编译器并不会检测报错,从而在运行时产生难以预料的结果。
用单引号引起的一个字符实际上代表一个整数,整数值对应于该字符在编译器采用的字符集中的序列值。因此,对于采用ASCII字符集的编译器而言,'a'的含义与0141(八进制)或者97(十进制)严格一致。
用双引号引起的字符串,代表的却是一个指向无名数组起始字符的指针,该数组被双引号之间的字符以及一个额外的二进制值为零的字符'0'初始化。
下面的这个语句:
printf ("Hello world\n");
与
char hello[] = {'H', 'e', 'l', 'l', 'o', ' ',
'w', 'o', 'r', 'l', 'd', '\n', 0};
printf (hello);
是等效的。
因为用单引号括起的一个字符代表一个整数,而用双引号括起的一个字符代表一个指针,如果两者混用,那么编译器的类型检查功能将会检测到这样的错误。例如:
char *slash = '/';
在编译时将会生成一条错误消息,因为'/'并不是一个字符指针。然而,某些C编译器对函数参数并不进行类型检查,特别是对printf函数的参数。因此,如果用
printf('\n');
来代替正确的
printf("\n");
则会在程序运行的时候产生难以预料的错误,而不会给出编译器诊断信息。本书的4.4节还详细讨论了其他情形。
译注:
现在的编译器一般能够检测到在函数调用时混用单引号和双引号的情形。
整型数(一般为16位或32位)的存储空间可以容纳多个字符(一般为8位),因此有的C编译器允许在一个字符常量(以及字符串常量)中包括多个字符。也就是说,用'yes'代替"yes"不会被该编译器检测到。后者(即"yes")的含义是“依次包含'y'、'e'、's'以及空字符'0'的4个连续内存单元的首地址”。前者(即'yes')的含义并没有准确地进行定义,但大多数C编译器理解为,“一个整数值,由'y'、'e'、's'所代表的整数值按照特定编译器实现中定义的方式组合得到”。因此,这两者如果在数值上有什么相似之处,也完全是一种巧合而已。
译注:
在Borland C++ v5.5和LCC v3.6中采取的做法是,忽略多余的字符,最后的整数值即第一个字符的整数值;而在Visual C++ 6.0和GCC v2.95中采取的做法是,依次用后一个字符覆盖前一个字符,最后得到的整数值即最后一个字符的整数值。
练习1-1. 某些C编译器允许嵌套注释。请写一个测试程序,要求:无论是对允许嵌套注释的编译器,还是对不允许嵌套注释的编译器,该程序都能正常通过编译(无错误消息出现),但是这两种情况下程序执行的结果却不相同。
提示:
在用双引号括起的字符串中,注释符 /*属于字符串的一部分,而在注释中出现的双引号" "又属于注释的一部分。
练习1-2. 如果由你来实现一个C编译器,你是否会允许嵌套注释?如果你使用的C编译器允许嵌套注释,你会用到编译器的这一特性吗?你对第二个问题的回答是否会影响到你对第一个问题的回答?
练习1-3. 为什么n-->0的含义是n-- > 0,而不是n- -> 0?
练习1-4. a+++++b的含义是什么?