《C陷阱与缺陷》一1.3 词法分析中的“贪心法”

1.3 词法分析中的“贪心法”

C语言的某些符号,例如/ 、 、和=,只有一个字符长,称为单字符符号。而C语言中的其他符号,例如/和 = = ,以及标识符,包括了多个字符,称为多字符符号。当C编译器读入一个字符'/'后又跟了一个字符'*',那么编译器就必须做出判断:是将其作为两个分别的符号对待,还是合起来作为一个符号对待。C语言对这个问题的解决方案可以归纳为一个很简单的规则:每一个符号应该包含尽可能多的字符。也就是说,编译器将程序分解成符号的方法是,从左到右一个字符一个字符地读入,如果该字符可能组成一个符号,那么再读入下一个字符,判断已经读入的两个字符组成的字符串是否可能是一个符号的组成部分;如果可能,继续读入下一个字符,重复上述判断,直到读入的字符组成的字符串已不再可能组成一个有意义的符号。这个处理策略有时被称为“贪心法”,或者,更口语化一点,称为“大嘴法”。Kernighan与Ritchie对这个方法的表述如下,“如果(编译器的)输入流截止至某个字符之前都已经被分解为一个个符号,那么下一个符号将包括从该字符之后可能组成一个符号的最长字符串。”

需要注意的是,除了字符串与字符常量,符号的中间不能嵌有空白(空格符、制表符和换行符)。例如,= =是单个符号,而= = 则是两个符号,下面的表达式

a---b

与表达式

a -- - b

的含义相同,而与

a - -- b

的含义不同。同样地,如果/是为判断下一个符号而读入的第一个字符,而/之后紧接着,那么无论上下文如何,这两个字符都将被当作一个符号/,表示一段注释的开始。

根据代码中注释的意思,下面的语句的本意似乎是用x除以p所指向的值,把所得的商再赋给y:

y = x/p    / p指向除数*/;

而实际上,/被编译器理解为一段注释的开始,编译器将不断地读入字符,直到/出现为止。也就是说,该语句直接将x的值赋给y,根本不会顾及到后面出现的p。将上面的语句重写如下:

y = x / p   / p指向除数 */;

或者更加清楚一点,写作:

y = x/(p)   / p指向除数 */;

这样得到的实际效果才是语句注释所表示的原意。

诸如此类的准二义性(near-ambiguity)问题,在有的上下文环境中还有可能招致麻烦。例如,老版本的C语言中允许使用=+来代表现在+=的含义。这种老版本的C编译器会将

a=-1;

理解为下面的语句

a =- 1;

亦即

a = a - 1;

因此,如果程序员的原意是

a = -1;

那么所得结果将使其大吃一惊。

另一方面,尽管/*看上去像一段注释的开始,在下例中这种老版本的编译器会将

a=/*b;

当作

a =/ *b ;

这种老版本的编译器还会将复合赋值视为两个符号,因而可以毫无疑问地处理

a >> = 1;

而一个严格的ANSI C编译器则会报错。

时间: 2024-09-02 08:50:47

《C陷阱与缺陷》一1.3 词法分析中的“贪心法”的相关文章

C陷阱与缺陷阅读笔记

本文主要记录<C陷阱与缺陷>第三章中的一些知识. 一.指针与数组: C语言数组特点: (1)C语言中只有一维数组,而且数组的大小必须在编译期就作为一个常数确定下来.由于数组的元素可以是任何类型的对象,当然也可是另外一个数组.这样,要"仿真"出一个多维数组就不是一件难事. (2)对于一个数组,我们只能够做两件事:确定该数组的大小,以及获得指向改数组下标为0的元素的指针.其他有关数组的操作,哪怕他们乍看上去是以数组下标进行运算的,实际上都是通过指针进行的.换句话说,任何一个数组

《C陷阱与缺陷》一第0章 导读

第0章 导读 C陷阱与缺陷我的第一个计算机程序写于1966年,是用Fortran语言开发的.该程序需要完成的任务是计算并打印输出10 000以内的所有Fibonacci数,也就是一个包括1,1,2,3,5,8,13,21,--等元素的数列,其中第2个数字之后的每个数字都是前两个数字之和.当然,写程序代码很难第一次就顺利通过编译: I = 0 J = 0 K = 1 1 PRINT 10,K I = J J = K K = I + J IF (K - 10000) 1, 1, 2 2 CALL E

《C陷阱与缺陷》一导读

前 言 C陷阱与缺陷对于经验丰富的行家而言,得心应手的工具在初学时的困难程度往往要超过那些容易上手的工具.刚刚接触飞机驾驶的学员,初航时总是谨小慎微,只敢沿着海岸线来回飞行,等他们稍有经验就会明白这样的飞行其实是一件多么轻松的事.初学骑自行车的新手,可能觉得后轮两侧的辅助轮很有帮助,但一旦熟练过后,就会发现它们很是碍手碍脚. 这种情况对程序设计语言也是一样.任何一种程序设计语言,总存在一些语言特性,很可能会给还没有完全熟悉它们的人带来麻烦.令人吃惊的是,这些特性虽然因程序设计语言的不同而异,但对

《C陷阱与缺陷》——总结

本文主要总结自己看完<C陷阱与缺陷>这本书后的感想. 总的来说,在看的过程中遇到一些知识点的时候,深入的去查询资料,去了解稳重的实质,会让你有一种知识点上的明悟. 本书1-3章,从词法,语法,语义三方面阐述了C中的缺陷和陷阱,对于C和C++者来说可以获得很多新的东西,规避一些自己平时忽略的东西. 本书4-7章,所讲的东西与编译器的联系太过紧密,很多东西对于现在的编译器来说都,都能够胜任,而不需要读者去考虑.故本博客所写<C陷阱与缺陷>系列文章主要为1-3章内容还有第6章内容. 第四

《C陷阱与缺陷》一第1章 词法“陷阱”1.1 =不同于==

第1章 词法"陷阱" C陷阱与缺陷当我们阅读一个句子时,我们并不去考虑组成这个句子的单词中单个字母的含义,而是把单词作为一个整体来理解.确实,字母本身并没有什么意义,我们总是将字母组成单词,然后给单词赋予一定的意义. 对于用C语言或其他语言编写的程序,道理也是一样的.程序中的单个字符孤立来看并没有什么意义,只有结合上下文才有意义.因此,在p->s = "->";这个语句中,两处出现的'-'字符的意义大相径庭.更精确地说,上式中出现的两个'-'字符分别是不

C陷阱与缺陷

1.     <C陷阱与缺陷> int num[10]={0} ;   测试一下 num[0]  是否 等于 0[num]  ......   因为num是首地址   num+0 ==0+num 2. 其实C中只有一维数组   我们所说的 int a[3][4]   只是一个包含了三个元素  每个元素都是包含了四个整形值的一维数组     3.int  num[10][10]  ;  int *p=num[0]  ; 名为num的数组中 num[0]-num[9]表示的是 每个长度为10的一维

程序员老司机们都要错的Python陷阱与缺陷列表

我个人对陷阱的定义是这样的:代码看起来可以工作,但不是以你"想当然""的方式.如果一段代码直接出错,抛出了异常,我不认为这是陷阱.比如,Python程序员应该都遇到过的"UnboundLocalError", 示例: >>> a=1  >>> def func():  ...     a+=1  ...     print a  ...  >>> func()  Traceback (most rece

程序员必知的Python陷阱与缺陷列表

我个人对陷阱的定义是这样的:代码看起来可以工作,但不是以你"想当然""的方式.如果一段代码直接出错,抛出了异常,我不认为这是陷阱.比如,Python程序员应该都遇到过的"UnboundLocalError", 示例: >>> a=1    >>> def func():    ...     a+=1    ...     print a    ...    >>> func()    Tracebac

《C陷阱与缺陷》一1.2 &amp;和 | 不同于&amp;&amp;和 ||

1.2 &和 | 不同于&&和 || 很多其他语言都使用=作为比较运算符,因此很容易误将赋值运算符=写成比较运算符= =.同样地,将按位运算符&与逻辑运算符&&,或者将按位运算符 | 与逻辑运算符 || 调换,也是很容易犯的错误.特别是C语言中按位与运算符&和按位或运算符 | ,与某些其他语言中的按位与运算符和按位或运算符在表现形式上完全不同(如Pascal语言中分别是and和or),更容易让程序员因为受到其他语言的影响而犯错.关于这些运算符精确含义