继续不简单的数据类型。
昨天没有继续“动笔”,倒是萌发了阅读《东周列国志》的念头,并且看了两章Joel写的《软件随想录》,颇有几分感触。今天再次回到巩固所学的路途上。
在操作系统中,有一种思想或者技术叫“覆盖”,利用的是某个运行时间段内函数(或其它占据内存的载体)不共存的现象。比如在下表中,main可以调用l-fun()或者r-fun(),但不会同时调用二者;同样地,ll-fun()和rr-fun()也不会共存在同一时间段内。也就是说l-fun()和ll-fun()是main的左子孙,而r-fun()和rr-fun()是main的右子孙,形成了一棵活动树,就有了一种结点间消亡顺序关系:某结点的左兄弟(如果有的话)总是先于该结点消亡,对应于活动记录先出栈(见篇一http://blog.csdn.net/jasonblog/archive/2010/01/27/5261634.aspx)。
主函数main |
|
l-fun(); |
r-fun(); |
ll-fun(); |
rr-fun(); |
既然l-fun和r-fun不共存,那么取memSize
= max(l-fun.memSize, r-fun.memSize),即取二者中占内存更大者的内存所需大小,就可以使得二者共用一片内存;ll-fun和rr-fun也同理。
这种思想让我不由自主地联想起了共用体和共享内存。
共用体与结构体类似,但是结构体内的成员变量都有独立的内存空间,而共用体是所有成员变量公用一片内存空间,其大小与内存需求最大的成员变量所需相等,并且每次对共用体成员进行访问,都是取其首地址。二者区别见下表:
结构体:
…… |
num |
score |
str |
…… |
共用体:
…… |
num,score,str |
…… |
也可以换种方式,用代码来看:
#include <stdio.h> struct sData { int num; floatscore; charstr[20]; }; union uData { int num; floatscore; charstr[20]; }; int main(int argc, char *argv[]){ structsData sVar1; unionuData uVar1; printf("%d,%d/n",sizeof(sVar1) ,sizeof(uVar1)); printf("%02x/t",&sVar1.num); printf("%02x/t",&sVar1.score); printf("%02x/n",sVar1.str); printf("%02x/t",&uVar1.num); printf("%02x/t",&uVar1.score); printf("%02x/n",uVar1.str); return 0; }
上述代码的输出如下:
28,20
12f3a4 12f3a8 12f3ac
12f3c0 12f3c0 12f3c0
从输出可以看出,一是在多成员变量的情况下,共用体所需的内存空间大小相对结构体来讲要小;二是结构体每个成员都有独立的内存空间(即有独立的首地址),而共用体所有成员变量的首地址是一样的,如在上例中都为12f3c0。
共用体的一个应用让我印象十分深刻,那就是PHP弱类型的实现。以下两段代码形成了一定的联系和对比:
代码一:
#include <stdio.h> #include <string.h> union uData { int num; floatscore; charstr[20]; }; int main(int argc, char*argv[]){ unionuData var; var.num = 1; var.score = 1.1; strcpy(var.str, "hello"); return 0; }
代码二:
<?php $var = 1; $var = 1.1; $var= "hello";
我是通过这样的比较来初步在自己的脑海里建立起如何用强类型的C语言来实现弱类型的PHP语言。若要继续深入一点,则要揭开一点点zend.h的幕纱。
在php中,变量的信息统一用一个结构体_zval_struct来保存,以下是摘自5.3.1源码的代码片段:
struct_zval_struct { /* Variableinformation */ zvalue_value value; /* value */ zend_uint refcount__gc; zend_uchar type; /* active type */ zend_uchar is_ref__gc; };
而由注释可以知道保存变量值的是value,它是一个zvalue_value类型的变量。该类型的定义在zend.h中的位置刚好是在_zval_struct上方:
typedef union _zvalue_value { longlval; /* long value */ doubledval; /* double value */ struct { char*val; intlen; } str; HashTable *ht; /* hash tablevalue */ zend_object_value obj; }zvalue_value;
显然可以知道zvalue_value是一个共用体类型的变量。这就是关于强类型C语言如何实现弱类型PHP语言的一点点粗浅知识,但是就是这点粗浅的知识给我的印象却是十分深刻,让我觉得设计思想十分重要,也是我十分欠缺的。
共用体就暂时告一段落,转向C语言中经典类型:指针。
在我的理解中,内存就像一栋楼房,每间楼房就好比内存单元,门牌号好比内存地址,楼房内的事物就是内存单元存储的内容,而指针,便如门牌号。举个例子,比如我们有这么一句声明:int *p;
这就表示我们向物业要了一间专门存放门牌号的房间,并且这个房间里面存放的门牌号都必须指向存放int类型数据的房间。
以下是几种指针类型:
int *p;
表示p是指针,该指针指向int类型的变量。
int * *p;
表示p是指针,该指针指向指针变量,且后者为指向int类型变量的指针。
int *p[5];
表示数组p中的元素为指针。
int (*p)[5];表示p为指针,指向类似a[][5]这样的二维数组。
int *f();
表示f是一个函数,该函数返回一个指针类型的值。
int (*f)();
表示f是一个指针,该指针指向一个函数入口。
相对于共用体给我那个印象深刻的应用,指针也留下了一个不浅的足迹,那就是一堆括号、void、函数以及指针的结合:(*(void(*)()
)0)() 。第一次见到它那种被震撼到的心情此时仍记忆犹新,真是令人头皮发麻啊!在此不妨先引入一个法则:
The right-left rule:
Start reading the declarationfrom the innermost parentheses, go right, and then go left. When you encounterparentheses, the direction should
be reversed. Once everything in theparentheses has been parsed, jump out of it. Continue till the wholedeclaration has been parsed.
以上是判断指针类型的有效手段,大致意思就是从最里的括号开始,先右后左开始解析,遇到括号则转向。我们以上述例子来进行分析。
首先,往最里面的括号看可以看到“(*)”,我们可以初步知道这个括号表示一个指针;接着跳出去,先往右再往左瞧可以分析出“(*)()”,对照上面几种指针类型,我们可以进一步知道这个指针指向一个函数入口;继续right-left,可以匹配出“(void
(*)())”来,可以了解到指针指向的函数返回值为void类型;接下来的一步我们小心点地向右看,可以看到数字0,这意味着将数字0强制转换为一个指向返回值为void类型的函数入口的指针(有点拗口^_^),遇到括号后我们再返回来往左看,可以看到星号“*”,而星号放在指针前面是表示取指针变量指向的内容,于是到这个时候我们获得了函数入口地址(这个入口地址为0);继而在最后,我们可以知道整个表达式的功能是调用入口地址为0的函数!为了更深刻地理解,依旧以代码形式进行了解。
首先,看如下代码:
#include <stdio.h> void greet(){ printf("hello/n"); } int main(int argc, char*argv[]){ void(*fp)(); fp = greet; (*fp)(); //缩写为:fp(); printf("%02x/n",*fp); //同上,这里也可以缩写为:printf("%02x/n", fp); return 0; }
上述fp是一个指向函数入口的指针,存放的是函数的入口地址,所以*fp为函数的入口地址。接着模仿那个令人发麻的表达式修改一下代码:
#include <stdio.h> void greet(){ printf("hello/n"); } int main(int argc, char*argv[]){ void(*fp)(); fp = greet; (*fp)(); //缩写为:fp(); printf("%02x/n",*fp); //这里输出函数的入口地址,即*fp的内容 (*(void(*)())(*fp))(); //!!注意这里 return 0; }
运行的结果如下:
hello
401050
hello
可见程序调用了两次greet函数,一次是通过fp指针获取入口地址进而调用,另一次则是仿造那个“神奇”的表达式。^_^
2010-1-29
晚
----------------------------------------cuttingline----------------------------------------