1.11 系统调用和库函数
所有的操作系统都提供多种服务的入口点,由此程序向内核请求服务。各种版本的UNIX实现都提供良好定义、数量有限、直接进入内核的入口点,这些入口点被称为系统调用(system call,见图1-1)。Research UNIX系统第7版提供了约50个系统调用,4.4BSD提供了约110个系统调用,而SVR4则提供了约120个系统调用。具体数字在不同操作系统版本中会不同,新近的大多数系统大大增加了支持的系统调用的个数。Linux 3.2.0提供了380个系统调用,FreeBSD 8.0提供的系统调用超过450个。
系统调用接口总是在《UNIX程序员手册》的第2部分中说明,是用C语言定义的,与具体系统如何调用一个系统调用的实现技术无关。这与很多早期的操作系统不同,那些系统按传统方式用机器的汇编语言定义内核入口点。
UNIX所使用的技术是为每个系统调用在标准C库中设置一个具有同样名字的函数。用户进程用标准C调用序列来调用这些函数,然后,函数又用系统所要求的技术调用相应的内核服务。例如,函数可将一个或多个C参数送入通用寄存器,然后执行某个产生软中断进入内核的机器指令。从应用角度考虑,可将系统调用视为C函数。
《UNIX程序员手册》的第3部分定义了程序员可以使用的通用库函数。虽然这些函数可能会调用一个或多个内核的系统调用,但是它们并不是内核的入口点。例如,printf函数会调用write系统调用以输出一个字符串,但函数strcpy(复制一个字符串)和atoi(将ASCII转换为整数)并不使用任何内核的系统调用。
从实现者的角度来看,系统调用和库函数之间有根本的区别,但从用户角度来看,其区别并不重要。在本书中,系统调用和库函数都以C函数的形式出现,两者都为应用程序提供服务。但是,我们应当理解,如果希望的话,我们可以替换库函数,但是系统调用通常是不能被替换的。
以存储空间分配函数malloc为例。有多种方法可以进行存储空间分配及与其相关的无用空间回收操作(最佳适应、首次适应等),并不存在对所有程序都最优的一种技术。UNIX系统调用中处理存储空间分配的是sbrk(2),它不是一个通用的存储器管理器。它按指定字节数增加或减少进程地址空间。如何管理该地址空间却取决于进程。存储空间分配函数malloc(3)实现一种特定类型的分配。如果我们不喜欢其操作方式,则可以定义自己的malloc函数,它很可能将使用sbrk系统调用。事实上,有很多软件包,它们使用sbrk系统调用实现自己的存储空间分配算法。图1-11显示了应用程序、malloc函数以及sbrk系统调用之间的关系。
从中可见,两者职责不同,内核中的系统调用分配一块空间给进程,而库函数malloc则在用户层次管理这一空间。
另一个可说明系统调用和库函数之间差别的例子是,UNIX系统提供的判断当前时间和日期的接口。一些操作系统分别提供了一个返回时间的系统调用和另一个返回日期的系统调用。任何特殊的处理,例如正常时制和夏令时之间的转换,由内核处理或要求人为干预。UNIX系统则不同,它只提供一个系统调用,该系统调用返回自协调世界时1970年1月1日零时这个特定时间以来所经过的秒数。对该值的任何解释,例如将其变换成人们可读的、适用于本地时区的时间和日期,都留给用户进程进行处理。在标准C库中,提供了若干例程以处理大多数情况。这些库函数处理各种细节,如各种夏令时算法等。
应用程序既可以调用系统调用也可以调用库函数。很多库函数则会调用系统调用。图1-12显示了这种差别。
系统调用和库函数之间的另一个差别是:系统调用通常提供一种最小接口,而库函数通常提供比较复杂的功能。我们从sbrk系统调用和malloc库函数之间的差别中可以看到这一点。当我们比较不带缓冲的I/O函数(见第3章)和标准I/O函数(见第5章)时,还将看到这种差别。
进程控制系统调用(fork、exec和wait)通常由用户应用程序直接调用(请回忆图1-7中的基本shell)。但是为了简化某些常见的情况,UNIX系统也提供了一些库函数,如system和popen。8.13节将说明system函数的一种实现,它使用基本的进程控制系统调用。10.18节还将强化这一实例以正确地处理信号。
为使读者了解大多数程序员应用的UNIX系统接口,我们不得不既说明系统调用,又介绍某些库函数。例如,若只描述sbrk系统调用,那么就会忽略很多应用程序使用的malloc库函数。本书除了必须要区分两者时,对系统调用和库函数都使用函数(function)这一术语来表示。