【图解】Linux下C程序进程地址空间布局 .

作者：沧海猎人出处：http://blog.csdn.net/embedded_hunter 转载请注明出处嵌入式技术交流QQ群：179012822

我们在学习C程序开发时经常会遇到一些概念：代码段、数据段、BSS段（Block Started by Symbol）、堆（heap）和栈（stack）。先看一张教材上的示意图（来源，《UNIX环境高级编程》一书），显示了进程地址空间中典型的存储区域分配情况。

从图中可以看出：

从低地址到高地址分别为：代码段、（初始化）数据段、（未初始化）数据段（BSS）、堆、栈、命令行参数和环境变量
堆向高内存地址生长
栈向低内存地址生长

还经常看到下面这个图（来源，不详）：

先看一段程序。

#include <stdio.h>
#include <stdlib.h>

int global_init_a=1;
int global_uninit_a;
static int static_global_init_a=1;
static int static_global_uninit_a;
const int const_global_a=1;

int global_init_b=1;
int global_uninit_b;
static int static_global_init_b=1;
static int static_global_uninit_b;
const int const_global_b=1;
/*上面全部为全局变量，main函数中的为局部变量*/
int main()
{
	int local_init_a=1;
	int local_uninit_a;
	static int static_local_init_a=1;
	static int static_local_uninit_a;
	const int const_local_a=1;

	int local_init_b=1;
	int local_uninit_b;
	static int static_local_init_b=1;
	static int static_local_uninit_b;
	const int const_local_b=1;

	int * malloc_p_a;
	malloc_p_a=malloc(sizeof(int));

	printf("\n         &global_init_a=%p \t
         global_init_a=%d\n",&global_init_a,global_init_a);	

	printf("       &global_uninit_a=%p \t
        global_uninit_a=%d\n",&global_uninit_a,global_uninit_a);	

	printf("  &static_global_init_a=%p \t
        static_global_init_a=%d\n",&static_global_init_a,static_global_init_a);

	printf("&static_global_uninit_a=%p \t
        static_global_uninit_a=%d\n",&static_global_uninit_a,static_global_uninit_a);

	printf("        &const_global_a=%p \t
        const_global_a=%d\n",&const_global_a,const_global_a);	

	printf("\n         &global_init_b=%p \t
        global_init_b=%d\n",&global_init_b,global_init_b);	

	printf("       &global_uninit_b=%p \t
        global_uninit_b=%d\n",&global_uninit_b,global_uninit_b);	

	printf("  &static_global_init_b=%p \t
        static_global_init_b=%d\n",&static_global_init_b,static_global_init_b);

	printf("&static_global_uninit_b=%p \t
        static_global_uninit_b=%d\n",&static_global_uninit_b,static_global_uninit_b);

	printf("        &const_global_b=%p \t
        const_global_b=%d\n",&const_global_b,const_global_b);

	printf("\n          &local_init_a=%p \t
        local_init_a=%d\n",&local_init_a,local_init_a);	

	printf("        &local_uninit_a=%p \t
        local_uninit_a=%d\n",&local_uninit_a,local_uninit_a);

	printf("   &static_local_init_a=%p \t
        static_local_init_a=%d\n",&static_local_init_a,static_local_init_a);

	printf(" &static_local_uninit_a=%p \t
        static_local_uninit_a=%d\n",&static_local_uninit_a,static_local_uninit_a);	

	printf("         &const_local_a=%p \t
        const_local_a=%d\n",&const_local_a,const_local_a);	

	printf("\n          &local_init_b=%p \t
        local_init_b=%d\n",&local_init_b,local_init_b);	

	printf("        &local_uninit_b=%p \t
        local_uninit_b=%d\n",&local_uninit_b,local_uninit_b);

	printf("   &static_local_init_b=%p \t
        static_local_init_b=%d\n",&static_local_init_b,static_local_init_b);

	printf(" &static_local_uninit_b=%p \t
        static_local_uninit_b=%d\n",&static_local_uninit_b,static_local_uninit_b);	

	printf("         &const_local_b=%p \t
        const_local_b=%d\n",&const_local_b,const_local_b);

	printf("             malloc_p_a=%p \t
        *malloc_p_a=%d\n",malloc_p_a,*malloc_p_a);

	return 0;
}

下面是输出结果。

先仔细分析一下上面的输出结果，看看能得出什么结论。貌似很难分析出来什么结果。好了我们继续往下看吧。

接下来，通过查看proc文件系统下的文件，看一下这个进程的真实内存分配情况。（我们需要在程序结束前加一个死循环，不让进程结束，以便我们进一步分析）。

在return 0前，增加 while(1); 语句

重新编译后，运行程序，程序将进入死循环。

使用ps命令查看一下进程的pid

#ps -aux | grep a.out

查看/proc/2699/maps文件，这个文件显示了进程在内存空间中各个区域的分配情况。

#cat /proc/2699/maps

上面红颜色标出的几个区间是我们感兴趣的区间：

08048000-08049000 r-xp 貌似是代码段
08049000-0804a000 r--p 暂时不清楚，看不出来
0804a000-0804b000 rw-p 貌似为数据段
08a7e000-08a9f000 rw-p 堆
bff73000-bff88000 rw-p 栈

我们把这些数据与刚才的程序运行结果进行比较，看看有什么结论。

                &global_init_a=0x804a018       全局初始化：数据段            global_init_a=1
            &global_uninit_a=0x804a04c      全局未初始化：数据段       global_uninit_a=0
     &static_global_init_a=0x804a01c      全局静态初始化：数据段    static_global_init_a=1
&static_global_uninit_a=0x804a038      全局静态未初始化：数据段    static_global_uninit_a=0
             &const_global_a=0x80487c0    全局只读变量：代码段        const_global_a=1

               &global_init_b=0x804a020       全局初始化：数据段      global_init_b=1
            &global_uninit_b=0x804a048       全局未初始化：数据段      global_uninit_b=0
    &static_global_init_b=0x804a024      全局静态初始化：数据段    static_global_init_b=1
&static_global_uninit_b=0x804a03c        全局静态未初始化：数据段   static_global_uninit_b=0
            &const_global_b=0x80487c4        全局只读变量：代码段             const_global_b=1

                 &local_init_a=0xbff8600c          局部初始化：栈                     local_init_a=1
             &local_uninit_a=0xbff86008         局部未初始化：栈                 local_uninit_a=134514459
     &static_local_init_a=0x804a028         局部静态初始化：数据段      static_local_init_a=1
&static_local_uninit_a=0x804a040        局部静态未初始化：数据段    static_local_uninit_a=0
           &const_local_a=0xbff86004        局部只读变量：栈     const_local_a=1

                  &local_init_b=0xbff86000        局部初始化：栈         local_init_b=1
                &local_uninit_b=0xbff85ffc         局部未初始化：栈       local_uninit_b=-1074241512
     &static_local_init_b=0x804a02c        局部静态初始化：数据段      static_local_init_b=1
&static_local_uninit_b=0x804a044        局部静态未初始化：数据段      static_local_uninit_b=0
                &const_local_b=0xbff85ff8        局部只读变量：栈       const_local_b=1

p_chars=0x80487c8 字符串常量：代码段 p_chars=abcdef
malloc_p_a=0x8a7e008 malloc动态分配：堆 *malloc_p_a=0

通过以上分析我们暂时可以得到的结论如下，在进程的地址空间中：

数据段中存放：全局变量（初始化以及未初始化的）、静态变量（全局的和局部的、初始化的以及未初始化的）
代码段中存放：全局只读变量（const）、字符串常量
堆中存放：动态分配的区域
栈中存放：局部变量（初始化以及未初始化的，但不包含静态变量）、局部只读变量（const）

这里我们没有发现BSS段，但是我们将未初始化的数据按照地址进行排序看一下，可以发现一个规律。

                &global_init_a=0x804a018       全局初始化：数据段            global_init_a=1
    &static_global_init_a=0x804a01c      全局静态初始化：数据段    static_global_init_a=1
                &global_init_b=0x804a020       全局初始化：数据段      global_init_b=1
    &static_global_init_b=0x804a024      全局静态初始化：数据段    static_global_init_b=1
     &static_local_init_a=0x804a028         局部静态初始化：数据段      static_local_init_a=1
     &static_local_init_b=0x804a02c        局部静态初始化：数据段      static_local_init_b=1

&static_global_uninit_a=0x804a038      全局静态未初始化：数据段    static_global_uninit_a=0
&static_global_uninit_b=0x804a03c        全局静态未初始化：数据段   static_global_uninit_b=0
  &static_local_uninit_a=0x804a040        局部静态未初始化：数据段    static_local_uninit_a=0
  &static_local_uninit_b=0x804a044        局部静态未初始化：数据段      static_local_uninit_b=0
           &global_uninit_b=0x804a048       全局未初始化：数据段      global_uninit_b=0
            &global_uninit_a=0x804a04c      全局未初始化：数据段       global_uninit_a=0

这里可以发现，初始化的和未初始化的数据好像是分开存放的，因此我们可以猜测BSS段是存在的，只不过数据段是分为初始化和未初始化（即BSS段）的两部分，他们在加载到进程地址空间时是合并为数据段了，在进程地址空间中没有单独分为一个区域。

还有一个问题，静态数据与非静态数据是否是分开存放的呢？请读者自行分析一下。

接下来我们从程序的角度看一下，这写存储区域是如何分配的。首先我们先介绍一下ELF文件格式。

ELF（Executable and Linkable Format ）文件格式是一个开放标准，各种UNIX系统的可执行文件都采用ELF格式，它有三种不同的类型：

–可重定位的目标文件（Relocatable，或者Object File）

–可执行文件（Executable）

–共享库（Shared Object，或者Shared Library）

下图为ELF文件的结构示意图（来源，不详）：

一个程序编译生成目标代码文件（ELF文件）的过程如下，此图引自《程序员的自我修养》一书的一个图：

可以通过readelf命令查看EFL文件的相关信息，例如 readelf -a a.out ，我们只关心各个段的分配情况，因此我们使用以下命令：

# readelf -S a.out

将这里的内存布局与之前看到的程序的运行结果进行分析：

                &global_init_a=0x804a018       全局初始化：数据段            global_init_a=1
            &global_uninit_a=0x804a04c      全局未初始化：BSS段       global_uninit_a=0
     &static_global_init_a=0x804a01c      全局静态初始化：数据段    static_global_init_a=1
&static_global_uninit_a=0x804a038      全局静态未初始化：BSS段    static_global_uninit_a=0
             &const_global_a=0x80487c0    全局只读变量：只读数据段        const_global_a=1

               &global_init_b=0x804a020       全局初始化：数据段      global_init_b=1
            &global_uninit_b=0x804a048       全局未初始化：BSS段      global_uninit_b=0
    &static_global_init_b=0x804a024      全局静态初始化：数据段    static_global_init_b=1
&static_global_uninit_b=0x804a03c        全局静态未初始化：BSS段   static_global_uninit_b=0
            &const_global_b=0x80487c4        全局只读变量：只读数据段             const_global_b=1

&static_local_init_a=0x804a028 局部静态初始化：数据段 static_local_init_a=1
&static_local_uninit_a=0x804a040 局部静态未初始化：BSS段 static_local_uninit_a=0

&static_local_init_b=0x804a02c 局部静态初始化：数据段 static_local_init_b=1
&static_local_uninit_b=0x804a044 局部静态未初始化：BSS段 static_local_uninit_b=0

p_chars=0x80487c8 字符串常量：只读数据段 p_chars=abcdef
ELF 文件一般包含以下几个段 :

.text section：主要是编译后的源码指令，是只读字段。
.data section ：初始化后的非const的全局变量、局部static变量。
.bss：未初始化后的非const全局变量、局部static变量。
.rodata字段是存放只读数据

分析到这以后，我们在和之前分析的结果对比一下，会发现确实存在BSS段，地址为0804a030 ，大小为0x20，之前我们的程序中未初始化的的确存放在这个地址区间中了，只不过执行exec系统调用时，将这部分的数据初始化为0后，放到了进程地址空间的数据段中了，在进程地址空间中就没有必要存在BSS段了，因此都称做数据段。同理，.rodata字段也是与text段放在一起了。

在ELF文件中，找不到局部非静态变量和动态分配的内容。

以上有很多地方的分析，我在网上基本找不到很明确的结论，很多教材上也没有描述，只是我通过程序分析得出的结论，如有不妥之处，请指出，欢迎交流。

作者：沧海猎人出处：http://blog.csdn.net/embedded_hunter 转载请注明出处嵌入式技术交流QQ群：179012822

时间： 2024-08-02 19:46:10

【图解】Linux下C程序进程地址空间布局 .

【图解】Linux下C程序进程地址空间布局 .的相关文章

Linux x86_64下进程地址空间布局

linux下某程序中实现对进程的实时流量监控功能

python-如何在linux下开启守护进程

Linux下c++程序内存泄漏检测代码范例

总结UNIX/LINUX下C++程序计时的方法_C 语言

linux下的守护进程_Linux

Linux下C程序的编辑，编译和运行以及调试

Linux下读取默认MAC地址的方法

多线程-linux 下c 程序，开了1024个线程依次等待共同完成某个任务，程序异常退出，不出core