linux内核学习之四:进程切换简述

 进程是现代操作系统的核心概念之一,用于分配系统(CPU,内存)资源的使用。了解linux进程及进程切换的知识,首先要理解进程与程序的区别,进程是执行流,是动态概念;程序是数据与指令序列的集合,是静态概念。进程作为动态的执行流,可以用execv系统调用自由选择一个程序(只要有权限)来执行的,理解这一点很重要。在阅读本书的第三章《进程》中,有两个地方比较难于理解的。

 

1 switch_to宏的last参数

     书中讨论switch_to宏(第110页)时,提到,该宏有3个参数:prev,next和last。前两个分别是当前进程描述符地址和待切换的进程描述符的地址,相信大家对这两个参数都不会有疑问,prev就是从current得到的,而next则是schedule()函数在根据调度算法从进程等待队列中挑选的。关键是第三个last参数,为什么需要这么一个参数呢?书中的描述比较难理解。它的意思是说,A切换到B时,prev=A,next=B, 经过一定时间后,A被重新调度到CPU上执行时,A需要知道从哪个进程切换过来的,需要从last参数得到。实际上我们只需要关注A->B这一个过程就可以理解last参数的使用了。下面我们用图片记录每个步骤:

(1) 在进程切换之前,A是当前进程,esp寄存器指向A的内核栈,prev,next这两个局部变量保存在栈中,也就是在A的内核栈中。那么B的内核栈有没有这两个参数呢?当然也有,因为B既然是在等待队列中,很可能B也经历过被其他进程切换出去这一个过程,在那个过程中,B的内核栈同样保存了这两个变量(如果B是新创建的进程,可以在创建时,或在schedule函数中将两个值压入内核栈),但是这两个值肯定跟A中的prev=A,next=B不同,因为那个过程中,B是被切换的,因此,这时,B的内核栈中应该是prev=B.

     为了在切换到B进程执行时,prev参数是正确的,就需要借助于第三个参数last 。在schedule函数中(它挑选的B,当然也知道B进程描述符的地址),它从B的进程描述符中得到B的内核栈的地址(书中是thread_info参数,3.2.54版本代码中改成了stack参数,原理是一样的),从而得到B的prev参数的地址,作为第三个参数传给switch_to宏。switch_to宏还将A的进程描述符地址加载到EAX寄存器中,而在进程切换过程中,EAX寄存器内容是不会改变的。

(2) 执行进程切换,主要是内核栈的切换,因为内核实现中,将thread_info结构与内核栈放在一起,esp改变了,current参数得到的当前进程描述符地址也跟着改变。这时,当前进程变成了B进程,并在B的内核栈上工作。注意,这时B内核栈的prev参数还是不正确的,它指向的依然是B。

(3) 将EAX寄存器内容复制到last指向的内存,即B内核栈的prev参数所在的地址。这样,B内核栈上的prev参数就指向了正确的A进程描述符的地址。

 

2 进程切换过程中进程栈

     书中对进程切换的描述中,对进程的栈的描述是零散的,很容易让人犯糊途。栈是进程中的重要数据结构,在函数调用中起到核心作用,关于栈的详细描述可以参阅《深入理解计算机系统》。下面描述进程切换过程中,进程的栈的变迁。

     linux的进程有两种栈,用户栈和内核栈,它们在不同的内存区域,用户栈在用户态中使用,在用户地址空间分配(0~3G),内核栈在内核态中使用,在内核地址空间分配(3G~4G)。用户栈主要用于函数调用和存储局部变量,内核栈除此之外还要保存进程切换额外的信息,如通用寄存器等。不管是用户栈还是内核栈,CPU都是用ESP寄存器保存栈顶地址,因此早在进程切换前,进程进入内核态后,用户栈就需要被切换出去,整个切换过程,都是在内核栈上工作,因而用户栈与进程切换无关。另一方面,内核的实现中,将thread_info结构与内核栈放在一起,内核栈改变了,current参数得到的当前进程描述符地址也跟着改变,因此进程切换,就是由内核栈切换来完成的。整个完整的进程切换可以分为三个部分,以下假设从进程A切换到进程B:

(1)  A的用户态-->A的内核态

     这一过程是由中断,异常或系统调用实现的,书中的后面章节会有介绍,以后再详谈。这里只讨论几个要点,每次从用户态切换到内核态,内核栈都会被清空,ESP直接指向内核栈的栈底,而用户栈的信息则会保存到内核栈中。清空内核栈的设计估计是考虑到经过了用户态的操作后,以前内核栈的调用信息没有用处了,没有必要再保存,毕竟内核栈只分配了8K或4K的空间。那么,切换到内核态之前,内核怎么知道进程的内核栈地址呢,进程描述符虽然保存有内核栈的地址(stack变量),但是进程描述符位于动态内态中,从内存读取的效率太低了。实现上,它是从TSS中获取的。

     书中“任务状态段”一节(第108页)对TSS进行比较详细的描述,每个CPU都有一个TSS,CPU可以快速访问它。TSS的一个最重要的功能就是在用户态转为内核态时供CPU读取内核栈地址,即是init_tss[cpu]->sp0字段(3.2.54版本的代码),实际上,它存储的是栈底地址,因此一加载到ESP中,就同时清空了内核栈。

(2) A的内核态->B的内核态

这一阶段实现的是进程间的内核栈切换,同时也实现进程切换。与此过程关系最密切的是task_struct的thread变量,thread变量的类型是thread_struct,可称为线程描述符,用于保存进程切换的硬件上下文(书中第109页)。书中的switch_to和__switch_to函数详细描述了进程切换过程中的每一个步骤,与内核栈相关的有:

  • 保存A的内核栈栈顶地址,即ESP寄存器的内容到A_task->thread->sp。(switch_to的第3步,变量名根据3.2.54版本中的代码)
  • 将B_task->thread->sp内容加载到ESP。(switch_to的第4步,这步完成了内核栈的切换)
  • 将B_task->thread->sp0加载到init_tss[cpu]->sp0字段(__switch_to的第3步),这一步与(1)的描述对应,以后B在运行期间,用户态切换到内核态时,ESP寄存器总是从init_tss[cpu]->sp0字段获取内核栈的地址,这一操作同时清空了内核栈内容。(thread_struct结构有sp0,sp1变量,sp0保存内核栈栈底地址,sp保存栈顶地址)。

(3)B的内核态->B用户态

      执行与(1)相反的过程,从内核栈中取出(1)中保存的用户栈信息,装载相应寄存器,切换到用户栈,内核栈信息不必保存,因为(2)中已保存了栈底地址,下次进入内核栈时直接将其加载到ESP寄存器中即可(将栈底地址作为栈顶使用)。这一过程书中后面的章节同样会有详细描述。

 

     有关进程的内容远不止这些,例如,进程的创建与清除,进程队列,进程调度等,总之要理解linux内核的进程管理,必须将《深入理解linux内核》一书相关章节逐句逐句细细品读。

时间: 2024-10-29 02:14:18

linux内核学习之四:进程切换简述的相关文章

linux内核学习之四:进程切换简述【转】

转自:http://www.cnblogs.com/xiongyuanxiong/p/3531884.html 在讲述专业知识前,先讲讲我学习linux内核使用的入门书籍:<深入理解linux内核>第三版(英文原版叫<Understanding the Linux Kernel>),不过这本书不一定对每个人都适合,大家可以根据自己的情况选择适合的入门书籍.看了前面几章,感觉这本书的语言极其精练,没有一句多余的,必须慢慢读.可能我以前习惯了粗略浏览的阅读方式,读这本书时经常看着看着就

Linux内核剖析 之 进程简介

1.概念    1.1  什么是进程?     进程是程序执行的一个实例,可以看作充分描述程序已经执行到何种程度的数据结构的汇集.     从内核观点看,进程的目的就是担当分配系统资源(CPU时间,内存等)的实体.     我们熟悉的fork()库函数,它有两种用法:     (1).一个父进程希望复制自己,使父子进程执行不同的代码段,常用于网络服务程序.     (2).一个进程要执行一个不同的程序,fork()后立即exec(),如shell. 1.2  什么是线程?     有时候,一个进

深入理解linux内核之(二)进程

                                      深入理解linux内核之(二)进程       程序是静态的,进程是正在执行的程序的一个实例,一个程序可以由多个进程组成.进程是资源分配的实体.在进程被创建出来之后,该子进程几乎和父进程一样.子进程复制了父进程的地址空间,从fork()之后的第一条指令开始执行,和父进程有同样的程序可执行代码(exec调用除外).尽管子进程和父进程具有同样的程序执行代码,但是子进程拥有自己的stack和heap,因此,子进程对数据的修改对

深入解析Linux系统下的进程切换

  Linux内核下进程切换 Linux切换并没有使用X86CPU的切换方法,Linux切换的实质就是cr3切换(内存空间切换,在switch_mm函数中)+ 寄存器切换(包括EIP,ESP等,均在switch_to函数中).这里我们讲述下switch_to主流程: 1. 在switch_mm函数中将new_task->pgd设置到cr3寄存器中,实现页表切换,由于每个进程3-4G的页表映射机制完全一样(从内核页表中直接复制过来的),故这里虽然切换了pgd,但是并无影响,只是在任务回到用户空 间

浅谈Linux内核创建新进程的全过程_Linux

进程描述 进程描述符(task_struct) 用来描述进程的数据结构,可以理解为进程的属性.比如进程的状态.进程的标识(PID)等,都被封装在了进程描述符这个数据结构中,该数据结构被定义为task_struct 进程控制块(PCB) 是操作系统核心中一种数据结构,主要表示进程状态. 进程状态 fork() fork()在父.子进程各返回一次.在父进程中返回子进程的 pid,在子进程中返回0. fork一个子进程的代码   #include <stdio.h> #include <std

Linux内核学习经验总结

开篇 学习内核,每个人都有自己的学习方法,仁者见仁智者见智.以下是我在学习过程中总结出来的东西,对自身来说,我认为比较有效率,拿出来跟大家交流一下.​ 内核学习,一偏之见:疏漏难免,恳请指正. 为什么写这篇博客 刚开始学内核的时候,不要执着于一个方面,不要专注于一个子系统就一头扎到实际的代码行中去,因为这样的话,牵涉的面会很广,会碰到很多困难,容易产生挫败感,一个函数体中(假设刚开始的时候正在学习某个方面的某个具体的功能函数)很可能掺杂着其他各个子系统方面设计理念(多是大量相关的数据结构或者全局

Linux内核剖析 之 进程地址空间(一)

绪论     内核获取内存方式--直接了当:     1. 从分区页框分配器获取内存(__get_free_pages()或alloc_pages()):     2. 使用slab分配器为专用或通用对象分配内存(kmem_cache_alloc()或kmalloc()):     3. 使用vmalloc或vmalloc_32获取一块非连续内存区.     如果申请的内存得以满足,这些函数返回一个页描述符地址或线性地址.     *内核申请内存使用这些简单方法基于以下两个原因:     1.内

linux内核分析之进程地址空间【转】

转自:http://blog.csdn.net/bullbat/article/details/7106094 版权声明:本文为博主原创文章,未经博主允许不得转载. 本文主要介绍linux内核中进程地址空间的数据结构描述,包括mm_struct/vm_area_struct.进程线性地址区间的分配流程,并对相应的源代码做了注释.  内核中的函数以相当直接了当的方式获得动态内存.当给用户态进程分配内存时,情况完全不同了.进程对动态内存的请求被认为是不紧迫的,一般来说,内核总是尽量推迟给用户态进程分

Linux内核剖析 之 进程地址空间(三)

本节主要讲述缺页异常处理程序和堆的管理等内容. 缺页异常处理程序 触发缺页异常程序的两种情况: 1. 由编程错误引起的异常(如访问越界,地址不属于进程地址空间). 2. 地址属于线性地址空间,但内核还未分配相应的物理页,导致缺页异常. 缺页异常处理程序总体方案: 线性区描述符可以让缺页异常处理程序非常有效的完成它的工作. do_page_fault()函数是80x86上的缺页中断服务程序,它把引起缺页的线性地址和当前进程的线性区相比较,从而根据具体方案选择适当的方法处理此异常. 标识符vmall