处理机是计算机系统的核心资源。操作系统的功能之一就是处理机管理。随着计算机的迅速发展,处理机管理显得尤为重要。这主要由于计算机的速度越来越快,处理机的充分利用有利于系统效率的整体提升;处理机管理是整个操作系统的重心所在,其管理的好坏直接影响到整个系统的运行效率;而且操作系统中并发活动的管理和控制是在处理机管理下实现的,处理机管理集中了操作系统中最复杂的部分,它设计的好坏关系到整个系统的成败。
进程是处理机管理中最基本、最重要的概念。进程是系统并发执行的体现。由于在多程序系统中,众多的计算机用户都以各种各样的任务,随时随地的争夺使用处理机。为了动态地看待操作系统,则以进程作为独立运行的基本单位,以进程作为分配资源的基本单位,从进程的角度来研究操作系统。因此,处理机管理也被称为进程管理。处理机管理的功能就是组织和协调用户对处理机的争夺使用,把处理机分配给进程,对进程进行管理和控制,最大限度的发挥处理机的作用。
进程的概念用静态的观点看,操作系统是一组程序和表格的集合。用动态的观点看,操作系统是进程的动态和并发执行的。而进程的概念实际上是程序这一概念发展的产物。因此,可以从分析程序的基本特征入手,引用进程的概念。 顺序程序是指程序中若干操作必须按照某种先后顺序来执行,并且每次操作前和操作后的数据、状态之间都有一定的关系。在早期的程序设计中,程序一般都是按照顺序执行的。 在多道程序系统中,程序的运行环境发生了很大的变化。主要体现在:
资源共享。为了提高资源的利用率,计算机系统中的资源不在由一道程序专用,而是由多道程序共同使用。程序的并发执行或并行执行。逻辑上允许多道不同用户的程序并行执行;允许一个用户程序内部完成不同操作的程序段之间并行执行;允许操作系统内部不同的程序之间并行执行。物理上讲:内存储器中保存多个程序,I/O设备被多个程序交替地共享使用;在多处理机系统的情形下,表现为多个程序在各自的处理机上运行,执行时间是重叠的。单处理机系统情形下,表现为多道程序交替地在处理机上相互交替执行。实际上,在多道程序系统中,程序的并行执行和资源共享之间是相辅相成的。一方面,只有允许程序并行执行,才能存在资源共享的问题;另一方面,只有有效地实现资源共享,才可能使得程序并行执行。 这样可增强计算机系统的处理能力和提高机器的利用率。并发操作实际上是这样的:大多数程序段只要求操作在时间上是有序的,也就是有些操作必须在其它操作之前,这是有序的,但其中有些操作却可以同时执行。
由进程运行的间断性,决定了进程至少具有以下三种状态:
就绪状态。当进程已分配了除CPU以外的所有必要的资源后,只要再获得处理机,便能立即执行,把这时的进程状态称为就绪状态。在一个系统中,可以有多个进程同时处于就绪状态,通常把它们排成一个队列,称为就绪队列。执行状态。执行状态指的是进程已获得处理机,其程序正在执行。在单处理机系统中,只能有一个进程处于执行状态。阻塞状态。阻塞状态指进程因发生某事件而暂停执行时的状态,亦即进程的执行受到阻塞,故称这种暂停状态为阻塞状态,有时也称为等待状态或睡眠状态。通常将处于阻塞状态的进程排成一个队列,称为阻塞队列。进程的状态随着自身的推进和外界的变化而变化。例如,就绪状态的进程被进程调用程序选中进入执行状态;执行状态的进程因等待某一事件的变化转入等待状态;等待状态的进程所等待事件来到便进入就绪状态。进程的状态可以动态地相互转换,但阻塞状态的进程不能直接进入执行状态,就绪状态的进程不能直接进入阻塞状态。在任何时刻,任何进程都处于且只能处于一种状态。进程状态的变化情况如下:
运行态->等待态:一个进程运行中启动了外围设备,它就变成等待外围设备传输信息的状态;进程在运行中申请资源时,变成等待资源状态,进程在运行中出现故障,变成等待干预状态。等待态->就绪态:外围设备工作结束后等待外围设备传输信息的进程结束等待;等待的资源能得到满足时,则等待资源者就结束等待;故障排队后让等待干预的进程结束等待,任何一个结束等待的进程必须先变成就绪状态,待分配到处理器后才能运行。运行态->就绪态:进程用完了一个使用处理器的时间后强迫该进程暂时让出处理器,当有更高优先级的进程要运行时也迫使正在运行的进程让出处理器。由于自身或外界原因成为等待状态的进程让出处理器时,它的状态就变成就绪状态。就绪态->运行态:等待分配处理器的进程,系统一种选定的策略从处于就绪状态的进程中选择一个进程,让它占用处理器,那个被选中的进程就变成了运行态。 三种状态及各种状态之间的转换如下:在不少系统中,进程只有三种状态。但在另一些系统中,又增加了一些新的状态,其中最重要的是挂起状态。引入挂起状态的原因:
对换的需要。为了缓和内存紧张的情况,而将内存中处于阻塞状态的进程换至外存上,使进程又处于一种又别于阻塞状态的新状态。因为即使该进程所期待的事件发生,该进程仍不具备执行条件而不能进入就绪队列,称为这种状态为挂起状态。终端用户的请求。当终端用户在自己的程序运行期间,发现有可疑问题时,往往希望使自己的进程暂停下来。也就是说,使正在执行的进程暂停执行,若是就绪进程,则不接受调度以便研究其执行情况或对程序进行修改。把这种静止状态也称为挂起状态。父进程请求。父进程常希望挂起自己的子进程,以便考察和修改子进程,或者协调各子进程间的活动。负荷调节的需要。当实时系统中的工作负荷较重,有可能影响到对实时任务的控制时,可由系统把一些不重要的进程挂起,以保证系统正常运行。操作系统的需要。操作系统希望挂起某些进程,以便检查运行中资源的使用情况及进行记账。终上所述,不难看出挂起状态具有以下三个属性:
被挂起的进程,原来可能处于就绪状态,此时进程的状态称为挂起就绪;若被挂起的进程原来处于阻塞状态,此时的状态称为挂起阻塞。不论哪种状态,该进程都是不可能被调度而执行的。处于挂起阻塞状态的进程,其阻塞条件与挂起条件无关;当进程所期望的事件出现后,进程虽不再被阻塞,但仍不能运行,这时,应将该进程从静止阻塞状态转换为挂起就绪状态。进程可以由其自身挂起,也可以由用户或操作系统等将之挂起。虽目的都在于阻止进程继续运行,被挂起的进程只能用显式方式来激活,以便从挂起状态中解脱出来。 具有挂起操作的进程状态的演变情况如下: 进程互斥:一组并发进程中一个或多个程序段,因共享某一共有资源而导致必须以一个不允许交叉执行的单位执行。也就是说互斥是要保证临界资源在某一时刻只被一个进程访问。进程同步:把异步环境下的一组并发进程直接制约而互相发送消息而进行互相合作、互相等待,使得各进程按一定的速度执行的过程称为进程同步。也就是说进程之间是异步执行的,同步即是使各进程按一定的制约顺序和速度执行。系统中有些资源可以供多个进程同时使用,uouxie资源则一次仅允许一个进程使用,将一次进允许一个进程使用的资源称为临街资源,很多物理设备如打印机、磁带机等都属于临界资源,某些软件的变量、数据、表格也不允许两个进程同时使用,所以也是临界资源。
进程在并发执行中可以共享系统中的资源。但是临界资源的访问则必须互斥进行,即各进程对临界资源进行操作的那段程序的执行也必须是互斥的,只有这样才能保证对临界资源的互斥访问。把一个进程访问临界资源的那段代码称为临界区,有了临界区的概念,进程间的互斥就可以描述为:禁止两个或两个以上的进程同时进入访问同一临界资源的临界区。为此,必须有专门的同步机构来协调它们,协调准则如下:
空闲让进。无进程处于临界区时,若有进程要求进入临界区则 立即允许进入;忙则等待。当已有进程进入临界区时,其他试图进入各自临界区的进入必须等待,以保证进程互斥地进入临界区;有限等待。有若干进程要求进入临界区时,应在有限时间内使一进程进入临界区,即它们不应相互等待而谁也不进入临界区;让权等待。对于等待进入临界区的进程必须释放其占有的CPU。信号量可以有效地实现进程的同步和互斥。在操作系统中,信号量是一个整数。当信号量大于等于0时,代表可供并发进程使用的资源实体数,当信号量小于零时则表示正在等待使用临界区的进程数。建立一个信号量必须说明所建信号量代表的意义和设置初值,以及建立相应地数据结构,以便指向那些等待使用该临界区的进程。对信号量只能施加特殊的操作:P操作和V操作。P操作和V操作都是不可分割的原子操作,也称为原语。因此,P原语和V原语执行期间不允许中断发生。 P操作的过程是将信号量值减一,若值成负数,则调用P操作的进程暂停执行,直到另一个进程对同一信号量做V操作。V操作的过程是将信号量值加一,若值小于等于0,从相应队列中选一个进程唤醒它。 一般P操作与V操作的定义如下: 为了保护共享资源,使我们不被多个进程同时访问,就要阻止这些进程同时执行访问这些资源的代码段;进程互斥不允许两个以上共享临界资源的并发进程同时进入临界区。利用P/V原语和信号量可以方便地解决并发进程对临界区的进程互斥问题。 要用P/V操作实现进程同步,需要引入私用信号量。私用信号量只与制约进程和被制约进程有关,而不是与整组并发进程有关。与此相对,进程互斥使用的信号量为公用信号量。首先为各并发进程设置私用信号量,然后为私用信号量赋初值,最后利用P/V原语和私用信号量规定各进程的执行顺序。 典型的案例为生产者-消费者问题。这要求存后再取,取后再存,即有两个制约关系,为此,需要两个信号量,表示缓存区中的空单元数Bufempty和非空单元数Buffull:
前趋图是一个由节点和有向边构成的有向无环图。该图通常用于表现事务之间先后顺序的制约关系。图中的每个节点可以表示一个语句、一个程序或是一个进程,节点间的有向边表示两个节点之间存在的前趋关系。 如下表示三个任务各自程序并发执行的前趋图: 图中A1没有前趋节点,称为开始节点,它不受任何制约,可以直接执行;而B1和A2只能在A1执行完成之后 才能开始,而B2必须在B1和A2完成之后才能开始;C3没有后继节点,称为终止节点。 在前趋图中,执行先后顺序的制约关系可分为两种:直接制约和间接制约。 直接制约通常是指一个操作中,多个步骤之间的制约关系,也可以说是“同步进程之间的制约关系”。如上图所示,A1、B1、C1是一条指令的取值、分析、执行的三个步骤,所以它们之间的关系是直接制约。 间接制约通常是指多个操作之间相同步骤的制约关系,也可以说是“互斥进程之间的制约关系”。如上图所示,A1、A2、A3之间就存在间接制约关系。
进程调度即处理器调度【上下文转换】,它的主要功能是确定在什么时候分配处理器,并确定分给哪一个进程,即让正在执行的进程改变状态并转入就绪队列的队尾,再由调度原语将就绪队列的队首进程取出,投入执行。 引起进程调度的原因有以下几类:
正在执行的进程执行完毕。执行中的进程自己调用阻塞原语将自己阻塞起来进入睡眠状态。执行中的进程调用了P原语操作,从而因资源不足而阻塞;或调用V原语操作激活了等待资源的进程队列。在分时系统中,当一进程用完一个时间片。就绪队列中某进程的优先级变得高于当前执行进程的优先级,也将引起进程调度。进程调度的方式有两种:剥夺方式和非剥夺方式。所谓非剥夺方式是指,一旦某个作业或进程占用了处理器,别的进程就不能把处理器从这个进程手中夺走,直到该进程自己因调用原语操作而进入阻塞状态,或时间片用完而让出处理机;剥夺方式是指,当就绪队列中有进程的优先级高于当前执行进程的优先级时,便立即发生进程调度,转让处理机。 进程调度的算法是服务于系统目标的策略,对于不同的系统与系统目标,常采用不同的调度算法:
先来先服务FCFS调度算法,又称先进先出FIFO,就绪队列按先来后到原则排队。优先数调度。优先数反映了进程优先级,就绪队列按优先数排队。有两种确定优先级的方法,即静态优先级和动态优先级。静态优先级是指进程的优先级在进程开始执行前确定,执行过程中不变,而动态优先级则可以在执行过程中改变。轮转法。就绪队列按FCFS方式排序。每个进程执行一次占有处理器时间都不超过规定的时间单位,若超过,则自行释放自己所占有的CPU而排队到就绪队列的末尾,等待下一次调度。同时,进程调度程序又去调度当前就绪队列中的第一个进程。进程管理是操作系统的核心,在进程管理的实现中,如果设计不当,会出现一种尴尬的局面——死锁。 当若干进程互相竞争对方已占用的资源,无限期地等待,不能向前推进时会造成死锁。 死锁是系统的一种出错状态,它不仅会浪费大量的系统资源,甚至还会导致整个系统的崩溃,所以死锁是应该尽量预防和避免的。
死锁条件。产生死锁的主要原因是供共享的系统资源不足,资源分配策略和进程的推进顺序不当。系统资源既可能是可重复使用的永久性资源,也可能是消耗性的临时资源。产生死锁的必要条件是:互斥条件、保持和等待条件、不剥夺条件和环路等待条件。产生死锁的策略。处于死锁状态的进程不能继续执行但又占用了系统资源,从而阻碍其他作业的执行。解决死锁有两种策略:一种是在死锁发生前采用的预防和避免策略;另一种是在死锁发生后采用的检测与恢复策略。 死锁的预防主要通过打破死锁产生的4个必要条件之一来保证不会产生死锁。采用的死锁预防策略通常有资源的静态分配法或有序分配法,它们分别打破了资源动态分配条件和循环等待条件,因此不会发生死锁。但这样会大大降低系统资源的利用率和进程之间的并行程度。 死锁避免策略,则是在系统进行资源分配时,先执行一个死锁避免算法,以保证本次分配不会导致死锁发生。由于资源分配很频繁,因此死锁避免策略要耗费大量的CPU和时间。