进程同步与互斥
什么是进程同步
知识点回顾:进程具有异步性的特征。异步性是指,各并发执行的进程以各自独立的、不可预知的速度向前推进
引言
- 读进程和写进程并发地运行,由于并发必然导致异步性,因此 “写数据” 和“读数据”两个操作执行的先后顺序是不确定的
- 而实际应用中,又必须按照 “写数据→读数据” 的顺序来执行的。 如何解决这种异步问题,就是 “进程同步” 所讨论的内容
定义
- 同步亦称直接制约关系,它是指为完成某种任务而建立的两个或多个进程,这些进程因为需要在某些位置上协调它们的工作次序而产生的制约关系
-
什么是进程互斥
知识点回顾:进程的 “并发” 需要 “共享” 的支持。各个并发执行的进程不可避免的需要共享一些系统资源(比如内存,又比如打印机、摄像头这样的 I/O 设备)
引言
资源共享有两种方式 互斥共享方式:系统中的某些资源,虽然可以提供给多个进程使用,但一个时间段内只允许一个进程访问该资源
- 同步共享方式:系统中的某些资源,允许一个时间段内由多个进程 “同时” 对它们进行访问
定义
- 我们把一个时间段内只允许一个进程使用的资源称为临界资源。对临界资源的访问,必须互斥地进行
- 许多物理设备(比如摄像头、打印机)都属于临界资源。此外还有许多变量、数据、内存缓冲区等都属于临界资源
- 互斥亦称间接制约关系。它是指当一个进程访问某临界资源时,另一个想要访问该临界资源的进程必须等待。当前访问临界资源的进程访问结束,释放该资源之后, 另一个进程才能去访问临界资源
四个部分
对临界资源的互斥访问,可以在逻辑上分为四个部分:
- 临界区是进程中访问临界资源的代码段
- 进入区和退出区是负责实现互斥的代码段
- 临界区也可称为 “临界段”
需要遵循的原则
为了实现对临界资源的互斥访问,同时保证系统整体性能,需要遵循以下原则:
- 空闲让进。临界区空闲时,可以允许一个请求进入临界区的进程立即进入临界区;
- 忙则等待。当已有进程进入临界区时,其他试图进入临界区的进程必须等待;
- 有限等待。对请求访问的进程,应保证能在有限时间内进入临界区(保证不会饥饿);
- 让权等待。当进程不能进入临界区时,应立即释放处理机,防止进程忙等待
小结
进程互斥的软件实现
学习提示:
- 理解各个算法的思想、原理
- 结合上小节学习的 “实现互斥的四个逻辑部分”,重点理解各算法在进入区、退出区都做了什么
- 分析各算法存在的缺陷(结合 “实现互斥要遵循的四个原则” 进行分析)
单标志法
双标志先检查法
双标志后检查法
Peterson 算法
小结
- 理解各方法的原理
- 了解各方法的优缺点
中断屏蔽方法
TestAndSet 方法 (TS/TSL 指令)
Swap 指令 (XCHG 指令)
小结
信号量机制🌟
引言
复习回顾 + 思考:之前学习的这些进程互斥的解决方案分别存在哪些问题?
- 进程互斥的四种软件实现方式 (单标志法、双标志先检查、双标志后检查、Peterson 算法):
- 在双标志先检查法中,进入区的 “检查”、“上锁” 操作无法一气呵成,从而导致了两个进程有可能同时进入临界区的问题;
- 进程互斥的三种硬件实现方式 (中断屏蔽方法、TS/TSL 指令、Swap/XCHG 指令)
- 所有的解决方案都无法实现 “让权等待” ,出现忙等,一直占用 CPU
1965 年,荷兰学者 Dijkstra 提出了一种卓有成效的实现进程互斥、同步的方法——信号量机制
定义
- 用户进程可以通过使用操作系统提供的一对原语来对信号量进行操作,从而很方便的实现了进程互斥、进程同步。
- 信号量其实就是一个变量 ,可以用一个信号量来表示系统中某种资源的数量,比如:系统中只有一台打印机,就可以设置一个初值为 1 的信号量。
- 原语是一种特殊的程序段,其执行只能一气呵成,不可被中断。原语是由关中断 / 开中断指令实现的。
- 软件解决方案的主要问题是由 “进入区的各种操作无法一气呵成”,因此如果能把进入区、退出区的操作都用“原语” 实现,使这些操作能 “一气呵成” 就能避免问题。
- 一对原语:wait(S)原语和 signal(S) 原语,可以把原语理解为我们自己写的函数,函数名分别为 wait 和 signal,括号里的信号量 S 其实就是函数调用时传入的一个参数。
wait、signal 原语常简称为 P、V 操作 (来自荷兰语 proberen 和 verhogen)。
一个信号量对应一种资源
- 信号量的值 = 这种资源的剩余数量(信号量的值如果小于 0,说明此时有进程在等待这种资源)
- P(S) —— 申请一个资源 S,如果资源不够就阻塞等待
- V(S) —— 释放一个资源 S,如果有进程在等待该资源,则唤醒一个进程
实现进程互斥
实现进程同步
实现进程的前驱关系
小结
经典同步与互斥问题
生产者 - 消费者问题🌟
问题描述
问题分析
如何实现
思考:能否改变相邻 P、V 操作的顺序?
小结
PV 操作题目的解题思路:
- 关系分析。找出题目中描述的各个进程,分析它们之间的同步、互斥关系。
- 整理思路。根据各进程的操作流程确定 P、V 操作的大致顺序。
- 设置信号量。设置需要的信号量,并根据题目条件确定信号量初值。(互斥信号量初值一般为 1,同步信号量的初始值要看对应资源的初始值是多少)
- 生产者消费者问题是一个互斥、同步的综合问题。
- 对于初学者来说最难的是发现题目中隐含的两对同步关系。
- 有时候是消费者需要等待生产者生产,有时候是生产者要等待消费者消费,这是两个不同的 “一前一后问题”,因此也需要设置两个同步信号量。
易错点:实现互斥和实现同步的两个 P 操作的先后顺序(死锁问题)
多生产者 - 多消费者问题🌟
问题描述
问题分析
如何实现
小结在生产者 - 消费者问题中,如果缓冲区大小为 1,那么有可能不需要设置互斥信号量就可以实现互斥访问缓冲区的功能。当然,这不是绝对的,要具体问题具体分析。
建议:在考试中如果来不及仔细分析,可以加上互斥信号量,保证各进程一定会互斥地访问缓冲区。但需要注意的是,实现互斥的 P 操作一定要在实现同步的 P 操作之后,否则可能引起 “死锁”
吸烟者问题
问题描述
问题分析
如何实现
小结吸烟者问题可以为我们解决 “可以生产多个产品的单生产者” 问题提供一个思路。
- 值得吸取的精华是:“轮流让各个吸烟者吸烟”,必然需要 “轮流的在桌上放上组合一、二、三”,注意体会我们是如何用一个整型变量 i 实现这个 “轮流” 过程的
若一个生产者要生产多种产品(或者说会引发多种前驱事件),那么各个 V 操作应该放在各自对应的 “事件” 发生之后的位置
读者 - 写者问题
问题描述
问题分析
如何实现
小结读者 - 写者问题为我们解决复杂的互斥问题提供了一个参考思路。
- 其核心思想在于设置了一个计数器 count 用来记录当前正在访问共享文件的读进程数。我们可以用count 的值来判断当前进入的进程是否是第一个 / 最后一个读进程,从而做出不同的处理。
- 另外,对 count 变量的检查和赋值不能一气呵成导致了一些错误,如果需要实现 “一气呵成”,自然应该想到用互斥信号量
- 最后,还要认真体会我们是如何解决 “写进程饥饿” 问题的。
绝大多数的 PV 操作题都可以用之前介绍的几种生产者 - 消费者问题的思想来解决,如果遇到更复杂的问题,可以想想能否用读者写者问题的这几个思想来解决
哲学家进餐问题
问题描述
问题分析
如何防止死锁的发生可以对哲学家进程施加一些限制条件,比如最多允许四个哲学家同时进餐。这样可以保证至少有一个哲学家是可以拿到左右两只筷子的
- 要求奇数号哲学家先拿左边的筷子,然后再拿右边的 筷子,而偶数号哲学家刚好相反。用这种方法可以保证如果相邻的两个奇偶号哲学家都想吃饭,那么只会有其中一个可以拿起第一只筷子,另一个会直接阻塞。这就避免了占有一支后再等待另一只的情况
- 仅当一个哲学家左右两支筷子都可用时才允许他抓起筷子
小结
- 哲学家进餐问题的关键在于解决进程死锁
- 这些进程之间只存在互斥关系,但是与之前接触到的互斥关系不同的是,每个进程都需要同时持有两个临界资源,因此就有 “死锁” 问题的隐患
- 如果在考试中遇到了一个进程需要同时持有多个临界资源的情况,应该参考哲学家问题的思想,分析题中给出的进程之间是否会发生循环等待,是否会发生死锁
-
管程机制
引言
信号量机制存在的问题:编写程序困难、易出错
- 能不能设计一种机制,让程序员写程序时不需要再关注复杂的 PV 操作,让写代码更轻松呢
1973 年,Brinch Hansen 首次在程序设计语言 (Pascal)中引入了 “管程” 成分——一种高级同步机制
定义
管程是一种特殊的软件模块,有这些部分组成:
局部于管程的共享数据结构说明;
- 对该数据结构进行操作的一组过程 (函数);
- 对局部于管程的共享数据设置初始值的语句;
-
特征
管程的基本特征:
局部于管程的数据只能被局部于管程的过程所访问;
- 一个进程只有通过调用管程内的过程才能进入管程访问共享数据;
- 每次仅允许一个进程在管程内执行某个内部过程
小结
进程通信
定义
- 进程通信就是指进程之间的信息交换
- 进程是系统资源分配的单位 (包括内存地址空间),因此各进程拥有的内存地址空间相互独立
- 为了保证安全,一个进程不能直接访问另一个进程的地址空间
但是进程之间的信息交换又是必须实现的。 为了保证进程间的安全通信,操作系统提供了一些方法
在并发环境下,各进程因竞争资源而造成的一种互相等待对方手里的资源,导致各进程都阻塞,都无法向前推进的现象,就是 “死锁”。
-
死锁、饥饿、死循环的区别
死锁:各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象。
- 饥饿:由于长期得不到想要的资源,某进程无法向前推进的现象。
- 比如:在短进程优先(SPF)算法中,若有源源不断的短进程到来,则长进程将一直得不到处理机,从而发生长进程 “饥饿”。
死循环:某进程执行过程中一直跳不出某个循环的现象。有时是因为程序逻辑 bug 导致的,有时是程序员故意设计的
死锁产生的必要条件
产生死锁必须同时满足以下四个条件,只要其中任一条件不成立,死锁就不会发生
互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁
- 如哲学家的筷子、打印机设备这种必须互斥使用的资源的争抢才会导致死锁
- 如内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待 这种资源)
- 不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放
- 请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放
- 循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求
注意:发生死锁时一定有循环等待,但是发生循环等待时未必死锁(循环等待是死锁的必要不充分条件)
如果同类资源数大于 1,则即使有循环等待,也未必发生死锁。但如果系统中每类资源都只有一个,那循环等待就是死锁的充分必要条件
何时会发生死锁
对系统资源的竞争:各进程对不可剥夺的资源(如打印机)的竞争可能引起死锁,对可剥夺的资源(CPU)的竞争是不会引起死锁的。
- 进程推进顺序非法:请求和释放资源的顺序不当,也同样会导致死锁。
- 例如,并发执行的进程 P1、P2 分别申请并占有了资源 R1、R2,之后进程 P1 又紧接着申请资源 R2,而进程 P2 又申请资源 R1,两者会因为申请的资源被对方占有而阻塞,从而发生死锁。
- 信号量的使用不当也会造成死锁:如生产者 - 消费者问题中,如果实现互斥的 P 操作在实现同步的 P 操作之前,就有可能导致死锁。(可以把互斥信号量、同步信号量也看做是一种抽象的系统资源)
死锁的处理策略
- 预防死锁:破坏死锁产生的四个必要条件中的一个或几个。
- 避免死锁:用某种方法防止系统进入不安全状态,从而避免死锁(银行家算法)
死锁的检测和解除:允许死锁的发生,不过操作系统会负责检测出死锁的发生,然后采取某种措施解除死锁。
小结
预防死锁
破坏互斥条件
互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁。
不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放
- 破坏不剥夺条件:
- 方案一:当某个进程请求新的资源得不到满足时,它必须立即释放保持的所有资源,待以后需要时再重新申请。也就是说,即使某些资源尚未使用完,也需要主动释放,从而破坏了不可剥夺条件
- 方案二:当某个进程需要的资源被其他进程所占有的时候,可以由操作系统协助,将想要的资源强行剥夺。这种方式一般需要考虑各进程的优先级(比如:剥夺调度方式,就是将处理机资源强行剥夺给优先级更高的进程使用)
该策略的缺点:
请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。
- 可以采用静态分配方法,即进程在运行前一次申请完它所需要的全部资源,在它的资源未满足前, 不让它投入运行。一旦投入运行后,这些资源就一直归它所有,该进程就不会再请求别的任何资源了
该策略实现起来简单,但也有明显的缺点:
循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求
- 可采用顺序资源分配法。首先给系统中的资源编号,规定每个进程必须按编号递增的顺序请求资源, 同类资源(即编号相同的资源)一次申请完
- 原理分析:
- 一个进程只有已占有小编号的资源时,才有资格申请更大编号的资源。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待的现象。
该策略的缺点:
安全序列,就是指如果系统按照这种序列分配资源,则每个进程都能顺利完成。只要能找出一个安全序列,系统就是安全状态。当然,安全序列可能有多个
- 如果分配了资源之后,系统中找不出任何一个安全序列,系统就进入了不安全状态。这就意味着之后可能所有进程都无法顺利的执行下去
- 当然,如果有进程提前归还了一些资源,那系统也有可能重新回到安全状态,不过我们在分配资源之前总是要考虑到最坏的情况
- 如果系统处于安全状态,就一定不会发生死锁
- 如果系统进入不安全状态,就可能发生死锁(处于不安全状态未必就是发生了死锁,但发生死锁时一定是在不安全状态)
因此,可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态,以此决定是否答应资源分配请求。这也是 “银行家算法” 的核心思想
银行家算法
银行家算法是荷兰学者 Dijkstra 为银行系统设计的,以确保银行在发放现金贷款时,不会发生不能满足所有客户需要的情况。后来该算法被用在操作系统中,用于避免死锁
- 核心思想:在进程提出资源申请时,先预判此次分配是否会导致系统进入不安全状态。如果会进入不安全状态,就暂时不答应这次请求,让该进程先阻塞等待
- 如果借给企业的钱总数达不到企业提出的最大要求,那么不管你之前给企业借了多少钱,那些钱都拿不回来了
【例】可以把单维的数字拓展为多维的向量。比如:系统中有 5 个进程 P0~P4,3 种资源 R0~R2,初始数量为 (10, 5, 7),则某一时刻的情况可表示如下:
实际做题 (手算) 时可用更快速的方法找到一个安全序列:
- 经对比发现,(3, 3, 2) 可满足 P1、P3,说明无论如何,这两个进程的资源需求一定是可以依次被满足的
- 因此 P1、P3 一定可以顺利的执行完,并归还资源。可把 P1、P3 先加入安全序列
- P1、P3 归还资源后,共有资源:(2, 0, 0) + (2, 1, 1) + (3, 3, 2) = (7, 4, 3),则剩下的 P0、P2、P4 都可被满足。
- 同理,这些进程都可以加入安全序列
于是,5 个进程全部加入安全序列,说明此时系统处于安全状态,暂不可能发生死锁
算法实现
小结
数据结构
长度为 m 的一维数组 Available 表示还有多少可用资源
- n * m 矩阵 Max 表示各进程对资源的最大需求数
- n * m 矩阵 Allocation 表示已经给各进程分配了多少资源
- Max – Allocation = Need 矩阵表示各进程最多还需要多少资源
- 用长度为 m 的一位数组 Request 表示进程此次申请的各种资源数
银行家算法步骤
- 检查此次申请是否超过了之前声明的最大需求数
- 检查此时系统剩余的可用资源是否还能满足这次请求
- 试探着分配,更改各数据结构
- 用安全性算法检查此次分配是否会导致系统进入不安全状态
安全性算法步骤
- 检查当前的剩余可用资源是否能满足某个进程的最大需求,如果可以,就把该进程加入安全序列,并把该进程持有的资源全部回收。
- 不断重复上述过程,看最终是否能让所有进程都加入安全序列。
系统处于不安全状态未必死锁,但死锁时一定处于不安全状态。系统处于安全状态一定不会死锁
死锁的检测和解除
如果系统中既不采取预防死锁的措施,也不采取避免死锁的措施,系统就很可能发生死锁。在这种情况下,系统应当提供两个算法:
- 死锁检测算法:用于检测系统状态,以确定系统中是否发生了死锁
死锁解除算法:当认定系统中已经发生了死锁,利用该算法可将系统从死锁状态中解脱出来
死锁的检测
为了能对系统是否已发生了死锁进行检测,必须:
用某种数据结构来保存资源的请求和分配信息;
- 提供一种算法,利用上述信息来检测系统是否已进入死锁状态
- 如果系统中剩余的可用资源数足够满足进程的需求,那么这个进程暂时是不会阻塞的,可以顺利地执行下去
- 如果这个进程执行结束了把资源归还系统,就可能使某些正在等待资源的进程被激活,并顺利地执行下去
- 相应的,这些被激活的进程执行完了之后又会归还一些资源,这样可能又会激活另外一些阻塞的进程…
- 如果按上述过程分析,最终能消除所有边,就称这个图是可完全简化的。此时一定没有发生死锁(相当于能找到一个安全序列)
- 如果最终不能消除所有边,那么此时就是发生了死锁
- 最终还连着边的那些进程就是处于死锁状态的进程
算法实现
- 在资源分配图中,找出既不阻塞又不是孤点的进程 Pi(即找出一条有向边与它相连,且该进程的资源申请能够被满足)
- 在上图中, P1 是既不阻塞又不是孤点的进程结点,于是将 P1 的所有边消去。
- 进程 Pi 所释放的资源,可以唤醒某些因等待这些资源而阻塞的进程,原来的阻塞进程可能变为非阻塞进程
- 在上图中,P2 就由原来的阻塞进程变为非阻塞进程
- 根据上述方法进行一系列简化后,若能消去图中所有的边,则称该图是可完全简化的
死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁
死锁的解除
一旦检测出死锁的发生,就应该立即解除死锁。
补充:并不是系统中所有的进程都是死锁状态,用死锁检测算法化简资源分配图后,还连着边的那些进程就是死锁进程
解除死锁的主要方法有:
- 资源剥夺法:挂起(暂时放到外存)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿
- 撤销进程法 (终止进程法):强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。这种方式的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,已经接近结束了,一旦被终止可谓功亏一篑,以后还得从头再来。
- 进程回退法:让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点
如何决定 “对谁动手”