页面替换算法

功能:当缺页中断发生,需要调入新的页面而内存已满时,选择内存当中哪个物理页面被置换。
目标:尽可能地减少页面的换进换出次数(即缺页中断的次数)。具体来说,把未来不再使用的或短期内较少使用的页面换出,通常只能在局部原理指导下依据过去的统计数据来进行预测。

最优页面替换算法

基本思路:当一个缺页中断发生时,对于保存在内存当中的每一个逻辑页面,计算在它的下一次访问之前,还需等待多长时间,从中选择等待时间最长的那个作为被置换的页面。
这只是一种理想情况,在实际中无法实现,因为操作系统无法知道每一个页面要等待多长时间以后才会被再次访问。
可用作其它算法的性能评价的依据(在一个模拟器上运行某个程序,并记录每一次的页面访问情况,在第二遍运行时即可使用最优算法)。
简单一句话,最优页面替换算法就是替换在将来最长时间内不需要的页面。
假设页帧(Page Frames)的大小为 4, 请求页面序列为:7, 0, 1, 2, 0, 3, 0, 4, 2, 3, 0, 3, 2,采用最优页面替换算法的缺页异常(Page Fault)的次数为多少?
2021-05-11-08-31-40-024898.png
初始时,页槽均为空,所以请求页面7 0 1 2被分配到空的页槽,产生 4 次缺页异常。
紧接着,请求页面0 时,发现已经存在页帧中,0 次缺页异常;
当请求页面 3 时,页面 7 由于为在将来最长时间内不需要访问,所以被 3 替换,1 次缺页异常。
0 号页面命中,0 次页面异常;
请求页面 4 不存在页帧中,替换页面 1 ,1 次缺页异常;
对之后的请求页面序列2,3,0,3,2而言,均命中,固无缺页异常。
所以总共发生了6次缺页异常,即图中的 Miss 状态,其中的 Hit 表示命中,无缺页异常产生。

模拟实现一个最优页面替换算法:

输入 : 页帧数 fn = 3
页面 pg[] = {7, 0, 1, 2, 0, 3, 0, 4, 2, 3, 0, 3, 2, 1, 2, 0, 1, 7, 0, 1};
输出 : 命中次数 hits = 11 缺页异常 miss = 9
输入 : 页帧数 fn = 4 页面 pg[] = {7, 0, 1, 2, 0, 3, 0, 4, 2, 3, 0, 3, 2};
输出 : 命中次数 hits = 7 缺页异常 miss = 6
我们以页帧数 4 ,请求序列{7, 0, 1, 2, 0, 3, 0, 4, 2, 3, 0, 3, 2}为例进行说明。
首先我们创建一个空的数组fr模拟页帧:
2021-05-11-08-31-40-155616.png
请求页面 7,发现不在数组fr当中且数组fr的大小fr.size() < fn页帧大小,则直接将请求页面 7 插入数组fr中:
2021-05-11-08-31-40-239394.png
请求页面{0,1,2}与请求页面 7 情况类似,则依次将其添加到数组当中:
2021-05-11-08-31-40-340125.png
紧接着请求页面 0,遍历数组fr,发现 0 号页面已经在其中了,则命中次数hit加 1。
请求 3 号页面,遍历数组fr,发现不在其中且数组已满(fr.size == fn),则需要找到要替换的页面,此时选择替换在将来最长时间内不需要的页面。这里的将来最长时间不需要的页面,我们可以使用页面数组pg[]的下标进行表示。
遍历数组fr[],并结合请求页面数组pg[]找到在将来最长时间内不需要的页面。
fr[0] = 7,我们从 3 号页面开始在数组pg[]中向后查找 7 号页面,发现其根本不存在,也就说 7 号页面就是在将来最长时间内不需要的页面。所以 3 号页面替换 7 号页面。
2021-05-11-08-31-40-841783.png
再访问 0 号页面,发现存在,则跳过;
访问 4 号页面,发现不在页帧数组fr当中,则替换掉在将来最长时间内不需要的页面 1:
2021-05-11-08-31-41-026290.png
之后访问页面{2, 3, 0, 3, 2}均为命中,总共命中 6 次。

参考实现

  1. #include <bits/stdc++.h>
  2. using namespace std;
  3. // 用于检查页帧中是否存在当前要访问的页 key
  4. bool search(int key, vector<int>& fr)
  5. {
  6. for (int i = 0; i < fr.size(); i++)
  7. if (fr[i] == key)
  8. return true;
  9. return false;
  10. }
  11. // 用于预测将来
  12. int predict(int pg[], vector<int>& fr, int pn, int index)
  13. {
  14. // 存储在将来最近要使用的页面的索引
  15. int res = -1, farthest = index;
  16. for (int i = 0; i < fr.size(); i++) {
  17. int j;
  18. for (j = index; j < pn; j++) {
  19. if (fr[i] == pg[j]) {
  20. if (j > farthest) {
  21. farthest = j;
  22. res = i;
  23. }
  24. break;
  25. }
  26. }
  27. // 如果某个页面将来从未被引用过,请将其返回。
  28. if (j == pn)
  29. return i;
  30. }
  31. // 如果 fr 中的所有页在将来都没出现过,则返回其中任何页,我们返回 0。否则我们将返回 res。
  32. return (res == -1) ? 0 : res;
  33. }
  34. /**
  35. * pg[] 请求页面序列
  36. * pn 请求页面数
  37. * fn 页帧数
  38. */
  39. void optimalPage(int pg[], int pn, int fn)
  40. {
  41. // 为给定数量的帧创建一个数组,并将其初始化为空。
  42. vector<int> fr;
  43. // 遍历页面引用数组并检查未命中和命中。
  44. int hit = 0;
  45. for (int i = 0; i < pn; i++) {
  46. // 在内存中命中页面 : HIT
  47. if (search(pg[i], fr)) {
  48. hit++;
  49. continue;
  50. }
  51. // 页面在内存中不存在 : MISS
  52. // 如果页帧中有可用的空间,则直接将缺失页加入其中。
  53. if (fr.size() < fn) {
  54. fr.push_back(pg[i]);
  55. }
  56. else { // 找到要替换的页
  57. int j = predict(pg, fr, pn, i + 1);
  58. fr[j] = pg[i];
  59. }
  60. }
  61. cout << "命中次数 = " << hit << endl;
  62. cout << "未命中次数 = " << pn - hit << endl;
  63. }
  64. int main()
  65. {
  66. int pg[] = { 7, 0, 1, 2, 0, 3, 0, 4, 2, 3, 0, 3, 2 };
  67. int pn = sizeof(pg) / sizeof(pg[0]);
  68. int fn = 4;
  69. optimalPage(pg, pn, fn);
  70. return 0;
  71. }

其中的search函数大家可以换成哈希或者二分查找等,其中最关键的是predict()函数,用于查找在将来最长时间内不会使用到的页面,其实也就是两层for循环嵌套。

先进先出算法

FIFO(First In,First Out)就是先进先出算法。
基本思路:选择在内存中驻留时间最长的页面并淘汰。具体来说,系统维护着一个链表,记录了所有位于内存当中的逻辑页面。从链表的排列顺序来看,链首页面的驻留时间最长,链尾页面的驻留时间最短。当发生一个缺页中断时,把链首页面淘汰出局,并把新的页面添加到链表的末尾。
性能较差,调出的页面可能是经常要访问的页面,并且产生 Belady 现象,FIFO 算法很少单独使用。
假设页帧(Page Frames)的大小为 4, 请求页面序列为:7, 0, 1, 2, 0, 3, 0, 4, 2, 3, 0, 3, 2,采用 FIFO 算法的缺页异常的次数为多少?
2021-05-11-08-31-41-259664.png
如上图所示,FIFO,先进先出,类似队列的特性。
对于请求页面7,0,1,2,发生 4 次缺页中断,分别为其分配页;
访问页面 0 时,命中;
访问页面 3 时,缺页异常,此时会淘汰掉位于队列头的页面7,将页面 3 插入到队尾,即选择在内存中驻留时间最长的页面并淘汰。
页面 0 命中;
访问页面 4 时,发生缺页异常,此时淘汰页面 0 ;
访问页面 2 和 3 时,均命中;
访问页面 0 时,缺页异常,淘汰页面 1 ,插入页面 0 ;
最后访问页面 3 和 2 均命中。
共发生缺页异常次数为 7 次。

最近最少使用算法

时钟页面置换算法

Clock 页面置换算法,LRU 的近似,对 FIFO 的一种改进;
基本思路:

  • 需要用到页表顶当中的访问位(Access Bit),当一个页面被装入内存时,把该位初始化为 0。然后如果这个页面被访问(读写),则把该位置置为 1。
  • 把各个页面组织成环形链表(类似钟表面),把指针指向最老的页面(最先进来的页面);
  • 当发生一个缺页中断时,考察指针所指向的最老页面,若它的访问位为 0 ,立即淘汰;若访问位为 1,则把该位置置为 0,然后指针向下移动一格。如此下去,直到找到被淘汰的页面,然后把指针移动到它的下一格。

假设页帧(Page Frames)的大小为 4, 请求页面序列为:7, 0, 1, 2, 0, 3, 0, 4, 2, 3, 0, 3, 2,采用 时钟页面替换算法的缺页异常的次数为多少?
初始时,页帧为空,如下图所示的一个环形链表,是不是很想一个时钟:
2021-05-11-08-31-41-407269.png
请求页面 7,产生缺页中断,则将其装入内存,把该页面的访问位初始化为 0:
2021-05-11-08-31-41-569836.png
依次访问页面 0、1 和 2,与前面的方法类似:
2021-05-11-08-31-41-713451.png
紧接着请求页面 0 ,发现页面 0 已经在内存中了,则硬件会把访问位置为 1,并将指针下移:
2021-05-11-08-31-41-950815.png
请求页面 3 时,发生缺页中断,此时指针所指向的页面 7 的访问位为 0,则立即淘汰掉并替换为页面 3,访问位为 1:
2021-05-11-08-31-42-032597.png
请求页面 0,已存在内存中,硬件将其访问位置为 1,与上图一样,没有变化;
请求页面 4,发生缺页中断,首先将 3号页面的访问位置为 0, 0 号页面的访问位置为 0,指针下移,发现 1 号页面的访问位为0,则淘汰页面 1,替换为 4,访问位置 1 并下移指针:
2021-05-11-08-31-42-360719.png
请求页面 2 ,已存在内存中,硬件将其访问位置 1:
2021-05-11-08-31-42-547221.png
请求 3 号页面,将 3 号页面的访问位置为 1,将指针下移:
2021-05-11-08-31-42-684854.png
请求 0 号页面,将 0 号页面的访问位置 1,指针下移:
2021-05-11-08-31-43-116698.png
总的缺页中断次数为 5 次。

最不常用算法 LFU

基本思路:当一个缺页中断发生时,选择访问次数最少的那个页面,并淘汰之。
实现方法:对每一个页设置一个访问计数器,每当一个页面被访问时,该页面的访问计数器加 1。在发生缺页中断时,淘汰计数值最小的那个页面。如果所有页具有相同的频率,则对该页采取 LRU 方法并删除该页。
LRU 和 LFU 的区别:LRU 考察的是多久未访问,时间越短越好;而 LFU 考虑的是访问次数或频度,访问次数越多越好。