分页存储管理

连续分配方式的缺点?

image.png

连续分配:为用户进程分配的必须是一个连续的内存空间。

非连续分配:为用户进程分配的可以是一些分散的内存空间。

分页存储管理思想

基本分页存储管理的思想――把内存分为一个个相等的小分区,再按照分区大小把进程拆分成一个个小部分。

image.png

分页存储管理基本概念

image.png

如何实现地址的转换?

逻辑地址和偏移地址的转化?

回顾:操作系统如何实现逻辑地址和偏移地址的转化?

image.png

如果采用分页技术,应该如何实现地址转换?

来看一个例子:

image.png

怎么计算物理地址:

  1. 要算出逻辑地址对应的页号
  2. 要知道该页号对应页面在内存中的起始地址
  3. 要算出逻辑地址在页面内的“偏移量”
  4. 物理地址=页面始址+页内偏移量

十进制中怎么计算?

从上边的例子可以知道如何计算:

image.png

为了方便计算页号、页内偏移量,页面大小一般设为2的整数幂。

计算机二进制如何计算?

如果每个页面大小为2B,用二进制数表示逻辑地址,则末尾K位即为页内偏移量,其余部分就是页号。

因此,如果让每个页面的大小为2的整数幂,计算机就可以很方便地得出一个逻辑地址对应的页号和页内偏移量。

红色表示页号,黑色表示页内偏移量。

image.png

image.png

逻辑地址结构

image.png

地址结构包含两个部分:前一部分为页号,后一部分为页内偏移量w。在上图所示的例子中,地址长度为32位,其中0~11位为“页内偏移

量”,或称“页内地址”;12~31位为“页号”。

  • 如果有K位表示“页内偏移量”,则说明该系统中一个页面的大小是2个内存单元
  • 如果有M位表示“页号”,则说明在该系统中,一个进程最多允许有2M个页面

页表

为了能知道进程的每个页面在内存中存放的位置,操作系统要为每个进程建立一张页表。

image.png

为什么页号是隐含的?

image.png

页号即用来表示第几页,和分页思想差不多。

总结

image.png

地址变换机构

本节主要探讨上一节中的如何实现地址的转换。

基本地址变换机构

基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址。

页表寄存器

通常会在系统中设置一个页表寄存器(PTR),存放页表在内存中的起始地址F和页表长度M。进程未执行时,页表的始址和页表长度放在进程控制块(PCB)中,当进程被调度时,操作系统内核会把它们放到页表寄存器中。

过程

设页面大小为L,逻辑地址A到物理地址E的变换过程如下:

注意:页面大小是2的整数幂。

image.png

具体过程细节:

  1. 计算页号Р和页内偏移量w(如果用十进制数手算,则P=A/L,W=A%L;但是在计算机实际运行时,逻辑地址结构是固定不变的,因此计算机硬件可以更快地得到二进制表示的页号、页内偏移量)
  2. 比较页号P和页表长度M,若P>M,则产生越界中断,否则继续执行。

    注意:页号是从0开始的,而页表长度至少是1,因此P=M时也会越界

  1. 页表中页号p对应的页表项地址=页表起始地址F+页号P页表项长度,取出该页表项内容b,即为内存块号。(注意区分页表项长度、页表长度、页面大小的区别。页表长度指的是这个页表中总共有几个页表项,即总共有几个页;页表项长度指的是每个页表项占多大的存储空间;页面大小指的是一个页面占多大的存储空间)
  2. _计算E= b_L+w,用得到的物理地址E去访存。(如果内存块号、页面偏移量是用二进制表示的,那么把二者拼接起来就是最终的物理地址了)

第一次访问内存:访问页表

第二次访问内存:访问目标内存单元

举例

image.png

页表项的探讨

image.png

如果是三字节来表示页号,那么在内存中页表项能存储1365个页表项,会存在页内碎片。

image.png

总结

image.png

具有快表的地址变换机构

局部性原理

  • 时间局部性:如果执行了程序中的某条指令,那么不久后这条指令很有可能再次执行;如果某个数据被访问过,不久之后该数据很可能再次被访问。(因为程序中存在大量的循环)
  • 空间局部性:一旦程序访问了某个存储单元,在不久之后,其附近的存储单元也很有可能被访问。(因为很多数据在内存中都是连续存放的)

image.png

如果出现多次访问相同的内存块,那么使用基本地址变换就会每次都进行访存,浪费了大量时间。

快表

上小节介绍的基本地址变换机构中,每次要访问一个逻辑地址,都需要查询内存中的页表。由于局部性原埋,可能连续多次查到的都是同一个页表项。既然如此,能否利用这个特性减少访问页表的次数呢?

快表,又称联想寄存器(TLB),是一种访问速度比内存快很多的高速缓冲存储器,用来存放当前访问的若干页表项,以加速地址变换的过程。与此对应,内存中的页表常称为慢表。(类似于缓存)

过程

image.png

  1. CPU给出逻辑地址,由某个硬件算得页号、页内偏移量,将页号与快表中的所有页号进行比较。
  2. 如果找到匹配的页号,说明要访问的页表项在快表中有副本,则直接从中取出该页对应的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后,访问该物理地址对应的内存单元。因此,若快表命中,则访问某个逻辑地址仅需一次访存即可。
  3. 如果没有找到匹配的页号,则需要访问内存中的页表,找到对应页表项,得到页面存放的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后,访问该物理地址对应的内存单元。因此,若快表未命中,则访问某个逻辑地址需要两次访存(注意:在找到页表项后,应同时将其存入快表,以便后面可能的再次访问。但若快表已满,则必须按照一定的算法对旧的页表项进行替换)

由于查询快表的速度比查询页表的速度快很多,因此只要快表命中,就可以节省很多时间。因为局部性原理,一般来说快表的命中率可以达到90%以上。

image.png

总结

image.png

两级页表

单级页表存在的问题

问题一:页表必须连续存放,因此当页表很大时,需要占用很多个连续的页框。

问题二:没有必要让整个页表常驻内存,因为进程在一段时间内可能只需要访问某几个特定的页面。

image.png

根据局部性原理可知,很多时候,进程在一段时间内只需要访问某几个页面就可以正常运行了。因此没有必要让整个页表都常驻内存。

两级页表原理

可将长长的页表进行分组,使每个内存块刚好可以放入一个分组(比如上个例子中,页面大小4KB,每个页表项4B,每个页面可存放1K个页表项,因此每1K个连续的页表项为一组,每组刚好占一个内存块,再讲各组离散地放到各个内存块中)

另外,要为离散分配的页表再建立一张页表,称为页目录表,或称外层页表,或称顶层页表。

图示:

image.png

二级页面可以划分如下:

image.png

如何实现地址变换?

解决第一个问题。

  • 按照地址结构将逻辑地址拆分成三部分
  • 从PCB中读出页目录表始址,再根据一级页号查页目录表,找到下一级页表在内存中的存放位置
  • 根据二级页号查表,找到最终想访问的内存块号
  • 结合页内偏移量得到物理地址

image.png

页表访问

解决第二个问题

image.png

注意细节

  1. 若采用多级页表机制,则各级页表的大小不能超过一个页面
    例:某系统按字节编址,采用40位逻辑地址,页面大小为4KB,页表项大小为4B,假设采用纯页式存储,则要采用()级页表,页内偏移量为()位?
    image.png
  2. 两级页表的访存次数分析(假设没有快表机构)
    第一次访存:访问内存中的页目录表
    第二次访存:访问内存中的二级页表
    第三次访存:访问目标内存单元

总结

image.png