分页存储管理
连续分配方式的缺点?
连续分配:为用户进程分配的必须是一个连续的内存空间。
非连续分配:为用户进程分配的可以是一些分散的内存空间。
分页存储管理思想
基本分页存储管理的思想――把内存分为一个个相等的小分区,再按照分区大小把进程拆分成一个个小部分。
分页存储管理基本概念
如何实现地址的转换?
逻辑地址和偏移地址的转化?
回顾:操作系统如何实现逻辑地址和偏移地址的转化?
如果采用分页技术,应该如何实现地址转换?
来看一个例子:
怎么计算物理地址:
- 要算出逻辑地址对应的页号
- 要知道该页号对应页面在内存中的起始地址
- 要算出逻辑地址在页面内的“偏移量”
- 物理地址=页面始址+页内偏移量
十进制中怎么计算?
从上边的例子可以知道如何计算:
为了方便计算页号、页内偏移量,页面大小一般设为2的整数幂。
计算机二进制如何计算?
如果每个页面大小为2B,用二进制数表示逻辑地址,则末尾K位即为页内偏移量,其余部分就是页号。
因此,如果让每个页面的大小为2的整数幂,计算机就可以很方便地得出一个逻辑地址对应的页号和页内偏移量。
红色表示页号,黑色表示页内偏移量。
逻辑地址结构
地址结构包含两个部分:前一部分为页号,后一部分为页内偏移量w。在上图所示的例子中,地址长度为32位,其中0~11位为“页内偏移
量”,或称“页内地址”;12~31位为“页号”。
- 如果有K位表示“页内偏移量”,则说明该系统中一个页面的大小是2个内存单元
- 如果有M位表示“页号”,则说明在该系统中,一个进程最多允许有2M个页面
页表
为了能知道进程的每个页面在内存中存放的位置,操作系统要为每个进程建立一张页表。
为什么页号是隐含的?
页号即用来表示第几页,和分页思想差不多。
总结
地址变换机构
本节主要探讨上一节中的如何实现地址的转换。
基本地址变换机构
基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址。
页表寄存器
通常会在系统中设置一个页表寄存器(PTR),存放页表在内存中的起始地址F和页表长度M。进程未执行时,页表的始址和页表长度放在进程控制块(PCB)中,当进程被调度时,操作系统内核会把它们放到页表寄存器中。
过程
设页面大小为L,逻辑地址A到物理地址E的变换过程如下:
注意:页面大小是2的整数幂。
具体过程细节:
- 计算页号Р和页内偏移量w(如果用十进制数手算,则P=A/L,W=A%L;但是在计算机实际运行时,逻辑地址结构是固定不变的,因此计算机硬件可以更快地得到二进制表示的页号、页内偏移量)
- 比较页号P和页表长度M,若P>M,则产生越界中断,否则继续执行。
注意:页号是从0开始的,而页表长度至少是1,因此P=M时也会越界
- 页表中页号p对应的页表项地址=页表起始地址F+页号P页表项长度,取出该页表项内容b,即为内存块号。(注意区分页表项长度、页表长度、页面大小的区别。页表长度指的是这个页表中总共有几个页表项,即总共有几个页;页表项长度指的是每个页表项占多大的存储空间;页面大小指的是一个页面占多大的存储空间)
- _计算E= b_L+w,用得到的物理地址E去访存。(如果内存块号、页面偏移量是用二进制表示的,那么把二者拼接起来就是最终的物理地址了)
第一次访问内存:访问页表
第二次访问内存:访问目标内存单元
举例
页表项的探讨
如果是三字节来表示页号,那么在内存中页表项能存储1365个页表项,会存在页内碎片。
总结
具有快表的地址变换机构
局部性原理
- 时间局部性:如果执行了程序中的某条指令,那么不久后这条指令很有可能再次执行;如果某个数据被访问过,不久之后该数据很可能再次被访问。(因为程序中存在大量的循环)
- 空间局部性:一旦程序访问了某个存储单元,在不久之后,其附近的存储单元也很有可能被访问。(因为很多数据在内存中都是连续存放的)
如果出现多次访问相同的内存块,那么使用基本地址变换就会每次都进行访存,浪费了大量时间。
快表
上小节介绍的基本地址变换机构中,每次要访问一个逻辑地址,都需要查询内存中的页表。由于局部性原埋,可能连续多次查到的都是同一个页表项。既然如此,能否利用这个特性减少访问页表的次数呢?
快表,又称联想寄存器(TLB),是一种访问速度比内存快很多的高速缓冲存储器,用来存放当前访问的若干页表项,以加速地址变换的过程。与此对应,内存中的页表常称为慢表。(类似于缓存)
过程
- CPU给出逻辑地址,由某个硬件算得页号、页内偏移量,将页号与快表中的所有页号进行比较。
- 如果找到匹配的页号,说明要访问的页表项在快表中有副本,则直接从中取出该页对应的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后,访问该物理地址对应的内存单元。因此,若快表命中,则访问某个逻辑地址仅需一次访存即可。
- 如果没有找到匹配的页号,则需要访问内存中的页表,找到对应页表项,得到页面存放的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后,访问该物理地址对应的内存单元。因此,若快表未命中,则访问某个逻辑地址需要两次访存(注意:在找到页表项后,应同时将其存入快表,以便后面可能的再次访问。但若快表已满,则必须按照一定的算法对旧的页表项进行替换)
由于查询快表的速度比查询页表的速度快很多,因此只要快表命中,就可以节省很多时间。因为局部性原理,一般来说快表的命中率可以达到90%以上。
总结
两级页表
单级页表存在的问题
问题一:页表必须连续存放,因此当页表很大时,需要占用很多个连续的页框。
问题二:没有必要让整个页表常驻内存,因为进程在一段时间内可能只需要访问某几个特定的页面。
根据局部性原理可知,很多时候,进程在一段时间内只需要访问某几个页面就可以正常运行了。因此没有必要让整个页表都常驻内存。
两级页表原理
可将长长的页表进行分组,使每个内存块刚好可以放入一个分组(比如上个例子中,页面大小4KB,每个页表项4B,每个页面可存放1K个页表项,因此每1K个连续的页表项为一组,每组刚好占一个内存块,再讲各组离散地放到各个内存块中)
另外,要为离散分配的页表再建立一张页表,称为页目录表,或称外层页表,或称顶层页表。
图示:
二级页面可以划分如下:
如何实现地址变换?
解决第一个问题。
- 按照地址结构将逻辑地址拆分成三部分
- 从PCB中读出页目录表始址,再根据一级页号查页目录表,找到下一级页表在内存中的存放位置
- 根据二级页号查表,找到最终想访问的内存块号
- 结合页内偏移量得到物理地址
页表访问
解决第二个问题
注意细节
- 若采用多级页表机制,则各级页表的大小不能超过一个页面
例:某系统按字节编址,采用40位逻辑地址,页面大小为4KB,页表项大小为4B,假设采用纯页式存储,则要采用()级页表,页内偏移量为()位? - 两级页表的访存次数分析(假设没有快表机构)
第一次访存:访问内存中的页目录表
第二次访存:访问内存中的二级页表
第三次访存:访问目标内存单元