分页存储管理

连续分配方式的缺点?

连续分配:为用户进程分配的必须是一个连续的内存空间。

非连续分配:为用户进程分配的可以是一些分散的内存空间。

分页存储管理思想

基本分页存储管理的思想――把内存分为一个个相等的小分区，再按照分区大小把进程拆分成一个个小部分。

分页存储管理基本概念

如何实现地址的转换？

逻辑地址和偏移地址的转化？

回顾：操作系统如何实现逻辑地址和偏移地址的转化？

如果采用分页技术，应该如何实现地址转换？

来看一个例子：

怎么计算物理地址：

要算出逻辑地址对应的页号
要知道该页号对应页面在内存中的起始地址
要算出逻辑地址在页面内的“偏移量”
物理地址=页面始址＋页内偏移量

十进制中怎么计算？

从上边的例子可以知道如何计算：

为了方便计算页号、页内偏移量,页面大小一般设为2的整数幂。

计算机二进制如何计算？

如果每个页面大小为2B，用二进制数表示逻辑地址，则末尾K位即为页内偏移量，其余部分就是页号。

因此，如果让每个页面的大小为2的整数幂，计算机就可以很方便地得出一个逻辑地址对应的页号和页内偏移量。

红色表示页号，黑色表示页内偏移量。

逻辑地址结构

地址结构包含两个部分:前一部分为页号，后一部分为页内偏移量w。在上图所示的例子中，地址长度为32位，其中0~11位为“页内偏移

量”，或称“页内地址”;12~31位为“页号”。

如果有K位表示“页内偏移量”，则说明该系统中一个页面的大小是2个内存单元
如果有M位表示“页号”，则说明在该系统中，一个进程最多允许有2M个页面

页表

为了能知道进程的每个页面在内存中存放的位置，操作系统要为每个进程建立一张页表。

为什么页号是隐含的？

页号即用来表示第几页，和分页思想差不多。

总结

地址变换机构

本节主要探讨上一节中的如何实现地址的转换。

基本地址变换机构

基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址。

页表寄存器

通常会在系统中设置一个页表寄存器（PTR），存放页表在内存中的起始地址F和页表长度M。进程未执行时，页表的始址和页表长度放在进程控制块(PCB）中，当进程被调度时，操作系统内核会把它们放到页表寄存器中。

过程

设页面大小为L，逻辑地址A到物理地址E的变换过程如下：

注意:页面大小是2的整数幂。

具体过程细节：

计算页号Р和页内偏移量w（如果用十进制数手算，则P=A/L，W=A%L;但是在计算机实际运行时，逻辑地址结构是固定不变的，因此计算机硬件可以更快地得到二进制表示的页号、页内偏移量)
比较页号P和页表长度M，若P>M，则产生越界中断，否则继续执行。

注意:页号是从0开始的，而页表长度至少是1，因此P=M时也会越界

页表中页号p对应的页表项地址=页表起始地址F+页号P页表项长度，取出该页表项内容b,即为内存块号。(注意区分页表项长度、页表长度、页面大小的区别。页表长度指的是这个页表中总共有几个页表项，即总共有几个页;页表项长度指的是每个页表项占多大的存储空间;页面大小指的是一个页面占多大的存储空间)
_计算E= b_L+w，用得到的物理地址E去访存。（如果内存块号、页面偏移量是用二进制表示的，那么把二者拼接起来就是最终的物理地址了)

第一次访问内存：访问页表

第二次访问内存：访问目标内存单元

举例

页表项的探讨

如果是三字节来表示页号，那么在内存中页表项能存储1365个页表项，会存在页内碎片。

总结

具有快表的地址变换机构

局部性原理

时间局部性:如果执行了程序中的某条指令，那么不久后这条指令很有可能再次执行;如果某个数据被访问过，不久之后该数据很可能再次被访问。(因为程序中存在大量的循环)
空间局部性:一旦程序访问了某个存储单元，在不久之后，其附近的存储单元也很有可能被访问。(因为很多数据在内存中都是连续存放的)

如果出现多次访问相同的内存块，那么使用基本地址变换就会每次都进行访存，浪费了大量时间。

快表

上小节介绍的基本地址变换机构中，每次要访问一个逻辑地址，都需要查询内存中的页表。由于局部性原埋，可能连续多次查到的都是同一个页表项。既然如此，能否利用这个特性减少访问页表的次数呢?

快表，又称联想寄存器(TLB），是一种访问速度比内存快很多的高速缓冲存储器，用来存放当前访问的若干页表项，以加速地址变换的过程。与此对应，内存中的页表常称为慢表。（类似于缓存）

过程

CPU给出逻辑地址，由某个硬件算得页号、页内偏移量，将页号与快表中的所有页号进行比较。
如果找到匹配的页号，说明要访问的页表项在快表中有副本，则直接从中取出该页对应的内存块号，再将内存块号与页内偏移量拼接形成物理地址，最后，访问该物理地址对应的内存单元。因此，若快表命中，则访问某个逻辑地址仅需一次访存即可。
如果没有找到匹配的页号，则需要访问内存中的页表，找到对应页表项，得到页面存放的内存块号，再将内存块号与页内偏移量拼接形成物理地址，最后，访问该物理地址对应的内存单元。因此，若快表未命中，则访问某个逻辑地址需要两次访存（注意:在找到页表项后，应同时将其存入快表，以便后面可能的再次访问。但若快表已满，则必须按照一定的算法对旧的页表项进行替换)

由于查询快表的速度比查询页表的速度快很多，因此只要快表命中，就可以节省很多时间。因为局部性原理，一般来说快表的命中率可以达到90%以上。

总结

两级页表

单级页表存在的问题

问题一:页表必须连续存放，因此当页表很大时，需要占用很多个连续的页框。

问题二:没有必要让整个页表常驻内存，因为进程在一段时间内可能只需要访问某几个特定的页面。

根据局部性原理可知，很多时候，进程在一段时间内只需要访问某几个页面就可以正常运行了。因此没有必要让整个页表都常驻内存。

两级页表原理

可将长长的页表进行分组，使每个内存块刚好可以放入一个分组（比如上个例子中，页面大小4KB，每个页表项4B，每个页面可存放1K个页表项，因此每1K个连续的页表项为一组，每组刚好占一个内存块，再讲各组离散地放到各个内存块中)

另外，要为离散分配的页表再建立一张页表，称为页目录表，或称外层页表，或称顶层页表。

图示：

二级页面可以划分如下：

如何实现地址变换?

解决第一个问题。

按照地址结构将逻辑地址拆分成三部分
从PCB中读出页目录表始址，再根据一级页号查页目录表，找到下一级页表在内存中的存放位置
根据二级页号查表，找到最终想访问的内存块号
结合页内偏移量得到物理地址

页表访问

解决第二个问题

注意细节

若采用多级页表机制，则各级页表的大小不能超过一个页面
例:某系统按字节编址，采用40位逻辑地址，页面大小为4KB，页表项大小为4B，假设采用纯页式存储，则要采用(）级页表，页内偏移量为(）位?
两级页表的访存次数分析（假设没有快表机构)
第一次访存:访问内存中的页目录表
第二次访存:访问内存中的二级页表
第三次访存:访问目标内存单元