初识文件管理

image.png

文件的属性

  • 文件名:由创建文件的用户决定文件名,主要是为了方便用户找到文件,同一目录下不允许有重名文件
  • 标识符:一个系统内的各文件标识符唯一,对用户来说毫无可读性, 因此标识符只是操作系统用于区分各个文件的一种内部名称
  • 类型:指明文件的类型
  • 位置:文件存放的路径(让用户使用)、在外存中的地址(操作系统使用,对用户不可见)
  • 大小:指明文件大小
  • 创建时间、上次修改时间
  • 文件所有者信息
  • 保护信息:对文件进行保护的访问
  • 控制信息

    文件的逻辑结构

  • 文件的逻辑结构:在用户看来,文件内部的数据应该怎样组织起来

image.png

  • 无结构文件:由一些二进制字符流组成,又称 “流式文件”,如文本文件
  • 有结构文件:由一组相似的记录组成,又称 “记录式文件”,如数据库表

    • 记录是一组相关数据项的集合,比如数据库表中的一行
    • 数据项是文件系统中最基本的数据单位,比如数据库表中的一条记录中的一个列值

      目录结构

  • 目录结构就是:文件之间应该怎样组织起来

image.png

  • 目录其实也是一种特殊的有结构文件(由记录组成)
  • 所谓的 “目录” 其实就是我们熟悉的 “文件夹”

    操作系统向上提供的功能

  • 操作系统向上提供方便用户、应用程序使用文件的功能

image.png

  • 双击记事本后,应用程序通过操作系提供的 “读文件” 功能,即 read 系统调用,将文件数据从外存读入内存,并显示在屏幕上
  • 在 “记事本” 应用程序中编辑文件内容,点击 “保存” 后, “记事本”应用程序通过操作系统提供的 “写文件” 功能,即 write 系统调用, 将文件数据从内存写回外存
  • 点了 “删除” 之后, 通过操作系统提供的 “删除文件”功能,即 delete 系统调用, 将文件数据从外存中删除

    文件的物理结构

  • 文件的物理结构就是:在操作系统看来,文件应该如何存放在外存中

image.png

  • 操作系统以 “” 为单位为文件分配存储空间
  • 外存会分为一个个 “块 / 磁盘块 / 物理块”,每个磁盘块的大小是相等的
  • 文件的逻辑地址也可以分为(逻辑块号,块内地址)
  • 操作系统同样需要将逻辑地址转换为外存的物理地址(物理块号,块内地址)的形式
  • 块内地址的位数取决于磁盘的大小

image.png

文件的逻辑结构

  • 文件的逻辑结构:在用户看来,文件内部的数据应该怎样组织起来

image.png

无结构文件

  • 按文件是否有结构分类,可以分为无结构文件、有结构文件两种
  • 无结构文件:文件内部的数据就是一系列二进制流字符流组成。又称 “流式文件
    • 如: Windows 操作系统中的 .txt 文件
  • 流式文件内部的数据是一系列字符流,没有明显的结构特性,因此也不用探讨无结构文件的 “逻辑结构” 问题

    有结构文件

  • 有结构文件:由一组相似的记录组成,又称 “记录式文件”。每条记录又若干个数据项组成

    • 如: 数据库表文件,一般来说,每条记录有一个数据项可作为关键字(作为识别不同记录的 ID)

image.png image.png

  • 根据各条记录的长度(占用的存储空间)是否相等,又可分为定长记录可变长记录两种

image.png

  • 根据有结构文件中的各条记录在逻辑上如何组织,可以分为三类:顺序文件、索引文件、索引顺序文件

    顺序文件

  • 顺序文件:文件中的记录在逻辑上一个接一个的顺序排列,记录可以是定长的或可变长的。各个记录在物理上可以顺序存储链式存储

image.png

  • 顺序文件按照记录之间的顺序关键字是否有关可分为:

image.png

  • 小结:

image.png

  • 随机存取:快速找到第 i 个记录对应的地址

    索引文件

    image.png

  • 建立一张索引表以加快文件检索速度

  • 一条记录对应一个索引项

    索引顺序文件

    image.png

  • 建立一张索引表以加快文件检索速度

  • 一组记录对应一个索引项

    小结

    image.png

    文件的物理结构🌟

  • 文件的物理结构:文件数据应该如何存放在外存中

image.png image.png

连续分配

image.png

  • 连续分配方式要求每个文件在磁盘上占有一组连续的块
  • 优点:支持顺序访问和直接访问(即随机访问);连续分配的文件在顺序访问时速度最快
  • 缺点:不方便文件拓展;存储空间利用率低,会产生磁盘碎片

    非连续分配

    链接分配

  • 链接分配采取离散分配的方式,可以为文件分配离散的磁盘块。分为隐式链接显式链接两种

    隐式链接

    image.png

  • 隐式链接:除文件的最后一个盘块之外,每个盘块中都存有指向下一个盘块的指针。文件目录包括文件第一块的指针和最后一块的指针

  • 优点:很方便文件拓展,不会有碎片问题,外存利用率高
  • 缺点:只支持顺序访问,不支持随机访问,查找效率低,指向下一个盘块的指针也需要耗费少量的存储空间

注:考试题目中遇到未指明隐式 / 显式的 “链接分配”,默认指的是隐式链接的链接分配

显式链接

image.png

  • 显式链接——把用于链接文件各物理块的指针显式地存放在一张表中,即 文件分配表(FAT,File Allocation Table)。一个磁盘只会建立一张文件分配表。开机时文件分配表放入内存,并常驻内存
  • 优点:很方便文件拓展,不会有碎片问题,外存利用率高,并且支持随机访问。相比于隐式链接来说,地址转换时不需要访问磁盘,因此文件的访问效率更高
  • 缺点:文件分配表的需要占用一定的存储空间

    索引分配

    image.png

  • 如果索引表太大,一个索引块装不下,那么有三种解决方案:链接方案、多层索引、混合索引

    链接方案

    image.png

    多层索引

    image.png

  • 若采用三层索引,则文件的最大长度为 256 256 256 * 1KB = 16GB

  • 类似的,访问目标数据块,需要 4 次磁盘 I/O

    混合索引

    image.png image.png

    小结

    image.png image.png

    文件目录

    文件控制块 (FCB)🌟

    操作系统笔记 06 - 文件管理 - 图29

    目录结构

    单级目录结构

    操作系统笔记 06 - 文件管理 - 图30

    两级目录结构

    操作系统笔记 06 - 文件管理 - 图31

    多级目录结构

    操作系统笔记 06 - 文件管理 - 图32 操作系统笔记 06 - 文件管理 - 图33

  • 多级目录结构又称树形目录结构

  • 树形目录结构可以很方便地对文件进行分类,层次结构清晰,也能够更有效地进行文件的管理和保护。但是,树形结构不便于实现文件的共享。为此,提出了 “无环图目录结构”。

    无环图目录结构

    操作系统笔记 06 - 文件管理 - 图34

    索引节点

    操作系统笔记 06 - 文件管理 - 图35 操作系统笔记 06 - 文件管理 - 图36

    小结

    操作系统笔记 06 - 文件管理 - 图37

    文件存储空间管理🌟

    操作系统笔记 06 - 文件管理 - 图38

  • 文件存储空间管理:对空闲磁盘块的管理

    存储空间的划分与初始化

    操作系统笔记 06 - 文件管理 - 图39

    空闲表法

    操作系统笔记 06 - 文件管理 - 图40

    空闲链表法

    操作系统笔记 06 - 文件管理 - 图41 操作系统笔记 06 - 文件管理 - 图42 操作系统笔记 06 - 文件管理 - 图43

    位示图法

    操作系统笔记 06 - 文件管理 - 图44

    小结

    操作系统笔记 06 - 文件管理 - 图45

    文件操作

    操作系统笔记 06 - 文件管理 - 图46

  • 操作系统在处理 Create 系统调用时,主要做了两件事:

    • 在外存中找到文件所需的空间(结合上小节学习的空闲链表法、位示图、成组链接法等管理策略,找到空闲空间)
    • 根据文件存放路径的信息找到该目录对应的目录文件(此处就是 D:/Demo 目录),在目录中创建该文件对应的目录项。目录项中包含了文件名、文件在外存中的存放位置等信息
  • 操作系统在处理 Delete 系统调用时,主要做了几件事:
    • 根据文件存放路径找到相应的目录文件,从目录中找到文件名对应的目录项
    • 根据该目录项记录的文件在外存的存放位置、文件大小等信息,回收文件占用的磁盘块 (回收磁盘块时,根据空闲表法、空闲链表法、 位图法等管理策略的不同,需要做不同的处理)
    • 从目录表中删除文件对应的目录项
  • 操作系统在处理 open 系统调用时,主要做了几件事:
    • 根据文件存放路径找到相应的目录文件,从目录中找到文件名对应的的目录项,并检查该用户是否有指定的操作权限。
    • 将目录项复制到内存中的 “打开文件表” 中。并将对应表目的编号返回给用户。之后用户使用打开文件表的编号来指明要操作的文件
  • 操作系统在处理 Close 系统调用时,主要做了几件事:
    • 将进程的打开文件表相应表项删除
    • 回收分配给该文件的内存空间等资源
    • 系统打开文件表的打开计数器 count 减 1,若 count = 0,则删除对应表项
  • 进程使用 read 系统调用完成写操作
    • 需要指明是哪个文件(在支持 “打开文件” 操作的系统中,只需要提供文件在打开文件表中的索引号即可),
    • 还需要指明要读入多少数据(如:读入 1KB)、指明读入的数据要放在内存中的什么位置
    • 操作系统在处理 read 系统调用时,会从读指针指向的外存中,将用户指定大小的数据读入用户指定的内存区域中
  • 进程使用 write 系统调用完成写操作

    • 需要指明是哪个文件(在支持 “打开文件” 操作的系统中,只需要提供文件在打开文件表中的索引号即可)
    • 还需要指明要写出多少数据(如:写出 1KB)、写回外存的数据放在内存中的什么位置
    • 操作系统在处理 write 系统调用时,会从用户指定的内存区域中,将指定大小的数据写回写指针指向的外存

      文件共享

      操作系统笔记 06 - 文件管理 - 图47
  • 操作系统为用户提供文件共享功能,可以让多个用户共享地使用同一个文件

  • “快捷方式 “ 就是软链接

    文件保护

    操作系统笔记 06 - 文件管理 - 图48

  • 文件保护:保护文件数据的安全

    文件系统的层次结构

    操作系统笔记 06 - 文件管理 - 图49

  • 第一层:文件操作

  • 第二层:文件目录
  • 第三层:文件保护
  • 第四层:文件的逻辑结构
  • 第五层:文件的物理结构
  • 第六层:文件的存储空间管理和上一章的磁盘管理

操作系统笔记 06 - 文件管理 - 图50