后记

文件系统
假设这里有一块硬盘，大小为 1T
文件系统的设计步骤思考 - 图1
还有一堆文件
文件系统的设计步骤思考 - 图2
这些文件在硬盘看来，就是一堆二进制数据而已
文件系统的设计步骤思考 - 图3
准备把这些文件存储在硬盘上，并在需要的时候读取出来。
要设计怎样的软件，才能更方便地在硬盘中读写这些文件呢？
首先不想和复杂的扇区，设备驱动等细节打交道，因此先实现了一个简单的功能，将硬盘按逻辑分成一个个的块，并可以以块为单位进行读写。
每个块就定义为两个物理扇区的大小，即 1024 字节，就是 1KB 啦。
硬盘太大不好分析，就假设硬盘只有 1MB，那么这块硬盘则有 1024 个块。
文件系统的设计步骤思考 - 图4
可以开始存文件了！准备一个文件
文件系统的设计步骤思考 - 图5
随便选个块放进去，3 号块吧！
文件系统的设计步骤思考 - 图6
再存一个文件！
这里有问题了，万一这个文件也存到了 3 号块，不是把原来的文件覆盖了么？不行，得有一个地方记录，现在可使用的块有哪些，像这样。

块 0：未使用
块 1：未使用
块 2：未使用
块 3：已使用
块 4：未使用
…
块 1023：未使用

那就用 0 号块，来记录所有块的使用情况吧！怎么记录呢？
位图！
文件系统的设计步骤思考 - 图7
给块 0 起个名字，叫块位图，之后这个块 0 就专门用来记录所有块的使用情况，不再用来存具体文件了。
文件系统的设计步骤思考 - 图8
当再存入一个新文件时，只需要在块位图中找到第一个为 0 的位，就可以找到第一个还未被使用的块，将文件存入。同时，别忘了把块位图中的相应位置 1。
下面，尝试读取刚刚的文件。
又遇到问题了，怎么找到刚刚的文件呢？根据块号么？这也太蠢了，就像去书店找书，店员让提供书的编号，而不是书名，显然不合理。
因此给每个文件起一个名字，叫文件名，通过它来寻找这个文件。
那必然就要有一个地方，记录文件名与块号的对应关系，像这样。

葵花宝典.txt：3 号块
数学期末复习资料.mp4：5 号块
低并发编程的秘密.pdf：10 号块
…

既然都要选一个地方记录文件名称了，不妨多记录一点关心的信息吧，比如文件大小、文件创建时间、文件权限等。
这些东西自然也要保存在硬盘上，选择用一个固定大小的空间，来表示这些信息，多大空间呢？128 字节吧。
文件系统的设计步骤思考 - 图9
将这 128 字节的结构体，叫做一个inode。
之后，每存入一个新的文件，不但要占用一个块来存放这个文件本身，还要占用一个 inode 来存放文件的这些元信息，并且这个 inode 的所在块号这个字段，就指向这个文件所在的块号。
文件系统的设计步骤思考 - 图10
如果一个 inode 为 128 字节，那么一个块就可以容纳 8 个 inode，可以将这些 inode 编上号。
文件系统的设计步骤思考 - 图11
如果觉得 inode 数不够，也可以用两个或者多个块来存放 inode 信息，但这样用于存放数据的块就少了，这就看自己的平衡了。
文件系统的设计步骤思考 - 图12
同样，和块位图管理块的使用情况一样，也需要一个inode 位图，来管理 inode 的使用情况。就把 inode 位图，放在 1 号块吧！
同时，把 inode 信息，放在 2 号块，一共存 8 条 inode，这样 2 号块就叫做inode 表。
现在文件系统结构，变成了下面这个样子。
文件系统的设计步骤思考 - 图13
注意：块位图是管理可用的块，每一位代表一个块的使用与否。inode 位图管理的是一条一条的 inode，并不是 inode 所占用的块，比如上图中有 8 条 inode，则 inode 位图中就有 8 位是管理他们的使用与否。
现在文件很小，一个块就能容下。
但如果需要两个块、三个块、四个块呢？
很简单，只需要采用连续存储法，而 inode 则只记录文件的第一个块，以及后面还需要多少块，即可。
这种办法的缺点就是：容易留下大大小小的空洞，新的文件到来以后，难以找到合适的空白块，空间会被浪费。
文件系统的设计步骤思考 - 图14
看来这种方式不行，那怎么办呢？
既然在 inode 中记录了文件所在的块号，为什么不扩展一下，多记录几块呢？
文件系统的设计步骤思考 - 图15
原来在 inode 中只记录了一个块号，现在扩展一下，记录 8 个块号！而且这些块不需要连续。
文件系统的设计步骤思考 - 图16
这是个可行的办法！
但是这也仅仅能表示 8 个块，能记录的最大文件是 8K（记住，一个块是 1K）, 现在的文件轻松就超过这个限制了，这怎么办？
很简单，可以让其中一个块，作为间接索引。
文件系统的设计步骤思考 - 图17
这样瞬间就有 263 个块（多了 256 -1 个块）可用了，这种索引叫一级间接索引。
如果还嫌不够，就再弄一个块做一级间接索引，或者做二级间接索引（二级间接索引则可以多出 256 256 - 1 个块）。
文件系统暂且先只弄一个一级间接索引。硬盘一共才 1024 个块，一个文件 263 个块够大了。再大了不允许。
好了，现在已经可以保存很大的文件了，并且可以通过文件名和文件大小，将它们准确读取出来啦！
但得精益求精，再想想看这个文件系统有什么毛病。
比如，inode 数量不够时，怎么得知的呢？是不是需要在 inode 位图中找，找不到了才知道不够用了？
同样，对于块数量不够时，也是如此。
要是有个全局的地方，来记录这一切，就好了，也方便随时调整，比如这样
inode 数量
空闲 inode 数量
块数量
空闲块数量
那就再占用一个块来存储这些数据吧！由于他们看起来像是站在上帝视角来描述这个文件系统的，所以把它放在最开始的块上，并把它叫做超级块，现在的布局如下。

继续精益求精。
现在，块位图、inode 位图、inode 表，都是是固定地占据这块 1、块 2、块 3 这三个位置。
假如之后 inode 的数量很多，使得 inode 表或者 inode 位图需要占据多个块，怎么办？
或者，块的数量增多（硬盘本身大了，或者每个块变小了），块位图需要占据多个块，怎么办？
程序是死的，不告诉它哪个块表示什么，它可不会自己猜。
很简单，与超级块记录信息一样，这些信息也选择一个块来记录，就不怕了。那就选择紧跟在超级块后面的 1 号块来记录这些信息吧，并把它称之为*块描述符。
文件系统的设计步骤思考 - 图19
当然，这些所在块号只是记录起始块号，块位图、inode 位图、inode 表分别都可以占用多个块。
好了，大功告成！
现在，再尝试存入一批文件。

葵花宝典.txt
数学期末复习资料.mp4
赘婿1.mp4
赘婿2.mp4
赘婿3.mp4
赘婿4.mp4
低并发编程的秘密.pdf

这看着好不爽，所有的文件都是平铺开的，能不能拥有层级关系呢？比如这样

葵花宝典.txt
数学期末复习资料.mp4
赘婿
- 赘婿1.mp4
- 赘婿2.mp4
- 赘婿3.mp4
- 赘婿4.mp4
低并发编程的秘密.pdf

将葵花宝典.txt 这种称为普通文件，将赘婿这种称为目录文件，如果要访问赘婿1.mp4，那全文件名要写成
赘婿/赘婿1.mp4。
如何做到这一点呢？那又得把 inode 结构拿出来说事了。
文件系统的设计步骤思考 - 图20
此时需要一个属性来区分这个文件是普通文件，还是目录文件。
缺什么就补什么，已经很熟悉了，专门加一个 4 字节，来表示文件类型。
文件系统的设计步骤思考 - 图21
如果是普通文件，则这个 inode 所指向的数据块仍然和之前一样，就是文件本身原封不动的内容。
但如果是目录文件，则这个 inode 所指向的数据块，就需要重新规划了。
这个数据块里应该是什么样子呢？可以是一个一个指向不同 inode 的紧挨着的结构体，比如这样。
文件系统的设计步骤思考 - 图22
这样先通过赘婿这个目录文件，找到所在的数据块。再根据这个数据块里的一个个带有inode信息的结构体，找到这个目录下的所有文件。
不过这样的话，想想看，如果想要查看一下赘婿这个目录下的所有文件（比如 ll 命令），将文件名和文件类型都展示出来，怎么办呢？
就需要把一个个结构体指向的 inode 从 inode 表中取出，再把文件名和文件类型取出，这很是浪费时间。
而让用户看到一个目录下的所有文件，又是一个极其常见的操作。
所以，不如把文件名和文件类型这种常见的信息，放在数据块中的结构体里吧。
文件系统的设计步骤思考 - 图23
同时，inode 结构中的文件名，好像就没啥用了，这种变长的东西放在这种定长的结构中本身就很讨厌，早就想给它去掉了。而且还能给其他信息省下空间，比如文件所在块的数组，就能再多几个了。
太好了，去掉它！
文件系统的设计步骤思考 - 图24
大功告成，现在就可以给文件分门别类放进不同目录下了，还可以在目录下创建目录！
现在的文件系统，已经比较完善了，只是还有一点不太爽。
访问到一个目录下，可以很舒服地看到目录里的文件，然后再根据名称访问这个目录下的文件或者目录，整个过程都是一个套路。
但是，最上层的目录下的所有文件，即根目录，现在仍然需要通过遍历所有的 inode 来获得，能不能和上面的套路统一呢？
答案非常简单，规定，inode 表中的 0 号 inode，就表示根目录，一切的访问，就从这个根目录开始！
文件系统的设计步骤思考 - 图25
好了，这回没有然后了！
最后来欣赏下文件系统架构。
文件系统的设计步骤思考 - 图26

后记

这个文件系统，和 linux 上的经典文件系统ext2基本相同。
下面是 ext2 文件系统的结构（字段部分只画了核心字段）
文件系统的设计步骤思考 - 图27
主要异同点：
1. 超级块前面是启动块，这个是 PC 联盟给硬盘规定的 1KB 专属空间，任何文件系统都不能用它。
2. ext2 文件系统首先将整个硬盘分为很多块组，但如果只有一个块组的话，和文件系统整体结构就完全一样了，分别是超级块、块描述符、块位图、inode 位图、inode 表、数据块。
3.ext2 文件系统的 inode 表中用 15 个块来定位文件，其中第 13 个块为一级间接索引、14 个为二级间接索引、15 个为三级间接索引。
4.ext2 文件系统的文件类型分得更多，还有常见的如块设备文件、字符设备文件、管道文件、socket 文件等。
5.ext2 文件系统的超级块、块描述符、inode 表中记录的信息更多，但核心的文件系统一样，而且这些字段在后续的 ext3 和 ext4 中不断增加，保持向前兼容。
6. ext2 文件系统的2 号 inode 为根目录，而系统是 0 号 inode 为根目录，这个很随意，设计一个文件系统定一个 187 号 inode 为根目录也没人拦着。
如果想了解 ext2 文件系统的全部细节，有三种方式。
1. 看源码，linux1.0 后的源码都有 ext2 文件系统的实现，源码是最准确的。
2. 看官方文档，这里有个 pdf 连接。https://www.nongnu.org/ext2-doc/ext2.pdf
3. 看优质博客，这里推荐一个。http://docs.linuxtone.org/ebooks/C&CPP/c/ch29s02.html
4. 用 linux 的 mke2fs 命令生成一个 ext2 文件系统的磁盘镜像，然后一个字节一个字节分析其格式。