1、静态文件
- 文件没有打开的情况下一般是保存在硬盘中(存储设备),此时叫做静态文件
- 文件存储在硬盘上,硬盘的最小存储单位为扇区(512B)
- 在操作系统读取硬盘的时候传输的单位是用**块(4KB)**来读取。 常见的的是8个扇区为一个块
2、inode 我们利用open函数打开文件,不仅仅是靠着文件路径就可以找到文件对应的数据块。
- 操作系统将磁盘分为数据区域(存储文件的中的实际数据)和inode区(里面是有很多inode结构体(记录了文件的不同信息))
- 上面的图可以看到一个inode对应一个文件。
ls -il 查看文件的inode编号 每一行前面的一个数字就表示了对应文件的inode 编号
3、系统内部打开文件的步骤
- 系统找到这个文件名所对应的inode编号
- 通过inode编号从inode table中找到对应的inode结构体
- 根据inode结构体中记录信息,确定文件数据所在的block,并读出数据
4、动态文件
- 当我们调用open函数去打开文件的时候,内核会申请一段内存(一段缓冲区),内核会将磁盘中数据(静态文件)加载到内存中进行管理(缓存,动态文件,内核缓冲区),
- 一定要注意当我们对文件进行读写操作的时候,在这之前我们已经对文件进行了打开操作了,将硬盘的上的数据加载到内存上。
- 当我们对文件读写操作的时候,内核缓存的文件是动态文件、在硬盘上的数据是动态文件。所以动态文件和静态文件是不同步的,但在这之后内核会将内核缓冲区的动态文件同步到磁盘设备上。
5、PCB进程控制块
-
硬盘是块设备,块设备的读写操作是块为最小单位进行的(块由扇区组成,扇区由字节组成),所以你改一个字节,就代表你要去修改整个块。 -
内存是按字节的方式进行读写的,而且可以随意操作任意地址数据,非常灵活。 -
上面我们说了,linux系统会用open函数将硬盘上的文件加载到内核缓冲区(内存),之后在内存区李对文件的读写。这个过程中我们需要开辟一个进程来实现这一个过程。这个时候我们会引用一个数据结构体PCB(进程控制块)来记录此进程的信息。 1、PCB 数据结构体中有一个指针指向了文件描述符表(File descriptors) 2、每一个文件描述符都会指向一个对应的文件表 3、文件描述符表中的每一个元素索引到对应的文件表(File table),文件表也是一个数据结构体,其中记录了很多文件相关的信息(文件的状态标志、应引用计数、以及指向inode结构体的i-node指针(inode找到文件数据存在在磁盘设备中的那个位置)等等)。
|