文章目录
- [1. 理解文件系统](#1. 理解文件系统)
- [2. inode](#2. inode)
- [3. 软硬链接](#3. 软硬链接)
-
- [3.1 硬链接](#3.1 硬链接)
- [3.2 软链接](#3.2 软链接)
- [3.3 软硬链接的原理](#3.3 软硬链接的原理)
1. 理解文件系统
我们使用 ls -l
的时候看到的除了看到文件名,还看到了文件元数据。
c
[root@localhost linux]# ls -l
总用量 12
-rwxr-xr-x. 1 root root 7438 "9月 13 14:56" a.out
-rw-r--r--. 1 root root 654 "9月 13 14:56" test.c
每行包含 7 列:
- 模式
- 硬链接数
- 文件所有者
- 组
- 大小
- 最后修改时间
- 文件名
ls -l
读取存储在磁盘上的文件信息,然后显示出来:
其实这个信息除了通过这种方式来读取,还有一个 stat
命令能够看到更多信息:
c
[tjq@hecs-227160 test_3_25]$ stat test1.c
File: 'test1.c'
Size: 365 Blocks: 8 IO Block: 4096 regular file
Device: fd01h/64769d Inode: 1573701 Links: 1
Access: (0664/-rw-rw-r--) Uid: ( 1000/ tjq) Gid: ( 1000/ tjq)
Access: 2024-03-25 12:07:05.081994903 +0800
Modify: 2024-03-25 12:06:58.231864531 +0800
Change: 2024-03-25 12:06:58.231864531 +0800
Birth: -
ACM:下面解释一下文件的三个时间:
Access
最后访问时间;Modify
文件内容最后修改时间;Change
属性最后修改时间。
2. inode
系统中,表示一个文件,用的不是文件名,而是 inode!
为了能解释清楚 inode 我们先简单了解一下文件系统:
Linux ext2 文件系统,上图为磁盘文件系统图(内核内存映像肯定有所不同),磁盘是典型的块设备,硬盘分区被划分为一个个的 block。一个 block 的大小是由格式化的时候确定的,并且不可以更改。例如 mke2fs 的 -b 选项可以设定 block 大小为 1024、2048 或 4096 字节。而上图中启动块(Boot Block)的大小是确定的。
- Block Group:ext2 文件系统会根据分区的大小划分为数个 Block Group。而每个 Block Group 都有着相同的结构组成。
- 超级块(Super Block):存放文件系统本身的结构信息。记录的信息主要有:block 和 inode 的总量,未使用的 block 和 inode 的数量,一个 block 和 inode 的大小,最近一次挂载的时间,最近一次写入数据的时间,最近一次检验磁盘的时间等其他文件系统的相关信息。如果 Super Block 的信息被破坏,可以说整个文件系统结构就被破坏了。
- GDT(Group Descriptor Table):块组描述符,描述块组属性信息。
- 块位图(Block Bitmap):Block Bitmap 中记录着 Data Block 中哪个数据块已经被占用,哪个数据块没有被占用。
- inode 位图(inode Bitmap):每个 bit 表示一个 inode 是否空闲可用。
- i 节点表(inode Table):存放文件属性,如:文件大小、所有者、最近修改时间等。
- 数据区(Date blocks):存放文件内容。
将属性和数据分开存放的想法看起来很简单,但实际上是如何工作的呢?我们通过 touch
一个新文件来看看如何工作。
c
[root@localhost linux]# touch abc
[root@localhost linux]# ls -i abc
263466 abc
为了说明问题,我们将上图简化:
创建一个新文件主要有以下 4 个操作:
-
存储属性
内核先找到一个空闲的 inode(这里是 263466)。内核把文件记录到其中。
-
存储数据
该文件需要存储在三个磁盘块,内核找到了三个空闲块:300,500,800。将内核缓冲区的第一块数据复制到 300,下一块复制到 500,以此类推。
-
记录分配情况
文件内容按顺序 300,500,800 存放。内核在 inode 上的磁盘分布区记录了上述块列表。
-
添加文件名到目录
新的文件名叫 abc。Linux 如何在当前的目录中记录这个文件?内核将入口(263466,abc)添加到目录文件。文件名和 inode 之间的对应关系将文件名和文件内容及属性连接起来。
3. 软硬链接
3.1 硬链接
我们看到,真正找到磁盘上文件的并不是文件名,而是 inode。其实在 Linux 中可以让多个文件名对应于同一个 inode。
c
[root@localhost linux]# touch abc
[root@localhost linux]# ln abc def // 创建了一个硬链接
[root@localhost linux]# ls -li
263466 -rw-rw-r-- 2 tjq tjq 0 Mar 26 16:14 abc
263466 -rw-rw-r-- 2 tjq tjq 0 Mar 26 16:14 def
- abc 和 def 的链接状态完全相同,他们被称为指向文件的硬链接,内核记录了这个连接数,inode 263466 的硬链接数为 2。
- 硬链接本质不是一个独立的文件,因为它的 inode 编号和目标文件相同;
- 那么硬链接是什么呢?在创建硬链接时一定没有新建文件,它是一个新的文件名,和目标文件 inode 号的映射关系;
- 我们在删除文件时干了两件事情:
- 在目录中将对应的记录删除;
- 将硬链接数 -1,如果为 0,则将对应的磁盘释放(引用计数)。
- Linux 中,不允许用户给目录建立硬链接。
3.2 软链接
软链接是通过 inode 引用另外一个文件,在 shell 中的做法:
c
[root@localhost linux]# ln -s abc abc.s // 创建了一个软链接
[root@localhost linux]# ls -li
263563 -rw-r--r--. 2 tjq tjq 0 Mar 26 16:14 abc
261678 lrwxrwxrwx. 1 tjq tjq 3 Mar 26 16:40 abc.s -> abc
263563 -rw-r--r--. 2 tjq tjq 0 Mar 26 16:14 def
- 软链接本质是一个文件,有独立的 inode。
3.3 软硬链接的原理
- 硬链接本质就是在指定的目录下,插入新的文件名和目标文件的映射关系,并让 inode 的引用计数++;
- 软链接本质就是一个独立文件,软链接内容里面放的是:目标文件的路径!
- 软链接类似 Windows 下的快捷方式。
END