深入理解 Linux 文件系统：元数据、inode 与 block 核心原理

在 Linux 世界中，一切皆文件。我们日常使用 ls、cat、cp 等命令操作文件时，很少关注底层如何存储、如何关联。但真正理解 Linux 文件，必须搞懂文件元数据 、inode 、block 以及文件系统的基本逻辑。本文带你从表象到本质，彻底吃透 Linux 文件的底层设计。

一、文件元数据

我们在终端执行：

复制代码

ls -l

会输出类似这样的信息：

复制代码

-rw-r--r-- 1 root root  4096 Feb 14 10:00 demo.txt

很多人只把它当成 "看权限、看大小" 的工具，实际上这一行展示的就是文件元数据（metadata）------ 描述文件本身的数据，而非文件内容。

ls -l 输出默认分为 7 列，对应文件最核心的属性：

文件类型与权限模式（Mode）

第一位：文件类型

- 普通文件

d 目录

l 软链接

c 字符设备、b 块设备等

后 9 位：所有者、组、其他用户的读 / 写 / 执行权限（rwx）。

**硬链接数（Hard Link Count）**记录有多少个文件名指向同一个 inode。

普通文件默认 1

目录默认至少 2（. 和自身）

**文件所有者（Owner）**该文件归属的用户。

**文件所属组（Group）**该文件归属的用户组。

**文件大小（Size）**单位默认字节，目录通常显示为 4096 等块大小倍数。

最后修改时间（Modify Time） 文件内容最后一次被修改的时间。Linux 还有访问时间 (atime)、状态改变时间 (ctime)，可通过 stat 查看。

文件名（File Name） 注意：文件名并不存在于 inode 中，只是目录项里的一个 "名字标签"。

如果想看更完整的元数据，可以使用：

复制代码

stat 文件名

它会展示 inode 号、权限、大小、时间、链接数、设备等全部信息。

二、文件系统

文件系统是操作系统用于在存储设备（硬盘、SSD）上组织、存放、查找文件的规则和结构。

常见 Linux 文件系统：

ext4（最常用、稳定）

xfs（CentOS/RHEL 默认，大文件性能好）

btrfs、zfs 等（支持快照、校验）

格式化硬盘时，系统会把分区主要分为两大部分：

大量的 block ：用于存放文件实际内容

一张 inode 表 ：用于存放文件元数据

简单理解：

block = 数据仓库

inode = 档案管理表

三、inode

1. 什么是 inode

inode（index node）是 Linux 文件系统中用于描述文件元数据的结构体 ，可以把它看作文件的唯一身份证。

每个文件必须有且仅有一个 inode，系统通过 inode 找到文件，而不是通过文件名。

2. inode 里存了什么

inode 存储文件的所有关键信息：

文件类型、权限

所有者、所属组

文件大小

时间戳（创建 / 修改 / 改变）

指向数据 block 的指针

硬链接数

...

唯独不存：文件名

3. inode 号

每个 inode 有一个数字编号，称为 inode 号。查看文件 inode 号：

复制代码

ls -i

内核操作文件时：

根据文件名找到对应 inode 号

通过 inode 号获取元数据

根据 inode 中的指针找到数据 block

这就是为什么：

即使文件名改了，文件内容不变

即使文件被移动，inode 号不变

4. inode 耗尽问题

硬盘空间还有，但无法创建文件，很可能是：inode 数量用完了。

因为格式化时 inode 总数就固定了。如果大量生成小文件，容易占满 inode，导致无法新建文件。

查看 inode 使用情况：

复制代码

df -i

四、block：文件内容的真正容器

1. 什么是 block

block 是文件系统中最小的数据存储单元，是真正存放文件内容的地方。

一个文件至少占用一个 block

空文件不占用 block

大文件会占用多个连续或离散的 block

2. block 大小

格式化时指定，常见：

4KB（主流）

1KB、2KB、8KB

查看 block 大小：

复制代码

tune2fs -l /dev/sda1 | grep -i block

或

复制代码

stat / | grep Block

3. block 特点

读取以 block 为单位：哪怕只读 1 字节，也要读一整个 block

空间浪费：1 字节的文件，在 4KB 块大小下，也占用 4KB

大文件会分散在多个 block 中，由 inode 记录它们的位置

五、串起来理解：文件名、inode、block 关系

用一张逻辑图总结：

目录本质也是文件，里面存的是：
- 文件名 → inode 号对照表
打开文件时：
- 文件名 → 目录查找 → inode 号
- inode 号 → inode 表 → 元数据 + block 地址
- block 地址 → 读取真实数据
硬链接：多个文件名对应同一个 inode 号
软链接：本身是独立文件，有自己的 inode，内容是目标路径