文章目录
- 前言
- 一、简介
- [二、LKM demo](#二、LKM demo)
-
- [2.1 iget_locked](#2.1 iget_locked)
- [2.2 LKM demo](#2.2 LKM demo)
- [2.3 ext4_iget](#2.3 ext4_iget)
前言
文件inode号和struct inode结构体请参考:
Linux文件路径,目录项,inode号关联
Linux文件系统 struct inode 结构体解析
一、简介
在Linux中,每个文件和目录都与一个唯一的inode号相关联。inode号是文件系统中inode的唯一标识符,用于表示文件或目录的元数据。
这就意味inode号在文件系统中是不可以重复的。
在同一个文件系统中,文件的inode号是唯一的,不会重复。每个文件系统维护着一个独立的inode表,其中的inode号在该文件系统中是唯一的。
然而,不同文件系统之间的inode号可以重复。当不同的文件系统挂载到同一个系统上时,它们各自维护着独立的inode号空间。因此,不同文件系统中的文件可以拥有相同的inode号,但它们在各自的文件系统中是唯一的。
这意味着,如果在不同文件系统中有两个文件的inode号是相同的,那么它们实际上是不同的文件,属于不同的文件系统。
需要注意的是,文件系统的实现可能会限制inode号的范围或分配策略,具体取决于文件系统的设计和实现。
因此当涉及到多个文件系统时,不同文件系统中的inode号确实可以重复。这是因为每个文件系统都有自己的inode号空间,用于在该文件系统中唯一标识文件和目录。
当不同的文件系统挂载到同一个操作系统中时,每个文件系统会独立地管理自己的inode号。这意味着,即使两个文件系统中存在具有相同inode号的文件,它们仍然被视为不同的文件,并且彼此之间没有任何关联。
这种情况可能发生在以下情况下:
(1)多个独立的物理磁盘或分区:每个磁盘或分区上的文件系统都有自己的inode号空间,它们彼此独立。
(2)文件系统镜像:如果相同的文件系统映像被多次挂载,每次挂载都会创建一个独立的inode号空间。
(3)网络文件系统(NFS):当使用NFS挂载远程文件系统时,本地文件系统和远程文件系统的inode号彼此独立。
这种设计允许不同的文件系统在同一个操作系统中并存,并通过挂载点进行访问。每个文件系统都有自己的inode号空间,确保了在各自范围内的唯一性。
需要注意的是,尽管不同文件系统中的inode号可以重复,但通常并不鼓励依赖inode号来唯一标识文件。在跨文件系统或跨系统的环境中,使用文件路径或其他唯一标识符更可靠和可移植。
二、LKM demo
2.1 iget_locked
通常前面的知识我们可以知道不同文件系统中的文件可以拥有相同的inode号,它们在各自的文件系统中是唯一的,因此我们根据在内核态编程中根据文件inode号获取其对应的struct inode结构体,那么需要明确文件系统和inode号才能获取其对应的struct inode结构体,不能单独通过inode号获取其struct inode结构体,可以使用iget_locked函数。
c
/**
* iget_locked - obtain an inode from a mounted file system
* @sb: super block of file system
* @ino: inode number to get
*
* Search for the inode specified by @ino in the inode cache and if present
* return it with an increased reference count. This is for file systems
* where the inode number is sufficient for unique identification of an inode.
*
* If the inode is not in cache, allocate a new inode and return it locked,
* hashed, and with the I_NEW flag set. The file system gets to fill it in
* before unlocking it via unlock_new_inode().
*/
struct inode *iget_locked(struct super_block *sb, unsigned long ino)
{
struct hlist_head *head = inode_hashtable + hash(sb, ino);
struct inode *inode;
again:
spin_lock(&inode_hash_lock);
inode = find_inode_fast(sb, head, ino);
spin_unlock(&inode_hash_lock);
if (inode) {
if (IS_ERR(inode))
return NULL;
wait_on_inode(inode);
if (unlikely(inode_unhashed(inode))) {
iput(inode);
goto again;
}
return inode;
}
inode = alloc_inode(sb);
if (inode) {
struct inode *old;
spin_lock(&inode_hash_lock);
/* We released the lock, so.. */
old = find_inode_fast(sb, head, ino);
if (!old) {
inode->i_ino = ino;
spin_lock(&inode->i_lock);
inode->i_state = I_NEW;
hlist_add_head(&inode->i_hash, head);
spin_unlock(&inode->i_lock);
inode_sb_list_add(inode);
spin_unlock(&inode_hash_lock);
/* Return the locked inode with I_NEW set, the
* caller is responsible for filling in the contents
*/
return inode;
}
/*
* Uhhuh, somebody else created the same inode under
* us. Use the old inode instead of the one we just
* allocated.
*/
spin_unlock(&inode_hash_lock);
destroy_inode(inode);
if (IS_ERR(old))
return NULL;
inode = old;
wait_on_inode(inode);
if (unlikely(inode_unhashed(inode))) {
iput(inode);
goto again;
}
}
return inode;
}
EXPORT_SYMBOL(iget_locked);
iget_locked 函数通常在文件系统中使用,用于从已挂载的文件系统中获取一个 inode(索引节点)。
该函数的实现过程如下:
首先,根据给定的 inode 号 ino 和文件系统的超级块 sb,使用 hash 函数计算哈希值。该哈希值用于定位 inode 缓存中相应的哈希表条目。
函数获取自旋锁 inode_hash_lock,以在执行必要的操作时锁定 inode 缓存。
它搜索哈希链表(由 hlist_head 指针 head 指示),以查找与给定的 inode 号 ino 相关联的 inode。它使用 find_inode_fast 函数进行搜索。
如果在缓存中找到了 inode,函数通过使用 IS_ERR 函数检查它是否是有效的 inode。如果该 inode 无效,则返回 NULL。否则,它使用 wait_on_inode 函数等待 inode 上的任何挂起操作完成。
如果发现 inode 是未哈希的(即不在哈希表中),它将释放该 inode,并回到开始处重新搜索。
如果在缓存中未找到该 inode,则继续使用 alloc_inode 函数分配一个新的 inode。这将创建一个新的 struct inode 数据结构并进行初始化。
分配完 inode 后,函数释放自旋锁,并重新获取它,以执行另一次搜索以查找该 inode。这是必要的,因为在 alloc_inode 调用期间释放了锁,而另一个线程可能在此期间将该 inode 添加到缓存中。
如果没有其他线程添加了相同 inode 号的 inode,将设置新分配的 inode 的字段。将 i_ino 字段设置为给定的 inode 号 ino,将 i_state 字段设置为 I_NEW,以表示该 inode 是新的且尚未完全初始化,然后使用 hlist_add_head 将 inode 添加到哈希表中。使用 inode_sb_list_add 将 inode 添加到超级块的 inode 列表中。
然后,释放自旋锁和 inode 缓存锁,并将带有设置了 I_NEW 标志的锁定 inode 返回给调用者。调用者负责填充 inode 的内容。
如果在自旋锁释放期间有其他线程添加了相同 inode 号的 inode,则函数选择使用现有的 inode 而不是新分配的 inode。它使用 wait_on_inode 等待现有 inode 上的任何挂起操作完成。如果现有 inode 是未哈希的,则释放它,并回到开始处重新搜索。
最后,函数将获得的 inode(无论是新分配的还是现有的)返回给调用者。
c
/*
* find_inode_fast is the fast path version of find_inode, see the comment at
* iget_locked for details.
*/
static struct inode *find_inode_fast(struct super_block *sb,
struct hlist_head *head, unsigned long ino)
{
struct inode *inode = NULL;
repeat:
hlist_for_each_entry(inode, head, i_hash) {
if (inode->i_ino != ino)
continue;
if (inode->i_sb != sb)
continue;
spin_lock(&inode->i_lock);
if (inode->i_state & (I_FREEING|I_WILL_FREE)) {
__wait_on_freeing_inode(inode);
goto repeat;
}
if (unlikely(inode->i_state & I_CREATING)) {
spin_unlock(&inode->i_lock);
return ERR_PTR(-ESTALE);
}
__iget(inode);
spin_unlock(&inode->i_lock);
return inode;
}
return NULL;
}
该函数的作用是在给定的哈希链表 head 中快速查找与给定 inode 号 ino 和超级块 sb 相匹配的 inode。
函数使用 hlist_for_each_entry 宏遍历哈希链表中的每个 inode。对于每个 inode,它首先检查 inode 号和超级块是否与给定的匹配,如果不匹配,则继续遍历下一个 inode。
如果找到匹配的 inode,函数将获取 inode 的自旋锁,然后进行一系列的检查:
● 首先,它检查 inode 的状态是否处于 I_FREEING 或 I_WILL_FREE 状态,这表示 inode 正在释放或即将被释放。如果是这种情况,函数将调用 __wait_on_freeing_inode 函数等待 inode 完全释放,然后重新从头开始查找。
● 接下来,函数检查 inode 的状态是否处于 I_CREATING 状态,这表示 inode 正在创建过程中。如果是这种情况,函数将释放 inode 的自旋锁,并返回一个指向 -ESTALE 错误的指针,表示 inode 已过期。
● 最后,如果 inode 的状态正常,函数将调用 __iget 函数增加 inode 的引用计数,然后释放 inode 的自旋锁,并返回指向该 inode 的指针。
如果在整个哈希链表中没有找到匹配的 inode,函数将返回 NULL。
这个函数用于快速查找 inode,以加速文件系统中对 inode 的访问操作。
2.2 LKM demo
接下来我们给出一个LKM示例根据inode号来获取对应的struct inode结构体:
c
#include <linux/init.h>
#include <linux/kernel.h>
#include <linux/module.h>
#include <linux/fs.h>
#include <linux/fs_struct.h>
/* Module parameter */
static unsigned long ino = 1837047;
module_param(ino, ulong, 0);
static int __init hello_init(void)
{
struct fs_struct *fs;
struct path pwd;
//unsigned long ino = 1837047;
struct inode *inode;
struct super_block *sb;
fs = current->fs;
get_fs_pwd(fs, &pwd);
/* The root of the dentry tree */
sb = pwd.dentry->d_sb;
inode = iget_locked(sb, ino);
if(inode)
printk("inode num = %ld\n", inode->i_ino);
return -1;
}
module_init(hello_init);
MODULE_LICENSE("GPL");
c
ls -il 3.txt
1837252
# insmod hello.ko ino=1837252
insmod: ERROR: could not insert module hello.ko: Operation not permitted
# dmesg -c
inode num = 1837252
2.3 ext4_iget
我们简单看一下ext4文件系统根据inode号获取其struct inode结构体的方式:
c
// linux-5.4.18/fs/ext4/ext4.h
typedef enum {
EXT4_IGET_NORMAL = 0,
EXT4_IGET_SPECIAL = 0x0001, /* OK to iget a system inode */
EXT4_IGET_HANDLE = 0x0002 /* Inode # is from a handle */
} ext4_iget_flags;
extern struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,
ext4_iget_flags flags, const char *function,
unsigned int line);
#define ext4_iget(sb, ino, flags) \
__ext4_iget((sb), (ino), (flags), __func__, __LINE__)
ext4文件系统通过ext4_iget宏来获取struct inode结构体,宏定义 ext4_iget调用 __ext4_iget 函数来获取指定inode号对应的 struct inode 结构体。
该宏定义接受三个参数:
sb:指向 super_block 结构体的指针,表示要操作的超级块。
ino:表示要获取的inode号。
flags:表示 ext4_iget_flags 类型的标志位,用于指定 __ext4_iget 函数的行为。
宏定义将参数传递给 __ext4_iget 函数,并在最后两个参数 func 和 LINE 中传递了调用该宏的函数名和行号。这些信息通常用于调试目的,以便在发生错误时能够追踪到具体的调用位置。
对于第三个参数flags:
c
typedef enum {
EXT4_IGET_NORMAL = 0,
EXT4_IGET_SPECIAL = 0x0001, /* OK to iget a system inode */
EXT4_IGET_HANDLE = 0x0002 /* Inode # is from a handle */
} ext4_iget_flags;
枚举类型 ext4_iget_flags,用于表示 ext4_iget 函数的标志或选项。
ext4_iget_flags 枚举类型包含三个成员:
EXT4_IGET_NORMAL:表示普通的 iget 操作。它用于指示 iget 函数应该获取普通文件或目录的 inode。
EXT4_IGET_SPECIAL:表示可以 iget 系统级 inode。系统级 inode 是用于各种系统级操作或文件类型(如超级块或日志文件)的特殊目的 inode。
EXT4_IGET_HANDLE:用于当 inode 号是从一个句柄(handle)中获取时。句柄是用于跨文件系统和进程访问 inode 的标识符,通常用于实现文件系统的高级功能。
接下来我们给出一个LKM示例根据inode号来获取对应的struct inode结构体:
c
#include <linux/init.h>
#include <linux/kernel.h>
#include <linux/module.h>
#include <linux/fs.h>
#include <linux/fs_struct.h>
#include <linux/kallsyms.h>
/* Module parameter */
static unsigned long ino = 1837047;
module_param(ino, ulong, 0);
typedef enum {
EXT4_IGET_NORMAL = 0,
EXT4_IGET_SPECIAL = 0x0001, /* OK to iget a system inode */
EXT4_IGET_HANDLE = 0x0002 /* Inode # is from a handle */
} ext4_iget_flags;
struct inode *(*my__ext4_iget)(struct super_block *sb, unsigned long ino,
ext4_iget_flags flags, const char *function,
unsigned int line);
static int __init hello_init(void)
{
struct fs_struct *fs;
struct path pwd;
//unsigned long ino = 1837047;
struct inode *inode;
struct super_block *sb;
fs = current->fs;
get_fs_pwd(fs, &pwd);
/* The root of the dentry tree */
sb = pwd.dentry->d_sb;
my__ext4_iget = (void *)kallsyms_lookup_name("__ext4_iget");
inode = my__ext4_iget(sb, ino, EXT4_IGET_NORMAL, __func__, __LINE__);
if(inode)
printk("inode num = %ld\n", inode->i_ino);
return -1;
}
module_init(hello_init);
MODULE_LICENSE("GPL");