nfs 中 lockd 与 statd 的作用

lockd 是内核线程,statd 是用户态进程,二者用于 nfs v3 通信协议中,锁状态的恢复(v4 版本协议是有状态协议,无需依赖 statd来恢复状态)。

statd 的监听

当客户端第一次触发 lock 时 (nfs-utils 中可以通过下面的简单c脚本来触发拿锁),

复制代码
#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
#include <getopt.h>
#include <fcntl.h>

int main() {
    int fd = open(fname, O_RDWR, 0644));
    struct flock    fl;
    fl.l_type = F_RDLCK;
    fl.l_whence = 0;
    fl.l_start = 0;
    fl.l_len = 20;
    if (fcntl(fd, cmd, &fl) < 0) {
        printf("fcntl: failed: %d", errno);
    }
    printf("fcntl: ok\n");
    return 0;
}

内核经过nsm_monitor调用向本地 statd 进程发起 monitor 请求:

复制代码
nfs3_proc_lock
  ->nlmclnt_proc
  ->nlmclnt_lock
  ->nsm_monitor

nsm_monitor 函数会向本地 rpc.statd 进程发起 NSMPROC_MON 请求记录服务端监听信息。之后调在 nlmclnt_call 函数,向服务端 lockd 线程发起 op_lock 请求。

服务端 lockd 解析参数发现之前没有监听过这个客户端(调用栈如下),就会向服务端本地 rpc.statd 发起 NSMPROC_MON 请求记录客户端监听信息。

复制代码
nlmsvc_proc_lock
  ->__nlmsvc_proc_lock
  ->nlmsvc_retrieve_args
  ->nsm_monitor 

rpc.statd 监听的客户端会以文件的形式放在 /var/lib/nfs.sm 目录中,至此彼此建立好了监听。

状态的恢复

有两种情况会导致 sm-notify 通知对端自己重启过:

1、rpc.statd 每次启动时会触发一次 sm-notify 进程,但只有第一次触发时会创建 /run/sm-notify.pid 文件,以后检查发现这个文件存在,就不会通知对端。也就是说服务端第一次启动时(service nfs start 时)和客户端第一次启动时(mount -t nfs -o vers=3),rpc.statd 发起的 sm-notify 会检查 /var/lib/nfs.sm 目录中的文件记录,并向其中记录的对端发起 NSMPROC_NOTIFY 请求。

2、但除此之外更一般的情况是机器重启,systemd 系统进程会启动所有注册的 target。其中 /usr/lib/systemd/system/nfs-client.target 会触发 sm-notify 进程向对端发起 NSMPROC_NOTIFY 请求。

rpc.statd 进程收到对端的 NSMPROC_NOTIFY 请求后,会将这一请求加入 notify 列表,并在主循环中将 rpc 请求转发给 lockd 内核线程。调用栈如下:

复制代码
my_svc_run
  ->process_reply
  ->process_entry 
  ->nsm_xmit_nlmcall

内核收到请求后,调用 nlmsvc_proc_sm_notify->nlm_host_rebooted 恢复或释放锁状态。

  • 服务端处理客户端reboot事件:nlmsvc_free_host_resources 释放 reboot 的客户端申请过的锁
  • 客户端处理服务端reboot事件:nlmclnt_recovery 重新向服务端申请已经申请过的锁。
相关推荐
weixin_471525782 分钟前
【gdb/sqlite3移植/mqtt】
linux·运维·服务器
大聪明-PLUS8 分钟前
TCP/IP 协议族—理论与实践(一)
linux·嵌入式·arm·smarc
迎風吹頭髮3 小时前
Linux内核架构浅谈2- Linux内核与硬件交互的底层逻辑:硬件抽象层的作用
linux·架构·交互
孙同学要努力4 小时前
《Linux篇》进程状态——浅度、深度睡眠状态、僵尸状态、运行状态
linux·运维
jieyu11195 小时前
Linux Rootkit 详解
linux·运维·系统安全
宁檬精5 小时前
运维面试准备——综合篇(一)
linux·运维·服务器
洛阳纸贵Coco.Leo.YI5 小时前
10分钟在Windows11下Ubuntu内安装docker-Version28.51
linux·ubuntu·docker
阿巴~阿巴~5 小时前
Ubuntu 20.04 安装 Redis
linux·服务器·数据库·redis·ubuntu
aitav06 小时前
⚡ arm 32位嵌入式 Linux 系统移植 NTP 服务
linux·arm开发·ntp
爱奥尼欧6 小时前
【Linux笔记】网络部分——socket 编程 TCP实现多台虚拟机使用指令访问云服务器
linux·服务器·网络