Linux nohup 命令

Linux nohup 命令

应用场景

使用 PyCharm 连接服务器跑模型虽然很方便,但是如果遇到网络不佳、PyCharm出BUG、急需转移阵地等情况就只能中断训练,前面的全白跑了。

因此可以尝试直接在服务器上使用命令跑模型,这个命令好说,笨一点的方法直接抄用 PyCharm 运行时输出的命令嘛:

但是这样依然有问题,如果在运行命令时,如果退出终端则依然会中断命令,问题依然没有解决。

最后可以尝试 nohup 命令解决上述问题。

nohup 命令介绍

nohup 英文全称 no hang up,即在系统后台不挂断地运行命令,因此退出终端不会影响程序的运行。

  • 语法格式

    shell 复制代码
     nohup Command [ Arg ... ] [ & ]
  • 参数说明:

    • Command:要执行的命令。
    • Arg:一些参数,可以指定输出文件。
    • &:让命令在后台执行,终端退出后命令仍旧执行。

nohup 命令,在默认情况下(非重定向时),会输出一个名叫 nohup.out 的文件到当前目录下,如果当前目录的 nohup.out 文件不可写,输出重定向到 $HOME/nohup.out 文件中。

实例:使用 nohup 命令在后台跑模型

  • 首先应该保证你的训练代码不需要输入,然后执行以下命令

    shell 复制代码
    nohup /XXX/python3 -u /XXX/train.py > test.log 2>&1 &

    命令注解:

    • 开头的 nohup 保证命令不挂断,最后的 & 保证终端退出后命令仍旧执行
    • /XXX/python3 -u /XXX/train.py
      • 即为使用 /XXX/python3(某个选定的解释器) 运行 /XXX/train.py(训练代码)
      • 中间的 -u 表示关闭缓存,保证把输出写入文件时无延迟
    • > test.log 将输出重定向到 test.log 文件
    • 2>&1 将错误输出重定向到标准输出,也就是错误信息也会写到标准输出的位置
      • 0 表示 stdin 标准输入
      • 1 表示 stdout 标准输出
      • 2 表示stderr标准错误信息输出
  • 注意事项:

    • 如果数据集加载路径为相对路径,则需要 cd 到代码所在的文件夹再执行命令

      • 否则会报地址错:

      • 启动起来之后看一眼显卡跑起来了就对咯

    • > test.log2>&1 是可选的,写与不写的区别在于少一条提示少按一次回车:

    • 注意记住提示的进程号,

      • 如果记不住,可以使用 jobs -l 命令查看这个进程的进程号,

      • 当然如果退出终端重新打开的话这个进程会变成僵尸进程,需要用 ps -aux 命令查看所有进程找找。

    • 跑起来之和可以使用 tail -f test.log 命令实时查看输出(Ctrl+C 退出),瞅瞅有没有问题:

    • 可以使用 kill -9 PID 杀掉这个进程

相关推荐
我不要放纵2 分钟前
LVS集群搭建
linux·服务器·lvs
阿巴~阿巴~7 分钟前
自主Shell命令行解释器
linux·运维·服务器
许白掰7 分钟前
Linux入门篇学习——借助 U 盘或 TF 卡拷贝程序到开发板上
linux·学习·借助 u 盘拷贝程序到开发板上·借助 tf卡拷贝程序到开发板上
SHUIPING_YANG33 分钟前
根据用户id自动切换表查询
java·服务器·数据库
AndrewHZ43 分钟前
【图像处理基石】如何入门色彩评估?
图像处理·人工智能·深度学习·色彩科学·hvs·色彩评估·颜色工程
chao_7891 小时前
更灵活方便的初始化、清除方法——fixture【pytest】
服务器·自动化测试·python·pytest
枷锁—sha1 小时前
【DVWA系列】——CSRF——Medium详细教程
android·服务器·前端·web安全·网络安全·csrf
枷锁—sha1 小时前
跨站请求伪造漏洞(CSRF)详解
运维·服务器·前端·web安全·网络安全·csrf
scuter_yu1 小时前
腾讯云云服务器深度介绍
服务器·云计算·腾讯云
静心问道1 小时前
TrOCR: 基于Transformer的光学字符识别方法,使用预训练模型
人工智能·深度学习·transformer·多模态