ubuntu系统中 jupyter Kernel 频繁崩溃原因

每次用jupyter运行代码就总是出现下列情况:

一.原因:

你的程序(如 PyTorch/TensorFlow 训练、大数据加载等)申请的内存超过了系统可用内存上限,触发 OOM Killer,导致进程被无声杀死(无 Python 异常,直接退出),表现为 Jupyter Kernel 崩溃。

运行命令如下,可以看到输出:Out of memory: Kill process ...,说明被 OOM Killer **(内存溢出)**终止。

复制代码
$ sudo dmesg -T | grep -i "killed process"

[一 11月  3 22:21:00 2025] Out of memory: Killed process 260152 (python) total-vm:47711672kB, anon-rss:29875948kB, file-rss:68992kB, shmem-rss:2560kB, UID:1000 pgtables:75348kB oom_score_adj:0

如果你也遇到该问题也可以尝试运行该命令查看是否为该原因。

二.解决

1. 减少内存使用

a. 降低 batch size
b. 定期清理不用的变量内存

在 notebook 中反复运行单元格会累积变量,因此可以定期(如每个fold运行完毕后)显式删除不用的变量并触发垃圾回收:

复制代码
import gc
gc.collect()
c. 关闭不必要的 Jupyter 标签页/内核

每个打开的 notebook 都可能占用内存,把其他不用的都关了。

2. 启用或扩大 Swap 空间()

Swap 是硬盘上的一块虚拟内存,速度比 RAM 慢,但可防止 OOM。但是该方法只能作为临时缓解,因为SSD 上频繁 swap 会损耗寿命。

检查当前 swap:

复制代码
free -h
swapon --show

临时添加 4GB swap(重启后失效):

复制代码
sudo fallocate -l 4G /tmp/swapfile
sudo chmod 600 /tmp/swapfile
sudo mkswap /tmp/swapfile
sudo swapon /tmp/swapfile
相关推荐
可可嘻嘻大老虎2 小时前
nginx无法访问后端服务问题
运维·nginx
JiMoKuangXiangQu2 小时前
ARM64 进程虚拟地址空间布局
linux·arm64 虚拟地址布局
阳光九叶草LXGZXJ3 小时前
达梦数据库-学习-47-DmDrs控制台命令(LSN、启停、装载)
linux·运维·数据库·sql·学习
无忧智库3 小时前
某市“十五五“地下综合管廊智能化运维管理平台建设全案解析:从数字孪生到信创适配的深度实践(WORD)
运维·智慧城市
春日见3 小时前
如何避免代码冲突,拉取分支
linux·人工智能·算法·机器学习·自动驾驶
珠海西格3 小时前
“主动预防” vs “事后补救”:分布式光伏防逆流技术的代际革命,西格电力给出标准答案
大数据·运维·服务器·分布式·云计算·能源
无垠的广袤4 小时前
【VisionFive 2 Lite 单板计算机】边缘AI视觉应用部署:缺陷检测
linux·人工智能·python·opencv·开发板
阿波罗尼亚4 小时前
Kubectl 命令记录
linux·运维·服务器
Fᴏʀ ʏ꯭ᴏ꯭ᴜ꯭.4 小时前
Keepalived单播模式配置与实战指南
linux·服务器·负载均衡
IDC02_FEIYA4 小时前
Linux文件搜索命令有哪些?Linux常用命令之文件搜索命令find详解
linux·运维·服务器