文章目录
- [一、 核心原理:它是如何工作的?](#一、 核心原理:它是如何工作的?)
- [二、 快速上手:三步法记录数据](#二、 快速上手:三步法记录数据)
- [三、 进阶:如何展示图片(add_image)?](#三、 进阶:如何展示图片(add_image)?)
- [四、 成果展示:如何打开可视化面板?](#四、 成果展示:如何打开可视化面板?)
- [⚠️ 避坑指南:为什么我的曲线乱七八糟?](#⚠️ 避坑指南:为什么我的曲线乱七八糟?)
- [📝 总结](#📝 总结)
你是否在训练模型时,只能盯着终端那一串串枯燥的数字发呆?loss 到底降了没?训练速度正不正常?今天,我们就来拆解深度学习开发者的"专业护目镜"------TensorBoard。只需几行代码,就能让你的模型训练过程从"开盲盒"变成"看大片"!
一、 核心原理:它是如何工作的?
简单来说,SummaryWriter 是为了给你的模型训练安装一个监控摄像头。
- PyTorch 训练过程 = 正在进行的足球比赛。
- SummaryWriter = 场边的记分员,每分钟记录比分。
- Logs 文件夹 = 记分员手中的笔记本(事件文件)。
- TensorBoard 界面 = 电视上的实时转播画面(可视化面板)。
在 PyTorch 中使用 TensorBoard 极其简单,核心逻辑只有:创建容器 -> 写入数据 -> 关闭容器。
二、 快速上手:三步法记录数据
在 PyTorch 中使用 TensorBoard,核心逻辑只有:创建容器 -> 写入数据 -> 关闭容器。
python
from torch.utils.tensorboard import SummaryWriter
# 1. 创建实例:指定生成的事件文件存放目录(文件夹名为 logs)
writer = SummaryWriter('logs')
# 2. 写入数据
for i in range(100):
# 参数含义:标题(Tag), Y轴数值(Scalar), X轴步数(Step)
writer.add_scalar("y=x", i, i)
# 3. 关闭实例(养成好习惯,确保数据完整写入)
writer.close()
💡 参数小贴士
python
writer.add_scalar(tag, scalar_value, global_step)
- tag:图表标题。
- scalar_value:Y 轴数值(如 Loss、Accuracy)
- global_step:X 轴步数(如 Epoch 或 Iteration)。
三、 进阶:如何展示图片(add_image)?
有时候我们需要直接观察模型训练中的图片变化,这时要注意类型转换和"维度陷阱"。
1. 类型转换
add_image 不支持 PIL 格式,必须转为 Tensor 或 Numpy 数组。
python
import numpy as np
from PIL import Image
img = Image.open('test.jpg')
img_array = np.array(img) # PIL 转 Numpy
2. 维度避坑(重要!)
普通 RGB 图片通常是 (高, 宽, 通道) 即 HWC,但 TensorBoard 默认接收 CHW。
- 解决方案:手动指定
dataformats='HWC'。
python
# 修改 title 即可创建新窗口,修改 step 即可展示不同步骤
writer.add_image("input_img", img_array, 1, dataformats='HWC')
四、 成果展示:如何打开可视化面板?
运行完代码后,你会发现项目目录下多了一个名为 logs 的文件夹。生成了 logs 文件夹后,不能直接双击打开,需要借助 Terminal(终端)。
1. 启动命令,在终端中输入:
python
tensorboard --logdir=logs
2. 避开端口冲突
如果你的电脑或服务器上还有其他人在使用 TensorBoard,默认端口 6006 可能会被占用。这时可以手动指定一个端口:
python
tensorboard --logdir=logs --port=6007
3. 查看网页
输入完命令后,终端会返回一个网址(通常是 http://localhost:6006/)。复制或者点击该链接到浏览器即可。
⚠️ 避坑指南:为什么我的曲线乱七八糟?
很多同学在第二次运行程序时,发现曲线出现了"反复横跳"的重叠现象。
原因分析:
TensorBoard 会读取 logs 文件夹下的所有文件。如果你不删除旧的事件文件就直接运行新代码,它会将新旧数据重叠绘制在一起。
解决方案:
物理删除:每次开启新实验前,手动删掉 logs 文件夹。
📝 总结
- 导包:
from torch.utils.tensorboard import SummaryWriter - 记录:
add_scalar记数值,add_image记图片(注意HWC)。 - 启动:终端执行
tensorboard --logdir=文件夹名。 - 清理:新实验前记得删旧 log。