【PyTorch】训练过程可视化

文章目录

  • [1. 训练过程中的可视化](#1. 训练过程中的可视化)
    • [1.1. alive_progress](#1.1. alive_progress)
    • [1.2. rich.progress](#1.2. rich.progress)
  • [2. 训练结束后的可视化](#2. 训练结束后的可视化)
    • [2.1. tensorboardX](#2.1. tensorboardX)
      • [2.1.1. 安装](#2.1.1. 安装)
      • [2.1.2. 使用](#2.1.2. 使用)

1. 训练过程中的可视化

主要是监控训练的进度。

1.1. alive_progress

  • 安装
bash 复制代码
pip install alive_progress
  • 使用
python 复制代码
from alive_progress import alive_bar
with alive_bar(num_epochs, theme='classic') as bar:
        for epoch in range(num_epochs):
        	...
        	bar()
  • 效果

1.2. rich.progress

  • 安装
bash 复制代码
pip install rich
  • 使用
python 复制代码
from rich.progress import track
for epoch in track(range(num_epochs)):
	...
  • 效果:右边的时间在运行时显示剩余时间,运行结束显示消耗的总时间。

2. 训练结束后的可视化

主要原理是在运行过程中记录变量值、运行时间等信息到文件中,然后根据该文件绘制图表。

2.1. tensorboardX

2.1.1. 安装

bash 复制代码
pip install tensorboardX

VSCode集成了TensorBoard支持,不过事先要安装torch-tb-profiler,安装命令:

bash 复制代码
pip install torch-tb-profiler

安装完成后,在Python源文件中tensorboardX模块导入处,点击"启动TensorBoard会话"按钮,然后选择运行事件所在目录,默认选择当前目录即可,tensorboard会自动在当前目录查找运行事件,由此即可启动TensorBoard。开启TensorBoard页面后不要关闭,数据更新后,直接点击刷新按钮即可导入新数据。


此外,也可以通过以下命令在浏览器查看tensorboard可视化结果:

bash 复制代码
# logdir为运行事件所在目录
> tensorboard logdir=runs
TensorFlow installation not found - running with reduced feature set.
I1202 20:37:50.824767 15412 plugin.py:429] Monitor runs begin
Serving TensorBoard on localhost; to expose to the network, use a proxy or pass --bind_all
TensorBoard 2.14.0 at http://localhost:6006/ (Press CTRL+C to quit)
# 手动打开命令输出提供的本地服务器地址,如http://localhost:6006/

2.1.2. 使用

  • 直接创建对象
python 复制代码
from tensorboardX import SummaryWriter
writer = SummaryWriter()
# writer.add_scalar():添加监控变量
writer.close()
  • 使用上下文管理器
python 复制代码
from tensorboardX import SummaryWriter
with SummaryWriter() as writer:
	# writer.add_scalar():添加监控变量
相关推荐
zhangfeng113313 小时前
超算/曙光DCU集群 昆山站 根目录文件夹逐项释义(HTC调度集群环境、国产DCU算力节点)
人工智能·pytorch·机器学习
zhangfeng113317 小时前
国家超算中心 htc 如果只有gpu资源 没有cpu资源 操作文件的时候会不会很卡呢
人工智能·pytorch·python·机器学习
zhangfeng113321 小时前
DeepSeek V4 适配华为昇腾950 难度及开源情况
人工智能·pytorch·python·机器学习·华为·开源
承渊政道1 天前
【从零开始大模型开发与微调:基于PyTorch与ChatGLM】(新时代的曙光之大模型与人工智能)
人工智能·pytorch·python·深度学习·机器学习·语言模型·自然语言处理
lqjun08272 天前
PyTorch梯度计算
人工智能·pytorch·python
花落yu2 天前
【无标题】
pytorch·python·深度学习
扫地僧9852 天前
一个基于 PyTorch 手语翻译模型Xuanmen_Net
人工智能·pytorch·python
盼小辉丶2 天前
PyTorch深度学习实战(56)——在iOS上构建PyTorch应用
pytorch·深度学习·ios
心中有国也有家2 天前
GE图引擎深度解析——CANN的计算图优化与执行引擎
人工智能·pytorch·python·学习·numpy
瑶总迷弟3 天前
使用 mis-tei 在昇腾310P上部署 bge-m3模型
pytorch·python·华为·语言模型·自然语言处理·cnn·unix