llama factory 训练 TensorBoard 可视化

首先需要在 yaml 里设置两个参数:

yaml 复制代码
output_dir: /home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo

report_to: tensorboard
logging_dir: /home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo/runs

然后开始训练,在你的输出目录下会有 runs 文件夹。

安装 TensorBoard

shell 复制代码
proxychains4 pip install tensorboard

然后在服务上使用默认的6006端口正常启动tensorboard:

shell 复制代码
tensorboard --logdir=/home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo/runs --port=6006

然后浏览器打开链接。

ref:

https://github.com/hiyouga/LLaMA-Factory/issues/816

https://huggingface.co/docs/transformers/main_classes/trainer#transformers.TrainingArguments.logging_dir

https://datawhalechina.github.io/thorough-pytorch/第七章/7.3 使用TensorBoard可视化训练过程.html#id8

相关推荐
张子夜 iiii17 小时前
传统神经网络实现-----手写数字识别(MNIST)项目
人工智能·pytorch·python·深度学习·算法
全息数据18 小时前
DDPM代码讲解【详细!!!】
深度学习·stable diffusion·多模态·ddpm
西猫雷婶18 小时前
神经网络|(十九)概率论基础知识-伽马函数·下
人工智能·深度学习·神经网络·机器学习·回归·scikit-learn·概率论
Honeysea_7019 小时前
容器的定义及工作原理
人工智能·深度学习·机器学习·docker·ai·持续部署
大千AI助手21 小时前
梯度消失问题:深度学习中的「记忆衰退」困境与解决方案
人工智能·深度学习·神经网络·梯度·梯度消失·链式法则·vanishing
研梦非凡21 小时前
CVPR 2025|无类别词汇的视觉-语言模型少样本学习
人工智能·深度学习·学习·语言模型·自然语言处理
max50060021 小时前
本地部署开源数据生成器项目实战指南
开发语言·人工智能·python·深度学习·算法·开源
一颗20211 天前
深度解读:PSPNet(Pyramid Scene Parsing Network) — 用金字塔池化把“场景理解”装进分割网络
人工智能·深度学习·计算机视觉
hallo1281 天前
学习机器学习能看哪些书籍
人工智能·深度学习·机器学习
中國龍在廣州1 天前
哈工大提出空间机器人复合框架,突破高精度轨迹跟踪
人工智能·深度学习·机器学习·计算机视觉·机器人