llama factory 训练 TensorBoard 可视化

首先需要在 yaml 里设置两个参数:

yaml 复制代码
output_dir: /home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo

report_to: tensorboard
logging_dir: /home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo/runs

然后开始训练,在你的输出目录下会有 runs 文件夹。

安装 TensorBoard

shell 复制代码
proxychains4 pip install tensorboard

然后在服务上使用默认的6006端口正常启动tensorboard:

shell 复制代码
tensorboard --logdir=/home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo/runs --port=6006

然后浏览器打开链接。

ref:

https://github.com/hiyouga/LLaMA-Factory/issues/816

https://huggingface.co/docs/transformers/main_classes/trainer#transformers.TrainingArguments.logging_dir

https://datawhalechina.github.io/thorough-pytorch/第七章/7.3 使用TensorBoard可视化训练过程.html#id8

相关推荐
Aspect of twilight4 分钟前
2D/3D bounding box计算方式详解
深度学习·算法题
仙女修炼史33 分钟前
目标分割学习之U_net
人工智能·深度学习·学习
Dfreedom.38 分钟前
机器学习模型误差深度解读:从三类来源到偏差-方差权衡
人工智能·深度学习·机器学习·误差·偏差方差权衡
MR_Colorful1 小时前
从零开始:Windows 深度学习GPU环境配置完整指南(以TensorFlow为例)
人工智能·深度学习
xwill*1 小时前
π0: A Vision-Language-Action Flow Model for General Robot Control
人工智能·深度学习
LDG_AGI2 小时前
【推荐系统】深度学习训练框架(七):PyTorch DDP(DistributedDataParallel)中,每个rank的batch数必须相同
网络·人工智能·pytorch·深度学习·机器学习·spark·batch
ziwu2 小时前
【花朵识别系统】Python+TensorFlow+Django+人工智能+深度学习+卷积神经网络算法
人工智能·深度学习·图像识别
ziwu2 小时前
【鸟类识别系统】Python+TensorFlow+Django+人工智能+深度学习+卷积神经网络算法
深度学习·图像识别
金融小师妹4 小时前
AI视角下黄金避风港属性的量化验证:基于2000-2025年历史数据的时序分析
大数据·人工智能·深度学习·1024程序员节