llama factory 训练 TensorBoard 可视化

首先需要在 yaml 里设置两个参数:

yaml 复制代码
output_dir: /home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo

report_to: tensorboard
logging_dir: /home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo/runs

然后开始训练,在你的输出目录下会有 runs 文件夹。

安装 TensorBoard

shell 复制代码
proxychains4 pip install tensorboard

然后在服务上使用默认的6006端口正常启动tensorboard:

shell 复制代码
tensorboard --logdir=/home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo/runs --port=6006

然后浏览器打开链接。

ref:

https://github.com/hiyouga/LLaMA-Factory/issues/816

https://huggingface.co/docs/transformers/main_classes/trainer#transformers.TrainingArguments.logging_dir

https://datawhalechina.github.io/thorough-pytorch/第七章/7.3 使用TensorBoard可视化训练过程.html#id8

相关推荐
哥布林学者25 分钟前
吴恩达深度学习课程二: 改善深层神经网络 第一周:深度学习的实践(五)归一化
深度学习·ai
杭州杭州杭州42 分钟前
深度学习(1)---基础概念扫盲
人工智能·深度学习
Brsentibi1 小时前
深度学习—数据标注—label-studio
深度学习·数据标注·label-studio·yolo数据集自制
亚里随笔3 小时前
ReSpec:突破RL训练瓶颈的推测解码优化系统
人工智能·深度学习·自然语言处理·大语言模型·rlhf
CoovallyAIHub4 小时前
视觉语言模型(VLM)深度解析:如何用它来处理文档?
深度学习·算法·计算机视觉
CoovallyAIHub4 小时前
估值百亿独角兽创始人硕士论文曝光!宇树科技王兴兴的“性价比”思维10年前就已注定
深度学习·算法·计算机视觉
IT古董6 小时前
【第七章:时间序列模型】2.时间序列统计模型与神经网络模型-(2)适用广泛的时间序列模型:Arima模型
人工智能·深度学习·神经网络
java1234_小锋6 小时前
PyTorch2 Python深度学习 - transform预处理转换模块
开发语言·python·深度学习·pytorch2
珺毅同学13 小时前
YOLO输出COCO指标及YOLOv12报错
python·深度学习·yolo
Rock_yzh15 小时前
AI学习日记——Transformer的架构:编码器与解码器
人工智能·深度学习·神经网络·学习·transformer