llama factory 训练 TensorBoard 可视化

首先需要在 yaml 里设置两个参数:

yaml 复制代码
output_dir: /home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo

report_to: tensorboard
logging_dir: /home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo/runs

然后开始训练,在你的输出目录下会有 runs 文件夹。

安装 TensorBoard

shell 复制代码
proxychains4 pip install tensorboard

然后在服务上使用默认的6006端口正常启动tensorboard:

shell 复制代码
tensorboard --logdir=/home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo/runs --port=6006

然后浏览器打开链接。

ref:

https://github.com/hiyouga/LLaMA-Factory/issues/816

https://huggingface.co/docs/transformers/main_classes/trainer#transformers.TrainingArguments.logging_dir

https://datawhalechina.github.io/thorough-pytorch/第七章/7.3 使用TensorBoard可视化训练过程.html#id8

相关推荐
心疼你的一切7 小时前
昇腾CANN实战落地:从智慧城市到AIGC,解锁五大行业AI应用的算力密码
数据仓库·人工智能·深度学习·aigc·智慧城市·cann
chian-ocean7 小时前
量化加速实战:基于 `ops-transformer` 的 INT8 Transformer 推理
人工智能·深度学习·transformer
水月wwww7 小时前
【深度学习】卷积神经网络
人工智能·深度学习·cnn·卷积神经网络
杜子不疼.7 小时前
CANN_Transformer加速库ascend-transformer-boost的大模型推理性能优化实践
深度学习·性能优化·transformer
renhongxia18 小时前
如何基于知识图谱进行故障原因、事故原因推理,需要用到哪些算法
人工智能·深度学习·算法·机器学习·自然语言处理·transformer·知识图谱
深鱼~8 小时前
ops-transformer算子库:解锁昇腾大模型加速的关键
人工智能·深度学习·transformer·cann
禁默8 小时前
不仅是 FlashAttention:揭秘 CANN ops-transformer 如何重构大模型推理
深度学习·重构·aigc·transformer·cann
笔画人生8 小时前
进阶解读:`ops-transformer` 内部实现与性能调优实战
人工智能·深度学习·transformer
种时光的人9 小时前
CANN仓库核心解读:ascend-transformer-boost解锁AIGC大模型加速新范式
深度学习·aigc·transformer
brave and determined10 小时前
CANN ops-nn算子库使用教程:实现神经网络在NPU上的加速计算
人工智能·深度学习·神经网络