llama factory 训练 TensorBoard 可视化

首先需要在 yaml 里设置两个参数:

yaml 复制代码
output_dir: /home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo

report_to: tensorboard
logging_dir: /home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo/runs

然后开始训练,在你的输出目录下会有 runs 文件夹。

安装 TensorBoard

shell 复制代码
proxychains4 pip install tensorboard

然后在服务上使用默认的6006端口正常启动tensorboard:

shell 复制代码
tensorboard --logdir=/home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo/runs --port=6006

然后浏览器打开链接。

ref:

https://github.com/hiyouga/LLaMA-Factory/issues/816

https://huggingface.co/docs/transformers/main_classes/trainer#transformers.TrainingArguments.logging_dir

https://datawhalechina.github.io/thorough-pytorch/第七章/7.3 使用TensorBoard可视化训练过程.html#id8

相关推荐
海边夕阳20068 小时前
【每天一个AI小知识】:什么是目标检测?
人工智能·python·深度学习·目标检测·机器学习·计算机视觉·目标跟踪
cyyt8 小时前
深度学习周报(11.24~11.30)
人工智能·深度学习
Blossom.1188 小时前
基于Mamba-2的实时销量预测系统:如何用选择性状态空间干掉Transformer的O(n²)噩梦
人工智能·python·深度学习·react.js·机器学习·设计模式·transformer
_codemonster8 小时前
深度学习实战(基于pytroch)系列(三十八)门控循环单元(GRU)从零开始实现
人工智能·深度学习·gru
_codemonster8 小时前
深度学习实战(基于pytroch)系列(三十九)门控循环单元(GRU)pytorch简洁实现
pytorch·深度学习·gru
Dev7z8 小时前
基于深度学习的手写数学公式识别与计算系统设计与实现
人工智能·深度学习
七宝大爷8 小时前
编码器-解码器架构:理解Transformer的两种基本模式
深度学习·架构·transformer
ByteCraze8 小时前
如何处理大模型幻觉问题?
前端·人工智能·深度学习·机器学习·node.js
三年呀8 小时前
深入探索量子机器学习:原理、实践与未来趋势的全景剖析
人工智能·深度学习·机器学习·量子计算
Fairy要carry9 小时前
大模型之Block实现
pytorch·python·深度学习