llama factory 训练 TensorBoard 可视化

首先需要在 yaml 里设置两个参数:

yaml 复制代码
output_dir: /home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo

report_to: tensorboard
logging_dir: /home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo/runs

然后开始训练,在你的输出目录下会有 runs 文件夹。

安装 TensorBoard

shell 复制代码
proxychains4 pip install tensorboard

然后在服务上使用默认的6006端口正常启动tensorboard:

shell 复制代码
tensorboard --logdir=/home/wangguisen/projects/LLaMA-Factory/weights/tensbox_demo/runs --port=6006

然后浏览器打开链接。

ref:

https://github.com/hiyouga/LLaMA-Factory/issues/816

https://huggingface.co/docs/transformers/main_classes/trainer#transformers.TrainingArguments.logging_dir

https://datawhalechina.github.io/thorough-pytorch/第七章/7.3 使用TensorBoard可视化训练过程.html#id8

相关推荐
老吴学AI3 小时前
斯坦福AI顶级课程:AI 职业发展建议与市场展望(详细逐字稿)by 吴恩达和劳伦斯
人工智能·深度学习·机器学习·vibe coding
import_random3 小时前
[深度学习]LSTM模型的构建模块(如何添加层)
深度学习
t198751283 小时前
神经网络控制的多方法融合:PID、模型预测控制(MPC)与自适应策略
人工智能·深度学习·神经网络
brent4234 小时前
DAY47 简单CNN
深度学习·神经网络·cnn
540_5404 小时前
ADVANCE Day41
人工智能·python·深度学习
AI人工智能+4 小时前
基于深度学习的表格识别技术,通过多模态神经网络实现高精度OCR识别,支持复杂表格结构解析和版面还原
深度学习·ocr·表格识别
能源系统预测和优化研究4 小时前
传统机器学习(如xgboost、随机森林等)和深度学习(如LSTM等)在时间序列预测各有什么优缺点?
深度学习·随机森林·机器学习
AI街潜水的八角5 小时前
基于keras框架的MobileNet深度学习神经网络垃圾识别分类系统源码
深度学习·神经网络·keras
cute_ming5 小时前
基于jieba的RAG通用分词最佳实践
人工智能·深度学习·知识图谱
汗流浃背了吧,老弟!5 小时前
Transformer-初识
人工智能·深度学习·transformer