launcher.py: error: the following arguments are required: --output_dir

记录一个LLaMA-Factroy配置过程。

安装

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

训练

CUDA_VISIBLE_DEVICES=0 llamafactory-cli train example/train_lora/.yaml

按理说配置好文件应该就可以启动了,但是一直包错说没有output_dir这个参数。百思不得其解,后来我把整个yaml文件的参数都注视掉,竟然还是报了同样的错。我发现可能是其他地方出错,后来发现竟然是我的yaml配置文件是以yml结尾,官方的是以yaml结尾。大乌龙。因此如果官方有例子,尽量复制,再手动改,稍微细节没对上就会报错,这很正常,但是要通过尽可能合理的方式避免bug。

相关推荐
大模型之路4 小时前
Grok-3:人工智能领域的新突破
人工智能·llm·grok-3
政安晨4 小时前
政安晨的AI大模型训练实践 九 - 熟悉LLaMA Factory的详细参数含义-基本概念理解一下
ai训练·基本概念·llamafactory
喝不完一杯咖啡4 小时前
【AI时代】可视化训练模型工具LLaMA-Factory安装与使用
人工智能·llm·sft·llama·llama-factory
guyoung5 小时前
DeepSeek轻量级本地化部署工具——AIMatrices DeepSeek
rust·llm·deepseek
可乐张5 小时前
AutoGen 技术博客系列 (九):从 v0.2 到 v0.4 的迁移指南
后端·llm
可乐张5 小时前
AutoGen 技术博客系列 (八):深入剖析 Swarm—— 智能体协作的新范式
后端·llm
致Great2 天前
从零开始优化 RAG 流程的终极指南,解决检索增强生成的核心挑战
人工智能·llm
一 铭3 天前
dify实现分析-rag-关键词索引的实现
人工智能·语言模型·大模型·llm
shandianchengzi3 天前
【笔记】LLM|Ubuntu22服务器极简本地部署DeepSeek+联网使用方式
服务器·llm·api·本地部署·deepseek
cpuCode4 天前
BERT 大模型
人工智能·深度学习·ai·自然语言处理·大模型·llm·bert