llama微调后大模型测评

一:自行问答

加载微调后的模型,问答

同问题复现

1.微调模型

复制代码
llamafactory-cli chat \
--model_name_or_path /mnt/c/Users/hsp/.cache/modelscope/hub/models/Qwen/Qwen2.5-7B-Instruct \
--model_type qwen2 \
--template qwen \
--finetuning_type lora \
--lora_dir ./lora_qwen

2,原模型

复制代码
llamafactory-cli chat \
--model_name_or_path /mnt/c/Users/hsp/.cache/modelscope/hub/models/Qwen/Qwen2.5-7B-Instruct \
--model_type qwen2 \
--template qwen

二:自动化指标测评(llama内置)

复制代码
llamafactory-cli eval \
--model_name_or_path 你的本地模型路径 \
--finetuning_type lora \
--lora_dir ./lora_qwen \
--eval_tasks ceval,cmmlu

跑完自动输出:准确率、得分、各项指标

ceval:中文能力测评;cmmlu:多学科综合测评

相关推荐
佳xuan21 小时前
LLama_Factory配置及模型微调实践
llama
zhangfeng11331 天前
LLaMA-Factory 在训练模型时检查点(Checkpoint)文件说明
人工智能·深度学习·llama
ONE_SIX_MIX2 天前
最先进llama.cpp量化方法PK,APEX vs UD_XL,在 Qwen3.6-35B-A3B 中爆发! 2026年4月
apex·llama·量化·unsloth
天地沧海4 天前
GPT、BERT、LLaMA 这些模型类别怎么区分
gpt·bert·llama
胖少年6 天前
从零开始:在 Windows 上用 llama.cpp 跑本地大模型
windows·llama
路人与大师7 天前
在天垓150上部署 Llama-2-13B:一次 Iluvatar BI-V150 / CoreX 实战适配记录
llama
code_pgf7 天前
Llama 3 / Qwen / Mistral / DeepSeek 对比详解
人工智能·知识图谱·llama
yumgpkpm7 天前
Qwen3.6正式开源,华为昇腾910B实现高效适配
华为·ai作画·stable diffusion·开源·ai写作·llama·gpu算力
究极无敌暴龙战神X9 天前
RAG基本流程
自然语言处理·llama·rag