llama微调后大模型测评

一:自行问答

加载微调后的模型,问答

同问题复现

1.微调模型

复制代码
llamafactory-cli chat \
--model_name_or_path /mnt/c/Users/hsp/.cache/modelscope/hub/models/Qwen/Qwen2.5-7B-Instruct \
--model_type qwen2 \
--template qwen \
--finetuning_type lora \
--lora_dir ./lora_qwen

2,原模型

复制代码
llamafactory-cli chat \
--model_name_or_path /mnt/c/Users/hsp/.cache/modelscope/hub/models/Qwen/Qwen2.5-7B-Instruct \
--model_type qwen2 \
--template qwen

二:自动化指标测评(llama内置)

复制代码
llamafactory-cli eval \
--model_name_or_path 你的本地模型路径 \
--finetuning_type lora \
--lora_dir ./lora_qwen \
--eval_tasks ceval,cmmlu

跑完自动输出:准确率、得分、各项指标

ceval:中文能力测评;cmmlu:多学科综合测评

相关推荐
cv魔法师3 小时前
Linux构建编译llama.cpp
llama
Fzuim1 天前
Codex + llama.cpp + Qwen3.6-35B:零成本的本地 AI 编程方案,我把整套流程跑通了
人工智能·llama
元拓数智1 天前
跨库NL2SQL可信落地的核心:用IntaLink破解数据关系“迷雾”
数据库·人工智能·ai·nlp·agent·llama
硅谷茶馆2 天前
Codex+本地Qwen3.5无审查实用案例分享及llama对接踩坑。
llama
Soari2 天前
GitHub 开源项目解析:rk‑llama.cpp —— 基于 llama.cpp 的 Rockchip NPU 加速本地推理引擎
开源·github·llama·llm 推理·npu 本地模型推理·加速 c/c++ 开源项目
王天天(Bennet)2 天前
【从第一性原理来深入理解Transformer-更适合入门的理解(llama-3B模型为例)】
深度学习·transformer·llama
zhiSiBuYu05174 天前
llama.cpp 本地大模型部署与调用实战
llama
wangqiaowq4 天前
基于 LLaMA-Factory 的完整微调流程
llama
碳基硅坊5 天前
llama.cpp本地部署Qwen3.6-27B
人工智能·llama·推理加速·qwen3.6-27b
sleven fung6 天前
llama-cpp-python 本地部署入门
开发语言·python·算法·llama