lmms-eval--微调实战笔记

lmms-eval --大模型调用平台,方便新手上手大模型微调
lmms-eval的更多用法,没有mathversehttps://github.com/EleutherAI/lm-evaluation-harness.git

单卡运行,模型gpt-j-6B,数据集hellaswag

python 复制代码
git clone --depth 1 https://github.com/EleutherAI/lm-evaluation-harness
cd lm-evaluation-harness
pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple

#国内需要转镜像
export HF_ENDPOINT=https://hf-mirror.com

#单卡运行,模型gpt-j-6B,数据集hellaswag

lm_eval --model hf --model_args pretrained=EleutherAI/gpt-j-6B --tasks Math-PUMA/Math-PUMA_DeepSeek-Math-VL-7B --device cuda:0 --batch_size 8

#多卡运行,模型gpt-j-6B,搞两个数据集lambada_openai,arc_easy
accelerate launch --multi_gpu --num_processes 8 \
    -m lm_eval --model hf \
    --tasks lambada_openai,arc_easy \
    --model_args parallelize=True \
--model_args pretrained=EleutherAI/gpt-j-6B\
    --batch_size 16

#多卡运行,模型gpt-j-6B,搞两个数据集lambada_openai,arc_easy
accelerate launch --multi_gpu --num_processes 8 \
    -m lm_eval --model hf \
    --tasks AI4Math/MathVerse\
    --model_args parallelize=True \
--model_args pretrained=EleutherAI/gpt-j-6B,Math-PUMA/Math-PUMA_DeepSeek-Math-VL-7B\
    --batch_size 16

将数据集改为hf上的任意数据集,需要硬编码

相关推荐
teeeeeeemo17 分钟前
如何做HTTP优化
前端·网络·笔记·网络协议·http
数据皮皮侠2 小时前
最新上市公司业绩说明会文本数据(2017.02-2025.08)
大数据·数据库·人工智能·笔记·物联网·小程序·区块链
Magnetic_h4 小时前
【iOS】锁的原理
笔记·学习·macos·ios·objective-c·cocoa·xcode
Olrookie4 小时前
ruoyi-vue(十一)——代码生成
笔记·后端
yuxb734 小时前
Ansible 学习笔记:变量事实管理、任务控制与文件部署
linux·运维·笔记
鸢栀w4 小时前
前端css学习笔记7:各种居中布局&空白问题
前端·css·笔记·学习·尚硅谷网课
之歆5 小时前
大模型微调分布式训练-大模型压缩训练(知识蒸馏)-大模型推理部署(分布式推理与量化部署)-大模型评估测试(OpenCompass)
人工智能·笔记·python
十行代码九行报错6 小时前
Docker基础学习笔记
笔记·学习·docker
所愿ღ11 小时前
JavaWeb-Servlet基础
笔记·servlet
岑梓铭12 小时前
考研408《计算机组成原理》复习笔记,第五章(2)——CPU指令执行过程
笔记·考研·408·计算机组成原理·计组