lmms-eval--微调实战笔记

lmms-eval --大模型调用平台,方便新手上手大模型微调
lmms-eval的更多用法,没有mathversehttps://github.com/EleutherAI/lm-evaluation-harness.git

单卡运行,模型gpt-j-6B,数据集hellaswag

python 复制代码
git clone --depth 1 https://github.com/EleutherAI/lm-evaluation-harness
cd lm-evaluation-harness
pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple

#国内需要转镜像
export HF_ENDPOINT=https://hf-mirror.com

#单卡运行,模型gpt-j-6B,数据集hellaswag

lm_eval --model hf --model_args pretrained=EleutherAI/gpt-j-6B --tasks Math-PUMA/Math-PUMA_DeepSeek-Math-VL-7B --device cuda:0 --batch_size 8

#多卡运行,模型gpt-j-6B,搞两个数据集lambada_openai,arc_easy
accelerate launch --multi_gpu --num_processes 8 \
    -m lm_eval --model hf \
    --tasks lambada_openai,arc_easy \
    --model_args parallelize=True \
--model_args pretrained=EleutherAI/gpt-j-6B\
    --batch_size 16

#多卡运行,模型gpt-j-6B,搞两个数据集lambada_openai,arc_easy
accelerate launch --multi_gpu --num_processes 8 \
    -m lm_eval --model hf \
    --tasks AI4Math/MathVerse\
    --model_args parallelize=True \
--model_args pretrained=EleutherAI/gpt-j-6B,Math-PUMA/Math-PUMA_DeepSeek-Math-VL-7B\
    --batch_size 16

将数据集改为hf上的任意数据集,需要硬编码

相关推荐
九成宫8 小时前
计算机网络期末复习——第2章:应用层 Part One
笔记·计算机网络·软件工程
半夏知半秋9 小时前
rust学习-闭包
开发语言·笔记·后端·学习·rust
你喜欢喝可乐吗?9 小时前
FastAPI 入门笔记
笔记·fastapi
hkNaruto10 小时前
【AI】AI学习笔记:A2A(智能体协作)入门指南:从概念到实践
人工智能·笔记·学习
yj_sharing10 小时前
动手学深度学习softmax回归的笔记
笔记·深度学习·回归
暖暖木头10 小时前
playwright学习笔记
笔记·学习
hetao173383710 小时前
2026-01-06 hetao1733837 的刷题笔记
c++·笔记·算法
qq_3975623111 小时前
昆仑通态屏幕 , 脚本使用笔记
笔记
koo36412 小时前
pytorch深度学习笔记12
pytorch·笔记·深度学习
慕容雪_13 小时前
运维笔记-网络共享
运维·笔记·网络共享