lmms-eval--微调实战笔记

lmms-eval --大模型调用平台,方便新手上手大模型微调
lmms-eval的更多用法,没有mathversehttps://github.com/EleutherAI/lm-evaluation-harness.git

单卡运行,模型gpt-j-6B,数据集hellaswag

python 复制代码
git clone --depth 1 https://github.com/EleutherAI/lm-evaluation-harness
cd lm-evaluation-harness
pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple

#国内需要转镜像
export HF_ENDPOINT=https://hf-mirror.com

#单卡运行,模型gpt-j-6B,数据集hellaswag

lm_eval --model hf --model_args pretrained=EleutherAI/gpt-j-6B --tasks Math-PUMA/Math-PUMA_DeepSeek-Math-VL-7B --device cuda:0 --batch_size 8

#多卡运行,模型gpt-j-6B,搞两个数据集lambada_openai,arc_easy
accelerate launch --multi_gpu --num_processes 8 \
    -m lm_eval --model hf \
    --tasks lambada_openai,arc_easy \
    --model_args parallelize=True \
--model_args pretrained=EleutherAI/gpt-j-6B\
    --batch_size 16

#多卡运行,模型gpt-j-6B,搞两个数据集lambada_openai,arc_easy
accelerate launch --multi_gpu --num_processes 8 \
    -m lm_eval --model hf \
    --tasks AI4Math/MathVerse\
    --model_args parallelize=True \
--model_args pretrained=EleutherAI/gpt-j-6B,Math-PUMA/Math-PUMA_DeepSeek-Math-VL-7B\
    --batch_size 16

将数据集改为hf上的任意数据集,需要硬编码

相关推荐
Z.风止21 小时前
Large Model-learning(3)
人工智能·笔记·后端·深度学习
东京老树根1 天前
SAP学习笔记 - BTP SAP Build02 - Deploy,开始URL,Approve,Reject,履历确认,Log,Context
笔记·学习
zjeweler1 天前
“网安+护网”终极300多问题面试笔记-全
笔记·网络安全·面试·职场和发展
仲芒1 天前
[24年单独笔记] MySQL 常用的 DDL 命令
笔记·mysql·oracle
仲芒1 天前
[24年单独笔记] MySQL 常用的 DML 命令
数据库·笔记·mysql
lwewan1 天前
CPU 调度
笔记·考研
John.Lewis1 天前
C++进阶(6)C++11(2)
开发语言·c++·笔记
CheerWWW1 天前
C++学习笔记——栈内存与堆内存、宏、auto、std::array
c++·笔记·学习
-许平安-1 天前
MCP项目笔记十(客户端 MCPClient)
c++·笔记·ai·raii·mcp·pluginapi·plugin system
一只旭宝1 天前
【C++ 入门精讲2】函数重载、默认参数、函数指针、volatile | 手写笔记(附完整代码)
c++·笔记