ModelScope ms-swift:轻量级模型微调框架

ModelScope ms-swift:轻量级模型微调框架

介绍

ModelScope ms-swift是ModelScope社区提供的一个官方框架,用于大型语言模型(LLMs)和多模态大型模型(MLLMs)的微调和部署。该框架支持预训练、微调、人类对齐、推理、评估、量化和部署等多个环节。

支持的模型

ms-swift支持超过400个LLMs和150个MLLMs,包括Qwen2.5、Llama3.3、GLM4、Internlm2.5、Yi1.5、Mistral、DeepSeek2.5、Baichuan2等LLMs,以及Qwen2-VL、Qwen2-Audio、Llama3.2-Vision、Llava、InternVL2.5、MiniCPM-V-2.6等MLLMs。

支持的技术

ms-swift集成了最新的训练技术,包括LoRA、QLoRA、Llama-Pro、LongLoRA、GaLore、Q-GaLore、LoRA+、LISA、DoRA、FourierFt、ReFT、UnSloth和Liger等。此外,ms-swift还支持推理、评估和部署模块的加速,以及大模型和多模态大模型的量化。

使用方法

ms-swift提供了一个基于Gradio的Web-UI界面,帮助研究人员和开发者更方便地微调和应用大模型。用户可以通过PEFT接口来微调ModelScope模型,享受PEFT的熟悉界面。

为什么选择ms-swift?

ms-swift提供了从训练到部署的全面解决方案,支持多种预训练、微调、人类对齐、多模态数据集,以及自定义数据集。它不仅支持LLMs,还支持多模态模型,为用户提供了灵活的选择。

结论

ModelScope ms-swift是一个强大的工具,能够帮助用户轻松地微调和部署大型语言模型和多模态大型模型。无论是研究人员还是开发者,ms-swift都能为您提供强大的支持。

相关推荐
BatmanWayne1 个月前
swift微调记录
微调·swift
yyoc971 个月前
Mac基于LLaMA Factory微调模型导入Ollama踩坑记录
大模型·微调·llama·ollama
TGITCIC1 个月前
垂域大模型评估不再靠“感觉”:用结构化测试集+自动化打分实现效果可量化
自动化·lora·微调·ai训练·训练·大模型训练·大模型ai
爱吃泡芙的小白白1 个月前
深入浅出:Fine-tune(微调)的核心场景、实战方法与避坑指南
微调·fine-tune
一颗小树x1 个月前
【VLA 系列】 πRL | 在线强化学习 | 流匹配 | VLA
微调·强化学习·vla·流匹配·πrl
YMWM_2 个月前
测试 pi0.5 微调模型指南
微调·vla·pi0.5
羊城迷鹿2 个月前
从LoRA到OFT:Qwen2.5-VL在昇腾910B与4090上的多模态微调实践与踩坑记录
大模型·微调·多模态·qwen·llamafactory·oft
一碗甜汤ᐝ2 个月前
chatglm3-6b部署和微调
语言模型·大模型·微调·chatglm
勇气要爆发2 个月前
【AI扫盲】大模型(LLM)原理详解:从 DeepSeek 到 GPT-5 全面解析 (2026最新版)
人工智能·gpt·机器学习·llm·微调·多模态·预训练
草履虫稽亚娜2 个月前
使用ms-swift进行知识图谱补全与推理训练
ms-swift· 知识图谱补全· 推理系统