大语言模型微调框架Unsloth:简化模型微调流程,提升模型性能

Unsloth 将 Llama-3、Mistral、Phi-3 和 Gemma 等大型语言模型的微调速度提高了 2 倍,内存使用量减少了 70%,而且准确性不会降低!

特点

  • 通过手动派生所有计算繁重的数学步骤和手写 GPU 内核,unsloth 可以在不更改任何硬件的情况下神奇地使训练更快。
  • 与 Flash Attention 2 (FA2) 相比,在单个 GPU 上快 10 倍,在多个 GPU 系统上快 32 倍。
  • 我们支持从 Tesla T4 到 H100 的 NVIDIA GPU,并且可以移植到 AMD 和 Intel GPU。

支持模型

可以看到主流的开源模型基本都有支持,Llama、Qwen、Mistral、Gemma、Phi等等

版本

本身开源(Free),同样也支持企业级操作,费用见下图

Google Colab支持

Unsloth 开源版本可以安装在本地或像 Google Colab 这样的其他 GPU 服务中。大多数人通过 Google Colab 界面使用 Unsloth,它提供了一个免费的 GPU 来训练。

链接地址:https://docs.unsloth.ai/get-started/unsloth-notebooks

开源地址:https://github.com/unslothai/unsloth

可以点击里面的"start for free"直接开始你的微调工作。

相关推荐
却道天凉_好个秋6 分钟前
OpenCV(四十一):SIFT关键点检测
人工智能·opencv·计算机视觉
古城小栈7 分钟前
K8s 1.30 新特性:AI 驱动的资源调度 深度解析
人工智能·容器·kubernetes
一瞬祈望10 分钟前
PyTorch 图像分类完整项目模板实战
人工智能·pytorch·python·深度学习·分类
一马平川的大草原14 分钟前
AI Agent常见问题和核心术语
人工智能·学习笔记·agent
亚马逊云开发者27 分钟前
零售数字化转型新引擎:基于 Amazon Bedrock 和 Strands SDK 的 AI Agent 实践指南
人工智能
明月照山海-43 分钟前
机器学习周报二十六
人工智能·机器学习·计算机视觉
乱世刀疤1 小时前
Dify修改默认80端口的方法
人工智能·dify
杨小扩1 小时前
提升开发效率的在线工具箱实践:集成AI能力的多功能工具平台体验
人工智能
Master_oid1 小时前
机器学习25:了解领域自适应(Domain Adaptation)
人工智能·深度学习·机器学习
永恒-龙啸1 小时前
图像增强与滤波
图像处理·人工智能·计算机视觉