# 微调需要准备哪些环境配置?

微调需要准备哪些环境配置?

如果没有 GPU,即便是微调较小的大语言模型(LLMs),过程也会比较慢。如果你已经有了现成的 GPU,那就可以直接开工了。不过,并不是所有人都能负担得起 GPU------ 这种情况下,你可以使用云服务平台来跟随本实操系列课程运行代码,比如 Google Colab(免费版提供 Tesla T4 GPU,含 15GB 内存)和 runpod.io(付费服务)。

Google Colab 配置

Google Colab 的默认环境已经包含了将用到的大部分库,只需要额外安装三个库:datasets、bitsandbytes和trl,操作非常简单。

Runpod.io 配置

RunPod 的 Jupyter Notebook 模板只预装了两个库:numpy和torch,因此你需要手动安装所有其他必要的包。

可选库

还有几个可选库:ollama、unsloth、xformers和gguf。 用于转换和部署微调后的模型。根据你在这些步骤中选择的方案不同,可能需要安装其中一个或多个库。

相关推荐
量子位4 小时前
WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线
deepseek
段智华6 小时前
微调大语言模型(LLM)有多难?
peft·大模型微调
Younglina6 小时前
🔮 用Vue3+TypeScript打造沉浸式AI塔罗牌占卜应用 > 一个集成DeepSeek AI、支持PWA的现代化塔罗牌Web应用开发实战分享
前端·vue.js·deepseek
萌主墩墩1 天前
趣玩-Ollama-Llm-Chatrbot
llm·qwen·ollama·deepseek
程序员岳焱2 天前
从 0 到 1:Spring Boot 与 Spring AI 打造智能客服系统(基于DeepSeek)
人工智能·后端·deepseek
前端工作日常2 天前
DeepSeek-R1 系列不同版本的模型配置要求
deepseek
大模型开发2 天前
刷到就是赚到!大模型学习经验分享,帮你少走 3 年弯路
程序员·llm·deepseek
AI大模型2 天前
五分钟搭建属于你的AI助手:Ollama+DeepSeek+AnythingLLM深度整合
llm·ollama·deepseek
康斯坦丁师傅3 天前
超越DeepSeek,Kimi又杀疯了!
deepseek