# 微调需要准备哪些环境配置?

微调需要准备哪些环境配置?

如果没有 GPU,即便是微调较小的大语言模型(LLMs),过程也会比较慢。如果你已经有了现成的 GPU,那就可以直接开工了。不过,并不是所有人都能负担得起 GPU------ 这种情况下,你可以使用云服务平台来跟随本实操系列课程运行代码,比如 Google Colab(免费版提供 Tesla T4 GPU,含 15GB 内存)和 runpod.io(付费服务)。

Google Colab 配置

Google Colab 的默认环境已经包含了将用到的大部分库,只需要额外安装三个库:datasets、bitsandbytes和trl,操作非常简单。

Runpod.io 配置

RunPod 的 Jupyter Notebook 模板只预装了两个库:numpy和torch,因此你需要手动安装所有其他必要的包。

可选库

还有几个可选库:ollama、unsloth、xformers和gguf。 用于转换和部署微调后的模型。根据你在这些步骤中选择的方案不同,可能需要安装其中一个或多个库。

相关推荐
OpenBayes16 小时前
OCR 新范式!DeepSeek 以「视觉压缩」替代传统字符识别;Bald Classification数据集助力高精度人像分类
人工智能·深度学习·分类·数据挖掘·ocr·数据集·deepseek
安如衫1 天前
【学习笔记更新中】Deeplearning.AI 大语言模型后训练:微调与强化学习导论
人工智能·llm·sft·后训练·deepseek
realhuizhu1 天前
周报写了2小时还被挑刺?试试这个AI生成框架
ai提示词·deepseek·工作周报·职场效率·周报生成器
l1t1 天前
利用DeepSeek采用hugeint转字符串函数完善luadbi-duckdb的decimal处理
数据库·lua·c·duckdb·deepseek
Mr.Lee jack2 天前
【CUDA 编程思想】FwdKvcacheMla 算子详细数据流程讲解
deepseek
武子康2 天前
AI研究-121 DeepSeek-OCR 研究路线:无限上下文、跨模态抽取、未来创意点、项目创意点
人工智能·深度学习·机器学习·ai·ocr·deepseek·deepseek-ocr
嗷嗷哦润橘_2 天前
集群网络技术1:RDMA和相关协议
网络·阿里云·deepseek
武子康3 天前
AI研究-120 DeepSeek-OCR 从 0 到 1:上手路线、实战要点
人工智能·深度学习·机器学习·ai·ocr·deepseek·deepseek-ocr
血小溅3 天前
Spring Boot 整合 Spring AI:接入 DeepSeek 与 Ollama 调用大模型
后端·ollama·deepseek
视觉&物联智能3 天前
【杂谈】-制造业变革:机器人与自动化引领新时代
人工智能·ai·机器人·自动化·aigc·agi·deepseek