技术栈
unsloth
_Meilinger_
17 天前
大模型
·
llm
·
微调
·
llama
·
大模型微调
·
llama-factory
·
unsloth
大模型微调|使用 LLaMA-Factory 微调 Llama3-8B-Chinese-Chat 完成知识问答任务
前言:本篇博客分享如何基于LLaMA-Factory使用现有金融数据集实现LLaMA3的微调,以完成金融领域的知识问答任务。
熊文豪
1 个月前
lora
·
huggingface
·
ollama
·
unsloth
·
googlecolab
·
ai微调
·
医疗ai
轻松微调大模型:利用 Colab 和 Unsloth 实现高效训练
大型语言模型(LLM)如 Llama、Mistral 等在通用任务上表现惊艳,但要让它们适配特定场景(比如医疗问答、算命预测),就需要微调。Google Colab 提供免费的 GPU 资源,而 Unsloth 是一个高效的微调工具,能大幅降低显存需求,让普通用户也能在云端完成训练。这篇文章将带你一步步完成从零到部署的全过程。
冀辉
1 个月前
人工智能
·
sft
·
大模型微调
·
unsloth
·
deepseek蒸馏模型微调
Ubuntu2204下使用NVIDIA GeForce RTX 4090进行DeepSeek-R1-Distill-Llama-8B模型微调
使用unsloth,可以方便地对大模型进行微调。以微调DeepSeek-R1-Distill-Llama-8B为例:
cxr828
3 个月前
llama
·
cesium
·
unsloth
如何制定有效的微调策略
制定有效的微调策略是将开源大模型(如 Qwen2.5-coder)成功应用于特定领域(例如基于 Cesium 框架开发)的关键步骤。以下将从多个专业维度深入、系统、详细地阐述微调策略的制定方法,包括微调目标的明确、数据策略、模型调整方法、训练流程优化、评估与验证策略等方面。
drbool
7 个月前
人工智能
·
llama
·
unsloth
Unsloth微调环境搭建与LLaMA 3.1-8B模型微调实践指南
本文将详细介绍如何使用Unsloth框架进行LLaMA 3.1-8B模型的微调,帮助您快速构建微调环境,并了解微调流程的基本步骤。本教程适合初学者,旨在帮助您在短时间内实现自己的专属模型微调。对于更复杂的微调参数和细节设置,将在后续文章中进一步阐述。
伊织code
9 个月前
大模型
·
微调
·
sft
·
llama
·
gguf
·
unsloth
Unsloth 微调 Llama 3
本文参考: https://colab.research.google.com/drive/135ced7oHytdxu3N2DNe1Z0kqjyYIkDXp 改编自:https://blog.csdn.net/qq_38628046/article/details/138906504