LLaMA-Factory 微调LLaMA3

LoRA介绍

LoRA(Low-Rank Adaptation)是一种用于大模型微调的技术, 通过引入低秩矩阵来减少微调时的参数量。在预训练的模型中, LoRA通过添加两个小矩阵B和A来近似原始的大矩阵ΔW,从而减 少需要更新的参数数量。具体来说,LoRA通过将全参微调的增量 参数矩阵ΔW表示为两个参数量更小的矩阵B和A的低秩近似来实 现:

• [ W_0 + \Delta W = W_0 + BA ] • 其中,B和A的秩远小于原始矩阵的秩,从而大大减少了需要更新 的参数数量。

LLaMA-Factory 框架

首先需要通过vscode连接远程服务器哦

如果是租赁的AutoDL服务器,一定要将模型下载到数据盘。

git clone https://github.com/hiyouga/LLaMA-Factory.git

cd LLaMA-Factory

pip install -e .

准备训练数据

训练数据: fintech.json identity.json 将训练数据放在 LLaMA-Factory/data/fintech.json

并且修改数据注册文件:LLaMA-Factory/data/dataset_info.json

java 复制代码
 "fintech": {
 "file_name": "fintech.json",
 "columns": {
 "prompt": "instruction",
 "query": "input",
 "response": "output",
 "history": "history"
 }
 }

启动 Web UI

cd LLaMA-Factory

llamafactory-cli webui

vscode自带端口转发,不需要进行内网穿透了。

一定要在LLaMA-Factory 目录下启动。

模型准备

pip install modelscop #安装modelscope平台

sdk方式下载模型,同时可以查看模型整体的大小和权重。

模型微调,微调 Llama-3.2-1B-Instruct 模型

相关推荐
百***78759 小时前
Step-Audio-2 轻量化接入全流程详解
android·java·gpt·php·llama
Robot侠9 小时前
RTX 3090单卡微调 Llama-3 / Qwen2.5:基于 Unsloth + ModelScope 的极速实战
llama·modelscope·llama-3·unsloth·llm 微调·rtx 3090
暴风鱼划水11 小时前
大型语言模型(入门篇)B
人工智能·语言模型·大模型·llm
娃乐呵15 小时前
免费的大批量Excel文档大模型处理数据工具
语言模型·大模型·excel·数据处理
xwz小王子16 小时前
IROS 2025论文分享:基于大语言模型与行为树的人机交互学习实现自适应机器人操作
学习·语言模型·人机交互
Robot侠18 小时前
从 Python 到 Ollama:将微调后的 Llama-3/Qwen 一键导出为 GGUF
开发语言·python·llama·qwen
Robot侠18 小时前
给自己做一个 ChatGPT:基于 Gradio 的本地 LLM 网页对话界面
人工智能·chatgpt·llm·llama·qwen·gradio
阿杰学AI19 小时前
AI核心知识65——大语言模型之Vibe Coding (简洁且通俗易懂版)
人工智能·ai·语言模型·aigc·ai编程·vibe coding·ai coding
阿杰学AI19 小时前
AI核心知识64——大语言模型之RLVR (简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·rlvr·基于可验证奖励的强化学习
java1234_小锋21 小时前
Transformer 大语言模型(LLM)基石 - 输出层(Output Layer)详解以及算法实现
深度学习·语言模型·transformer