LLaMA Factory模型微调实战

目录:

一、LLaMA Factory官网

LLaMA Factory官网地址

二、LLaMA Factory的安装

安装地址

powershell 复制代码
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

项目上使用conda虚拟环境安装效果更好,官网命令供参考。

三、web界面



测试回答,模型回答的不是很理想,所有我们需要进行微调处理。

四、模型微调



训练完成后,需要导出模型:

五、法律大模型微调

1、准备数据集

2、数据集数据处理



格式构建出来了。

3、dataset_info.json文件中配置处理的数据集

配置后就能在web页面找到我们配置的数据集。

接下来就是训练模型,使用web界面进行训练。



Abort里面可以加载模型和导入模型,上面训练完成后,可以通过这里导出模型,然后加载模型检测训练的效果。

4、加载模型检测

相同问题测试,效果要好很多,比之前更加简洁就能拿到答案。

相关推荐
DigitalOcean3 天前
DigitalOcean Gradient AI 推理云平台原生集成 LlamaIndex
llama
ECHO飞跃 0129 天前
Unity2019 本地推理 通义千问0.5-1.5B微调导入
人工智能·深度学习·unity·llama
黑白极客9 天前
ACP大模型认证刷题工具开源,助力高效备考
java·ai·github·llama·认证
迷之程序员9 天前
llama-cpp-python用法,模型加载gpu踩坑全记录
开发语言·python·llama
~kiss~10 天前
Ollama 底层的 llama.cpp 和 GGUF
llama
小雨中_11 天前
4.1 Megatron-LM:千卡级集群预训练的“硬核”框架
人工智能·python·深度学习·机器学习·llama
重生之我要成为代码大佬12 天前
AI框架设计与选型
人工智能·langchain·大模型·llama·qwen
小雨中_12 天前
4.1 LLaMA 系列:从 LLaMA-1 到 LLaMA-3
人工智能·python·深度学习·机器学习·自然语言处理·llama
l1t14 天前
DeepSeek总结的llama.cpp使用说明
llama
爱跑步的程序员~17 天前
SpringBoot集成SpringAI与Ollama本地大模型
java·后端·spring·ai·llama·springai