LLaMA Factory模型微调实战

目录:

一、LLaMA Factory官网

LLaMA Factory官网地址

二、LLaMA Factory的安装

安装地址

powershell 复制代码
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

项目上使用conda虚拟环境安装效果更好,官网命令供参考。

三、web界面



测试回答,模型回答的不是很理想,所有我们需要进行微调处理。

四、模型微调



训练完成后,需要导出模型:

五、法律大模型微调

1、准备数据集

2、数据集数据处理



格式构建出来了。

3、dataset_info.json文件中配置处理的数据集

配置后就能在web页面找到我们配置的数据集。

接下来就是训练模型,使用web界面进行训练。



Abort里面可以加载模型和导入模型,上面训练完成后,可以通过这里导出模型,然后加载模型检测训练的效果。

4、加载模型检测

相同问题测试,效果要好很多,比之前更加简洁就能拿到答案。

相关推荐
Coder个人博客2 天前
MiniCPM-o.cpp 接口调用流程综合总结
llama
大模型实验室Lab4AI3 天前
Qwen-Video-8B与LLaMA-Factory联动实现垂类视频理解
人工智能·音视频·llama
百***78753 天前
LLaMA 4 API国内稳定接入指南:中转服务全链路实操与优化方案
开发语言·php·llama
百***24373 天前
LLaMA 4 vs GPT-5.2 全面对比:技术特性、接入成本与国内适配选型指南
gpt·llama
Coder个人博客3 天前
MiniCPM-o.cpp 项目概览
llama
大模型实验室Lab4AI4 天前
LLaMA-Factory 课程答疑系列一:10个关键问题速查,官方认证解法让训练推理不踩雷
人工智能·llama
小苑同学5 天前
PaperReding:《LLaMA: Open and Efficient Foundation Language Models》
人工智能·语言模型·llama
deephub5 天前
llama.cpp Server 引入路由模式:多模型热切换与进程隔离机制详解
人工智能·python·深度学习·llama
Robot侠7 天前
极简LLM入门指南1
llm·llama