LLaMA Factory模型微调实战

目录:

一、LLaMA Factory官网

LLaMA Factory官网地址

二、LLaMA Factory的安装

安装地址

powershell 复制代码
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

项目上使用conda虚拟环境安装效果更好,官网命令供参考。

三、web界面



测试回答,模型回答的不是很理想,所有我们需要进行微调处理。

四、模型微调



训练完成后,需要导出模型:

五、法律大模型微调

1、准备数据集

2、数据集数据处理



格式构建出来了。

3、dataset_info.json文件中配置处理的数据集

配置后就能在web页面找到我们配置的数据集。

接下来就是训练模型,使用web界面进行训练。



Abort里面可以加载模型和导入模型,上面训练完成后,可以通过这里导出模型,然后加载模型检测训练的效果。

4、加载模型检测

相同问题测试,效果要好很多,比之前更加简洁就能拿到答案。

相关推荐
Thomas.Sir17 小时前
第二章:LlamaIndex 的基本概念
人工智能·python·ai·llama·llamaindex
Thomas.Sir1 天前
第三章:Agent智能体开发实战之【LlamaIndex 工作流从入门到实战】
python·ai·llama·workflow·llamaindex
Thomas.Sir2 天前
第一章:Agent智能体开发实战之【初步认识 LlamaIndex:从入门到实操】
人工智能·python·ai·检索增强·llama·llamaindex
做个文艺程序员2 天前
2026 年开源大模型选型指南:Qwen3.5 / DeepSeek V3.2 / Llama 4 横向对比
人工智能·开源·llama
汀江游非侠2 天前
编译llama.cpp
llama
AI大模型..3 天前
数据洞察加速器:LLM Copilot 如何让 SQL 查询效率提升 50% 以上?
人工智能·langchain·llm·agent·llama
l1t3 天前
用llama试用gemma-4-E2B模型量化版本
人工智能·llama·gemma
Flying pigs~~3 天前
主流大模型介绍(GPT、Llama、ChatGLM、Qwen、deepseek)
gpt·chatgpt·llm·llama·moe·deepseek·混合专家模式
小超同学你好3 天前
Transformer 21. 从 LLaMA 到 Qwen:Rotary Position Embedding(RoPE)与 YaRN 一文读懂
语言模型·架构·transformer·llama
belldeep3 天前
AI: llama.cpp 编译成功后,入门教程
python·ai·llama·llama-cpp