LLaMA-Factory实战推理

LLaMA-Factory官网:https://github.com/hiyouga/LLaMA-Factory

安装环境

python 复制代码
git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory/
conda create -n py310 python=3.10
conda activate py310

按照llama-factory要求的标准格式组织数据集,保存成一个文件,比如下面这种.json文件:

python 复制代码
[
  {
    "instruction": "user instruction (required)",
    "input": "user input (optional)",
    "output": "model response (required)",
    "system": "system prompt (optional)",
    "history": [
      ["user instruction in the first round (optional)", "model response in the first round (optional)"],
      ["user instruction in the second round (optional)", "model response in the second round (optional)"]
    ]
  }
]

大模型选择:

LLaMA、Mistral、Mixtral-MoE、Qwen、Yi、Gemmha、Baichuan、ChatGLM、Phi

推理模型

python 复制代码
CUDA_VISIBLE_DEVICES=0 python cli_demo.py \--model_name_or_path path_to_llama_model \--adapter_name_or_path path_to_checkpoint \--template default \--finetuning_type lora

总结:

有效的微调已成为大型语言模型适应特定任务的必要条件之一。随着 Llama-Factory 的引入,这一全面的框架让训练更加高效,用户无需编写代码即可轻松为超过 100 个 LLMs 定制微调。

相关推荐
Fleshy数模11 小时前
基于 Qwen2.5-1.5B-Instruct 实现多轮对话与文本分类实践
人工智能·分类·大模型
IOT.FIVE.NO.111 小时前
别再只盯 AGENTS.md 了,Codex 和 Claude Code 真正重要的是这几层配置
人工智能
candyTong11 小时前
Claude Code 的任务列表是怎么实现的
人工智能
Mike_66611 小时前
PaddleOCR v4模型转onnx踩坑记
人工智能
小雨青年11 小时前
GitHub Copilot CLI 完全指南:把终端里的 AI 助手真正用起来
人工智能·github·copilot
黎阳之光11 小时前
黎阳之光:深耕视频孪生核心领域 构筑数字孪生全域数智新标杆
大数据·人工智能·算法·安全·数字孪生
郭龙_Jack11 小时前
自有广告系统设计与实践
大数据·人工智能
自小吃多11 小时前
AI本地部署快速步骤
人工智能
漫游的渔夫11 小时前
前端开发者做 AI 工程:别停在脚本阶段,用 2 个 API 把 Agent 交给前端调用
前端·人工智能·typescript
AustinXu12 小时前
构建 AI Agent 系统:从复杂 Agent Skills到企业级 AI Agent
人工智能