LLAMA Factory 微调Qwen2.0-VL-2B视觉大模型

本文主要参考:https://developer.aliyun.com/article/1643200

LLAMA Factory安装和使用参考:https://blog.csdn.net/pangxing6491/article/details/153682310?spm=1001.2014.3001.5501

一、制作数据集

1、增加mllm_data_tiny文件夹,并且修改dataset_info.json

2、mllm_data_tiny中包含图片和一个mllm_data_tiny.json文件,文件夹的名称和json文件名保持一致;

3、mllm_data_tiny.json格式如下,messages字段包含问题和答案,images包含图片的路径;

python 复制代码
[
  {
    "messages": [
      {
        "content": "<image>图片中的诊断结果是怎样?",
        "role": "user"
      },
      {
        "content": "The image is a non-contrasted computed tomography (CT) scan of the brain, showing the cerebral structures without any medical devices present. The region of interest, located centrally and in the middle of the image, exhibits an area of altered density, which is indicative of a brain hemorrhage. This area is distinct from the surrounding brain tissue, suggesting a possible hematoma or bleeding within the brain parenchyma. The location and characteristics of this abnormality may suggest a relationship with the surrounding brain tissue, potentially causing a mass effect or contributing to increased intracranial pressure.",
        "role": "assistant"
      }
    ],
    "images": [
      "mllm_data_tiny/8031efe0-1b5c-11ef-8929-000066532cad.jpg"
    ]
  }
]

二、选择基础大模型和目标数据集进行训练;

具体参考:https://blog.csdn.net/pangxing6491/article/details/153682310?spm=1001.2014.3001.5501

相关推荐
雪花desu2 小时前
深度解析RAG(检索增强生成)技术
人工智能·深度学习·语言模型·chatgpt·langchain
空白诗6 小时前
昇腾 NPU 落地 Llama3-8B:模型获取到数学解题推理的全流程实战
人工智能·ai·语言模型·npu
艾醒(AiXing-w)7 小时前
大模型原理剖析——矩阵吸收优化:LLM推理加速的核心原理与实践
人工智能·线性代数·语言模型·矩阵
Coovally AI模型快速验证8 小时前
开放词汇3D实例分割新思路:框引导+超点融合,精准检索罕见物体
人工智能·计算机视觉·3d·语言模型·机器人·无人机
破烂pan8 小时前
大语言模型在翻译领域的演进与游戏本地化应用分析
人工智能·游戏·语言模型
weixin_446260858 小时前
探索大语言模型:基础知识与应用指南
人工智能·语言模型·自然语言处理
弓.长.8 小时前
深入解析MoE架构:大模型高效训练的核心技术
人工智能·机器学习·语言模型·架构
WitsMakeMen10 小时前
大语言模型在线推理过程
人工智能·语言模型·自然语言处理
时光轻浅,半夏挽歌11 小时前
小分子的语言模型MolT5的使用
人工智能·语言模型·自然语言处理