技术栈
qwen2-vl
西西弗Sisyphus
3 天前
lora
·
大模型
·
transformer
·
qwen2-vl
使用Gradio编写大模型ollama客户端 -界面版
flyfish文末包含完整源码图例 sqlite3 是 Python 内置的一个库,用于与 SQLite 数据库进行交互。SQLite 是一个轻量级的数据库,它不需要单独的服务器进程或系统的配置,非常适合于嵌入式应用和小型项目。
威化饼的一隅
8 天前
人工智能
·
深度学习
·
大模型
·
swift
·
多模态模型
·
qwen2-vl
【多模态】swift框架使用qwen2-vl
前几篇里面学习了常见的一些多模态模型的典型架构和源代码,上一篇里面测试使用了minicpm-v系列模型,在尝试RLHF的时候发现swift特别好用特别全,记录一下对swift的一些使用,欢迎批评指正~ 前一篇里面写了minicpm-v的使用方法,这里主要记录qwen2-vl的使用。
西西弗Sisyphus
10 天前
lora
·
transformer
·
qwen2-vl
·
qwen2vl
模型训练中梯度累积步数(gradient_accumulation_steps)的作用
flyfish在使用训练大模型时,TrainingArguments有一个参数梯度累积步数(gradient_accumulation_steps)
SpikeKing
1 个月前
人工智能
·
大语言模型
·
llama
·
参数量
·
qwen2-vl
·
多模态大语言模型
·
numel
LLM - 计算 多模态大语言模型 的参数量(Qwen2-VL、Llama-3.1) 教程
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/143749468
SpikeKing
1 个月前
人工智能
·
lora
·
llm
·
sft
·
多模态大模型
·
llama-factory
·
qwen2-vl
LLM - 使用 LLaMA-Factory 微调大模型 Qwen2-VL SFT(LoRA) 图像数据集 教程 (2)
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/143725947
OpenAppAI
2 个月前
多模态模型
·
qwen2-vl
《Qwen2-VL》论文精读【下】:发表于2024年10月 Qwen2-VL 迅速崛起 | 性能与GPT-4o和Claude3.5相当
《Qwen2-VL》论文精读【上】:发表于2024年10月 Qwen2-VL 迅速崛起 | 性能与GPT-4o和Claude3.5相当 上回详细分析了Qwen2-VL的论文摘要、引言、实验,下面继续精读Qwen2-VL的方法部分。
OpenAppAI
2 个月前
多模态大模型
·
qwen2-vl
《Qwen2-VL》论文精读【上】:发表于2024年10月 Qwen2-VL 迅速崛起 | 性能与GPT-4o和Claude3.5相当
1、论文地址Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution 2、Qwen2-VL的Github仓库地址
SpikeKing
2 个月前
人工智能
·
lora
·
swift
·
qwen2-vl
·
多模态大语言模型
·
视频微调
LLM - 配置 ModelScope SWIFT 测试 Qwen2-VL 视频微调(LoRA) 教程(3)
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142882496
engchina
4 个月前
qwen2-vl
本地运行 Qwen2-VL
完结!refer: