qwen2-vl

西西弗Sisyphus3 天前
lora·大模型·transformer·qwen2-vl
使用Gradio编写大模型ollama客户端 -界面版flyfish文末包含完整源码图例 sqlite3 是 Python 内置的一个库,用于与 SQLite 数据库进行交互。SQLite 是一个轻量级的数据库,它不需要单独的服务器进程或系统的配置,非常适合于嵌入式应用和小型项目。
威化饼的一隅8 天前
人工智能·深度学习·大模型·swift·多模态模型·qwen2-vl
【多模态】swift框架使用qwen2-vl前几篇里面学习了常见的一些多模态模型的典型架构和源代码,上一篇里面测试使用了minicpm-v系列模型,在尝试RLHF的时候发现swift特别好用特别全,记录一下对swift的一些使用,欢迎批评指正~   前一篇里面写了minicpm-v的使用方法,这里主要记录qwen2-vl的使用。
西西弗Sisyphus10 天前
lora·transformer·qwen2-vl·qwen2vl
模型训练中梯度累积步数(gradient_accumulation_steps)的作用flyfish在使用训练大模型时,TrainingArguments有一个参数梯度累积步数(gradient_accumulation_steps)
SpikeKing1 个月前
人工智能·大语言模型·llama·参数量·qwen2-vl·多模态大语言模型·numel
LLM - 计算 多模态大语言模型 的参数量(Qwen2-VL、Llama-3.1) 教程欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/143749468
SpikeKing1 个月前
人工智能·lora·llm·sft·多模态大模型·llama-factory·qwen2-vl
LLM - 使用 LLaMA-Factory 微调大模型 Qwen2-VL SFT(LoRA) 图像数据集 教程 (2)欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/143725947
OpenAppAI2 个月前
多模态模型·qwen2-vl
《Qwen2-VL》论文精读【下】:发表于2024年10月 Qwen2-VL 迅速崛起 | 性能与GPT-4o和Claude3.5相当《Qwen2-VL》论文精读【上】:发表于2024年10月 Qwen2-VL 迅速崛起 | 性能与GPT-4o和Claude3.5相当 上回详细分析了Qwen2-VL的论文摘要、引言、实验,下面继续精读Qwen2-VL的方法部分。
OpenAppAI2 个月前
多模态大模型·qwen2-vl
《Qwen2-VL》论文精读【上】:发表于2024年10月 Qwen2-VL 迅速崛起 | 性能与GPT-4o和Claude3.5相当1、论文地址Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution 2、Qwen2-VL的Github仓库地址
SpikeKing2 个月前
人工智能·lora·swift·qwen2-vl·多模态大语言模型·视频微调
LLM - 配置 ModelScope SWIFT 测试 Qwen2-VL 视频微调(LoRA) 教程(3)欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142882496
engchina4 个月前
qwen2-vl
本地运行 Qwen2-VL完结!refer: