Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑

视频讲解:Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑_哔哩哔哩_bilibili

Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑

今天复现下Qwen2.5-VL玩玩

https://github.com/QwenLM/Qwen2.5-VL

创建conda环境,实测22.04,python3.10没什么依赖或者冲突的问题出现

复制代码
conda create -n qwen2.5-vl
 conda activate qwen2.5-vl

下载源码,安装相关依赖

复制代码
git clone https://github.com/QwenLM/Qwen2.5-VL 
cd Qwen2.5-VL 
pip install -r requirements_web_demo.txt

运行demo,有四个版本3B,7B,32B,72B,3B的比较小,但比较傻,下载比较快

复制代码
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-3B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-7B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-32B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-72B-Instruct"

第一次加载会先下载model,大概7个多G

实际运行起来,通过gradio起了一个Web

实际的界面

相关推荐
摸鱼仙人~2 小时前
机器学习常用评价指标
人工智能·机器学习
一点.点2 小时前
WiseAD:基于视觉-语言模型的知识增强型端到端自动驾驶——论文阅读
人工智能·语言模型·自动驾驶
fanstuck3 小时前
从知识图谱到精准决策:基于MCP的招投标货物比对溯源系统实践
人工智能·知识图谱
dqsh063 小时前
树莓派5+Ubuntu24.04 LTS串口通信 保姆级教程
人工智能·python·物联网·ubuntu·机器人
打小就很皮...4 小时前
编写大模型Prompt提示词方法
人工智能·语言模型·prompt
Aliano2174 小时前
Prompt(提示词)工程师,“跟AI聊天”
人工智能·prompt
weixin_445238125 小时前
第R8周:RNN实现阿尔兹海默病诊断(pytorch)
人工智能·pytorch·rnn
KingDol_MIni5 小时前
ResNet残差神经网络的模型结构定义(pytorch实现)
人工智能·pytorch·神经网络
新加坡内哥谈技术6 小时前
亚马逊推出新型仓储机器人 Vulcan:具备“触觉”但不会取代人类工人
人工智能
Alter12306 小时前
从一城一云到AI CITY,智慧城市进入新阶段
人工智能·智慧城市