Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑

视频讲解:Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑_哔哩哔哩_bilibili

Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑

今天复现下Qwen2.5-VL玩玩

https://github.com/QwenLM/Qwen2.5-VL

创建conda环境,实测22.04,python3.10没什么依赖或者冲突的问题出现

复制代码
conda create -n qwen2.5-vl
 conda activate qwen2.5-vl

下载源码,安装相关依赖

复制代码
git clone https://github.com/QwenLM/Qwen2.5-VL 
cd Qwen2.5-VL 
pip install -r requirements_web_demo.txt

运行demo,有四个版本3B,7B,32B,72B,3B的比较小,但比较傻,下载比较快

复制代码
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-3B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-7B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-32B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-72B-Instruct"

第一次加载会先下载model,大概7个多G

实际运行起来,通过gradio起了一个Web

实际的界面

相关推荐
文心快码BaiduComate3 分钟前
双十一将至,用Rules玩转电商场景提效
前端·人工智能·后端
B站_计算机毕业设计之家5 分钟前
深度学习:Yolo水果检测识别系统 深度学习算法 pyqt界面 训练集测试集 深度学习 数据库 大数据 (建议收藏)✅
数据库·人工智能·python·深度学习·算法·yolo·pyqt
有来技术9 分钟前
vite-plugin-vue-mcp:在 Vue 3 + Vite 中启用 MCP,让 AI 理解并调试你的应用
前端·vue.js·人工智能
该用户已不存在9 分钟前
免费的 Vibe Coding 助手?你想要的Gemini CLI 都有
人工智能·后端·ai编程
thorn_r1 小时前
MCP驱动的AI角色扮演游戏
人工智能·游戏·机器学习·ai·自然语言处理·agent·mcp
得贤招聘官1 小时前
智能招聘革新:破解校招低效困局的核心方案
人工智能
乌恩大侠1 小时前
【Spark】操作记录
人工智能·spark·usrp
一水鉴天1 小时前
整体设计 全面梳理复盘 之27 九宫格框文法 Type 0~Ⅲ型文法和 bnf/abnf/ebnf 之1
人工智能·状态模式·公共逻辑
极客BIM工作室1 小时前
GAN vs. VAE:生成对抗网络 vs. 变分自编码机
人工智能·神经网络·生成对抗网络