Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑

视频讲解:Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑_哔哩哔哩_bilibili

Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑

今天复现下Qwen2.5-VL玩玩

https://github.com/QwenLM/Qwen2.5-VL

创建conda环境,实测22.04,python3.10没什么依赖或者冲突的问题出现

复制代码
conda create -n qwen2.5-vl
 conda activate qwen2.5-vl

下载源码,安装相关依赖

复制代码
git clone https://github.com/QwenLM/Qwen2.5-VL 
cd Qwen2.5-VL 
pip install -r requirements_web_demo.txt

运行demo,有四个版本3B,7B,32B,72B,3B的比较小,但比较傻,下载比较快

复制代码
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-3B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-7B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-32B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-72B-Instruct"

第一次加载会先下载model,大概7个多G

实际运行起来,通过gradio起了一个Web

实际的界面

相关推荐
roman_日积跬步-终至千里6 分钟前
【模式识别与机器学习(16)】聚类分析【1】:基础概念与常见方法
人工智能·机器学习
nvd1125 分钟前
一个简单的GitHub AI Agent 实现指南
人工智能·langchain
阿里云大数据AI技术36 分钟前
【新模型速递】PAI-Model Gallery云上一键部署DeepSeek-V3.2模型
人工智能
阿恩.77043 分钟前
2026年1月最新计算机、人工智能、经济管理国际会议:选对会议 = 论文成功率翻倍
人工智能·经验分享·笔记·计算机网络·金融·区块链
高-老师1 小时前
WRF模式与Python融合技术在多领域中的应用及精美绘图
人工智能·python·wrf模式
xinyu_Jina1 小时前
ikTok Watermark Remover:客户端指纹、行为建模与自动化逆向工程
前端·人工智能·程序人生·信息可视化
通义灵码1 小时前
Qoder 全形态产品家族正式发布,并开源 Agentic Coding 产品耐用度评测集
人工智能·开源·ai编程
大白的编程笔记1 小时前
推理(Inference)系统解释
人工智能
LeeZhao@1 小时前
【狂飙全模态】狂飙AGI-智能答疑助手
数据库·人工智能·redis·语言模型·aigc·agi
AI浩1 小时前
DeepSeek-V3.2:推动开源大型语言模型的前沿发展
人工智能·语言模型·自然语言处理