Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑

视频讲解:Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑_哔哩哔哩_bilibili

Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑

今天复现下Qwen2.5-VL玩玩

https://github.com/QwenLM/Qwen2.5-VL

创建conda环境,实测22.04,python3.10没什么依赖或者冲突的问题出现

复制代码
conda create -n qwen2.5-vl
 conda activate qwen2.5-vl

下载源码,安装相关依赖

复制代码
git clone https://github.com/QwenLM/Qwen2.5-VL 
cd Qwen2.5-VL 
pip install -r requirements_web_demo.txt

运行demo,有四个版本3B,7B,32B,72B,3B的比较小,但比较傻,下载比较快

复制代码
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-3B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-7B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-32B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-72B-Instruct"

第一次加载会先下载model,大概7个多G

实际运行起来,通过gradio起了一个Web

实际的界面

相关推荐
武子康2 小时前
调查研究-186 LangChain 和 LangGraph 的区别:从快速构建 Agent 到生产级工作流编排
人工智能·langchain·llm
武子康2 小时前
调查研究-185 CodeGraph 调研:给 AI 编程 Agent 一张代码库地图,少一点反复 grep(2026)
人工智能·openai·claude
aqi003 小时前
15天学会AI应用开发(八)使用向量数据库实现RAG功能
人工智能·python·大模型·ai编程·ai应用
混沌福王5 小时前
Electron三端统一架构:运行时Adapter、IPC能力边界与分层设计
人工智能·agent·ai编程
说了很好5 小时前
马尔可夫扩散链+损失函数推导,手把手实现原生Diffusion
人工智能
聂二AI落地内参5 小时前
合同抽取别停在 JSON:标准规则和交易日历才是硬仗
人工智能
冬哥聊AI5 小时前
滴滴Agent岗二面:RAG 系统的 LLM 幻觉怎么治?从两类根源讲到四道防线
人工智能
lyshlc5 小时前
# AI Agent的推迟判定协议:不确定性下的最优策略
人工智能
用户329901675055 小时前
用zod在运行时兜住AI返回的JSON
人工智能