Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑

视频讲解:Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑_哔哩哔哩_bilibili

Qwen2.5-VL视觉大语言模型复现过程,没碰到什么坑

今天复现下Qwen2.5-VL玩玩

https://github.com/QwenLM/Qwen2.5-VL

创建conda环境,实测22.04,python3.10没什么依赖或者冲突的问题出现

复制代码
conda create -n qwen2.5-vl
 conda activate qwen2.5-vl

下载源码,安装相关依赖

复制代码
git clone https://github.com/QwenLM/Qwen2.5-VL 
cd Qwen2.5-VL 
pip install -r requirements_web_demo.txt

运行demo,有四个版本3B,7B,32B,72B,3B的比较小,但比较傻,下载比较快

复制代码
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-3B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-7B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-32B-Instruct" 
python3 web_demo_mm.py --checkpoint-path "Qwen/Qwen2.5-VL-72B-Instruct"

第一次加载会先下载model,大概7个多G

实际运行起来,通过gradio起了一个Web

实际的界面

相关推荐
China_Yanhy9 小时前
动手学大模型第一篇学习总结
人工智能
空间机器人9 小时前
自动驾驶 ADAS 器件选型:算力只是门票,系统才是生死线
人工智能·机器学习·自动驾驶
C+++Python9 小时前
提示词、Agent、MCP、Skill 到底是什么?
人工智能
小松要进步9 小时前
机器学习1
人工智能·机器学习
泰恒9 小时前
openclaw近期怎么样了?
人工智能·深度学习·机器学习
KaneLogger9 小时前
从传统笔记到 LLM 驱动的结构化 Wiki
人工智能·程序员·架构
tinygone10 小时前
OpenClaw之Memory配置成本地模式,Ubuntu+CUDA+cuDNN+llama.cpp
人工智能·ubuntu·llama
建行一世10 小时前
【Windows笔记本大模型“傻瓜式”教程】使用LLaMA-Factory工具来完成对Windows笔记本大模型Qwen2.5-3B-Instruct微调
windows·ai·语言模型·llama
正在走向自律10 小时前
第二章-AIGC入门-AIGC工具全解析:技术控的效率神器,DeepSeek国产大模型的骄傲(8/36)
人工智能·chatgpt·aigc·可灵·deepseek·即梦·阿里通义千问
轩轩分享AI10 小时前
DeepSeek、Kimi、笔灵谁最好用?5款网文作者亲测的AI写作神器横评
人工智能·ai·ai写作·小说写作·小说·小说干货