部署Qwen2.5-VL-7B-Instruct-GPTQ-Int3

模型下载

python 复制代码
from modelscope import snapshot_download
model_dir = snapshot_download('ChineseAlpacaGroup/Qwen2.5-VL-7B-Instruct-GPTQ-Int3')

相关包导入

python 复制代码
import os
import numpy as np
import pandas as pd
from tqdm import tqdm
from datetime import datetime,timedelta
from functools import wraps
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation.utils import GenerationConfig

模型配置

python 复制代码
model_path = "/modelscope/hub/models/ChineseAlpacaGroup/Qwen2.5-VL-7B-Instruct-GPTQ-Int3"
tokenizer = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_dir, device_map="cuda", trust_remote_code=True,use_safetensors=True).eval()

模型调用

python 复制代码
query = tokenizer.from_list_format([
    {'image': 'https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen-VL/assets/demo.jpeg'},
    {'text': '这是什么'},
])
response, history = model.chat(tokenizer, query=query, history=None)
print(response)
相关推荐
哈__3 分钟前
实测VLM:昇腾平台上的视觉语言模型测评与优化实践
人工智能·语言模型·自然语言处理·gitcode·sglang
海森大数据9 分钟前
数据筛选新范式:以质胜量,揭开大模型后训练黑箱
人工智能·语言模型
PNP Robotics10 分钟前
PNP机器人受邀参加英业达具身智能活动
大数据·人工智能·python·学习·机器人
智算菩萨17 分钟前
【Python进阶】搭建AI工程:Python模块、包与版本控制
开发语言·人工智能·python
大模型真好玩24 分钟前
LangGraph智能体开发设计模式(一)——提示链模式、路由模式、并行化模式
人工智能·langchain·agent
大学生毕业题目26 分钟前
毕业项目推荐:90-基于yolov8/yolov5/yolo11的工程车辆检测识别系统(Python+卷积神经网络)
人工智能·python·yolo·目标检测·cnn·pyqt·工程车辆检测
是店小二呀27 分钟前
解构 Qwen2 在昇腾 Atlas 800T 上的极限性能:基于 SGLang 的深度评测
人工智能·npu
LaughingZhu41 分钟前
Product Hunt 每日热榜 | 2025-12-26
人工智能·经验分享·深度学习·神经网络·产品运营
小徐Chao努力42 分钟前
【Langchain4j-Java AI开发】08-向量嵌入与向量数据库
java·数据库·人工智能
Coder_Boy_43 分钟前
基于SpringAI的智能平台基座开发-(三)
人工智能·springboot·aiops·langchain4j