联想Y7000+RTX4060+i7+Ubuntu22.04运行DeepSeek开源多模态大模型Janus-Pro-1B+本地部署

直接上手搓了:

bash 复制代码
conda create -n myenv python=3.10 -y

git clone https://github.com/deepseek-ai/Janus.git

cd Janus

pip install -e .

pip install webencodings beautifulsoup4 tinycss2

pip install -e .[gradio]

pip install 'pexpect>4.3'

python demo/app_januspro.py

由于RTX4060只有8G显存,只能运行1B的模型,下面是下载模型的代码:

python 复制代码
from modelscope import snapshot_download, AutoTokenizer
from transformers import TrainingArguments, Trainer, DataCollatorForSeq2Seq, Qwen2VLForConditionalGeneration, AutoProcessor
import torch

# 在modelscope上下载Qwen2-VL模型到本地目录下
model_dir = snapshot_download("deepseek-ai/Janus-Pro-1B", cache_dir="./", revision="master")

# 使用Transformers加载模型权重
tokenizer = AutoTokenizer.from_pretrained("./deepseek-ai/Janus-Pro-1B/", use_fast=False, trust_remote_code=True)
# 特别的,Qwen2-VL-2B-Instruct模型需要使用Qwen2VLForConditionalGeneration来加载
model = Qwen2VLForConditionalGeneration.from_pretrained("./deepseek-ai/Janus-Pro-1B/", device_map="auto", torch_dtype=torch.bfloat16, trust_remote_code=True,)
model.enable_input_require_grads()  # 开启梯度检查点时,要执行该方法

修改demo/app_januspro.py中model的名称为1B。运行后用浏览器打开http://127.0.0.1:7860即可。

使用效果图:

相关推荐
qq_273900231 分钟前
Pytorch torch.nn.utils.rnn.pad_sequence 介绍
人工智能·pytorch·python·rnn·深度学习
大模型真好玩9 分钟前
点名DeepSeek?一文解析”最强大模型“Llama-4到底是王者归来 还是 困兽犹斗?
人工智能·llama·deepseek
jimin_callon3 小时前
VBA第三十九期 VBA自动把工作表转换成PPT
python·excel·vba·wps·deepseek
橙色小博4 小时前
残差神经网络(ResNet)概念解析与用法实例:简洁的图像处理任务
人工智能·python·深度学习·神经网络·cnn·resnet
阿里云大数据AI技术4 小时前
【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
人工智能·深度学习
Blossom.1184 小时前
物联网安全技术:守护智能世界的防线
人工智能·深度学习·物联网·安全·机器学习·自动化·去中心化
木盏5 小时前
Linux终止进程(kill process)的一些玩法
linux·运维·深度学习
HNU混子5 小时前
手搓多模态-05 transformer编码层
人工智能·深度学习·transformer·编码器·激活函数·多模态大模型
9命怪猫6 小时前
AI大模型底层技术——结合 Prompt Engineering 的 LoRA
人工智能·深度学习·ai·大模型
Pitayafruit7 小时前
🔍抖音首次公开推荐算法原理:大白话讲讲它是如何让你刷到停不下来
人工智能·深度学习·算法