【rk3588】——在rk3588上,用python进行qwen3-vl模型推理

项目:https://github.com/chenjun2hao/qwen3_vl.rk3588

rk3588 部署 qwen3-vl

说明:用python flask 部署 qwen3-vl 模型到 rk3588 上,提供 http 服务接口。方便用python进行一些前处理,进行服务验证/模型精度验证等。

1. 环境准备

bash 复制代码
# 1. 安装rk npulite
从这里下载[rk_npulite whl](https://github.com/airockchip/rknn-toolkit2/tree/master/rknn-toolkit-lite2/packages)

pip install ./rknn_toolkit_lite2-2.3.2-cp310-cp310-manylinux_2_17_aarch64.manylinux2014_aarch64.whl

2. 起服务

bash 复制代码
# 1. 从rk官方下载 qwen3-vl rknn 模型
[qwen3-vl rknn 模型](https://meta.box.lenovo.com/v/link/view/ad7482f6712844b48902f07287ed3359)

# 2. 起服务
python3 flask_server_vlm.py --target_platform rk3588 --rkllm_model_path vl_models/qwen3-vl-2b-instruct_w8a8_rk3588.rkllm --vision_encoder_model_path vl_models/qwen3-vl-2b_vision_rk3588.rknn

3. 测试服务

bash 复制代码
# 1. 测试服务
python3 req.py
相关推荐
敏编程9 小时前
一天一个Python库:jsonschema - JSON 数据验证利器
python
前端付豪9 小时前
LangChain记忆:通过Memory记住上次的对话细节
人工智能·python·langchain
databook10 小时前
ManimCE v0.20.1 发布:LaTeX 渲染修复与动画稳定性提升
python·动效
花酒锄作田1 天前
使用 pkgutil 实现动态插件系统
python
前端付豪1 天前
LangChain链 写一篇完美推文?用SequencialChain链接不同的组件
人工智能·python·langchain
曲幽1 天前
FastAPI实战:打造本地文生图接口,ollama+diffusers让AI绘画更听话
python·fastapi·web·cors·diffusers·lcm·ollama·dreamshaper8·txt2img
老赵全栈实战1 天前
Pydantic配置管理最佳实践(一)
python
阿尔的代码屋1 天前
[大模型实战 07] 基于 LlamaIndex ReAct 框架手搓全自动博客监控 Agent
人工智能·python
AI探索者2 天前
LangGraph StateGraph 实战:状态机聊天机器人构建指南
python
AI探索者2 天前
LangGraph 入门:构建带记忆功能的天气查询 Agent
python