技术栈
qwen-vl
何如千泷
15 天前
qwen
·
qwen-vl
Qwen2.5-VL模型架构解读——模型部分
Qwen2.5-VL模型架构解读——数据处理部分将输入的图像或视频帧(已预切成固定大小的时空 patch)线性投影为统一维度的 token。
R.X. NLOS
7 个月前
论文阅读
·
笔记
·
大模型
·
多模态大模型
·
qwen-vl
论文阅读笔记 | Qwen-VL:一个视觉语言大模型,通晓理解、定位、文本阅读等多种能力
通义千问-VL论文阅读笔记:arXiv 2023.10 | Qwen-VL: A Versatile Vision-Language Model for Understanding, Localization, Text Reading, and Beyond
SpikeKing
1 年前
人工智能
·
语言模型
·
预训练
·
mllm
·
多模态大语言模型
·
qwen-vl
·
laion
LLM - 理解 多模态大语言模型 (MLLM) 的预训练与相关技术 (三)
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/142063880
我是有底线的