技术栈

qwen2 vl

Aspect of twilight
5 小时前
qwen·qwen2 vl
Qwen1/2/2.5/3 VL的图像处理与位置编码方式讲解Qwen2 VL中在patch size的基础上还会通过MLP 做一个2*2的merge,进一步减小viusal token输,并加上start 和 end token。
我是有底线的