基础学习(15): dinov3自监督·vit·dinov3·gram ancher·rope-box
【HaMeR】全Transformer架构的单目3D手部网格重建:ViT-H骨干+跨注意力MANO解码器源码深度解析深度学习·3d·transformer·vit·手部重建·mano
多模态大模型技术深度解析:从 CLIP 到 LLaVA 的视觉语言融合原理ai·transformer·多模态·clip·视觉语言模型·vit·llava
LLM--VIT简介大模型·llm·nlp·多模态·多模态大模型·vit·ai算法
AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE 论文精读计算机视觉·transformer·图像识别·vit·特征提取·图像特征提取
(论文速读)PatchTST:通道无关补丁时间序列变压器人工智能·深度学习·神经网络·计算机视觉·注意力机制·vit·时序模型
ViT-5: Vision Transformers for The Mid-2020s—— 面向2020年代中期的视觉Transformer人工智能·深度学习·ai·transformer·vit·vit-5·面向2020年代中期的视觉
视觉Transformer实战 | Data-efficient image Transformer(DeiT)详解与实现深度学习·计算机视觉·transformer·vit