研一小白读论文记录,计算机视觉,Transformer

论文是IEEE收录的一篇论文《CrossFormer++: A Versatile Vision Transformer Hinging on Cross-Scale Attention》(《基于跨尺度自注意力机制的多功能视觉Transformer》)

泛读完之后最大的感悟有以下几点:

1、文章在实验的结果中呈现了大量的图片和表格,并且对于自己的数据使用了高亮显示,且在括号里还标注了与最好的模型相比,精度提升的具体数值,从而读来一目了然

2、文章使用了大量的不同模型做比对,目前已知的Transformer模型进行了对比试验,对于首先提出的CrossFormer和后来改进的CrossFormer++,作者对比了现存的模型以及文章中提出的两种模型结构,消融实验也是很丰富------是否存在CEL、PGS、ACL等对准确性的影响等等。

(看来优秀论文还是得用数据说话,还得是多种模型对比下来的大量数据结果呀)

附上简单制作的思维导图,希望各路大神能够指点一二,不胜感激!

相关推荐
The Open Group20 分钟前
英特尔公司Darren Pulsipher 博士:以架构之力推动政府数字化转型
大数据·人工智能·架构
Ronin-Lotus1 小时前
深度学习篇---卷积核的权重
人工智能·深度学习
.银河系.1 小时前
8.18 机器学习-决策树(1)
人工智能·决策树·机器学习
敬往事一杯酒哈1 小时前
第7节 神经网络
人工智能·深度学习·神经网络
三掌柜6661 小时前
NVIDIA 技术沙龙探秘:聚焦 Physical AI 专场前沿技术
大数据·人工智能
2502_927161281 小时前
DAY 42 Grad-CAM与Hook函数
人工智能
Hello123网站1 小时前
Flowith-节点式GPT-4 驱动的AI生产力工具
人工智能·ai工具
yzx9910132 小时前
Yolov模型的演变
人工智能·算法·yolo
若天明3 小时前
深度学习-计算机视觉-微调 Fine-tune
人工智能·python·深度学习·机器学习·计算机视觉·ai·cnn
爱喝奶茶的企鹅3 小时前
Ethan独立开发新品速递 | 2025-08-19
人工智能