研一小白读论文记录,计算机视觉,Transformer

论文是IEEE收录的一篇论文《CrossFormer++: A Versatile Vision Transformer Hinging on Cross-Scale Attention》(《基于跨尺度自注意力机制的多功能视觉Transformer》)

泛读完之后最大的感悟有以下几点:

1、文章在实验的结果中呈现了大量的图片和表格,并且对于自己的数据使用了高亮显示,且在括号里还标注了与最好的模型相比,精度提升的具体数值,从而读来一目了然

2、文章使用了大量的不同模型做比对,目前已知的Transformer模型进行了对比试验,对于首先提出的CrossFormer和后来改进的CrossFormer++,作者对比了现存的模型以及文章中提出的两种模型结构,消融实验也是很丰富------是否存在CEL、PGS、ACL等对准确性的影响等等。

(看来优秀论文还是得用数据说话,还得是多种模型对比下来的大量数据结果呀)

附上简单制作的思维导图,希望各路大神能够指点一二,不胜感激!

相关推荐
aneasystone本尊2 分钟前
学习 Chat2Graph 的任务分解与执行
人工智能
嘀咕博客4 分钟前
10Web-AI网站生成器
人工智能·ai工具
西柚小萌新9 分钟前
【从零开始的大模型原理与实践教程】--第一章:NLP基础概念
人工智能·自然语言处理
嘀咕博客15 分钟前
SafeEar:浙大和清华联合推出的AI音频伪造检测框架,错误率低至2.02%
人工智能·音视频·ai工具
深度学习lover15 分钟前
<数据集>yolo梨幼果识别数据集<目标检测>
python·yolo·目标检测·计算机视觉·数据集
Hello123网站15 分钟前
FinChat-金融领域的ChatGPT
人工智能·chatgpt·金融·ai工具
嘀咕博客21 分钟前
PixVerse -免费在线AI视频生成工具
人工智能·音视频·ai工具
CoovallyAIHub22 分钟前
CostFilter-AD:用“匹配代价过滤”刷新工业质检异常检测新高度! (附论文和源码)
深度学习·算法·计算机视觉
CoovallyAIHub30 分钟前
CVPR 2025 | 频率动态卷积(FDConv):以固定参数预算实现频率域自适应,显著提升视觉任务性能
深度学习·算法·计算机视觉
mit6.82434 分钟前
[rStar] 解决方案节点 | `BaseNode` | `MCTSNode`
人工智能·python·算法