研一小白读论文记录,计算机视觉,Transformer

论文是IEEE收录的一篇论文《CrossFormer++: A Versatile Vision Transformer Hinging on Cross-Scale Attention》(《基于跨尺度自注意力机制的多功能视觉Transformer》)

泛读完之后最大的感悟有以下几点:

1、文章在实验的结果中呈现了大量的图片和表格,并且对于自己的数据使用了高亮显示,且在括号里还标注了与最好的模型相比,精度提升的具体数值,从而读来一目了然

2、文章使用了大量的不同模型做比对,目前已知的Transformer模型进行了对比试验,对于首先提出的CrossFormer和后来改进的CrossFormer++,作者对比了现存的模型以及文章中提出的两种模型结构,消融实验也是很丰富------是否存在CEL、PGS、ACL等对准确性的影响等等。

(看来优秀论文还是得用数据说话,还得是多种模型对比下来的大量数据结果呀)

附上简单制作的思维导图,希望各路大神能够指点一二,不胜感激!

相关推荐
oioihoii15 分钟前
AI随身翻译设备:从翻译工具到智能生活伴侣
人工智能·生活
努力当一个优秀的程序员18 分钟前
0.机器学习基础
人工智能·机器学习
bjxiaxueliang1 小时前
一文详解OpenCV环境搭建:Ubuntu20.4使用CLion配置OpenCV开发环境
人工智能·opencv·计算机视觉
Allen_LVyingbo2 小时前
思维链编程模式下可视化医疗编程具体模块和流程架构分析(全架构与代码版)
大数据·人工智能·重构·架构·健康医疗
有一只柴犬2 小时前
5. 深度剖析:Spring AI项目架构与分层体系全解读
人工智能·spring·架构
乌旭2 小时前
英伟达Blackwell架构深度拆解:新一代GPU如何突破算力瓶颈?
数据结构·人工智能·深度学习·机器学习·ai·架构·ai编程
说私域2 小时前
定制开发开源AI智能名片S2B2C商城小程序源码中的产品运营协同进化机制研究
人工智能·小程序·开源·产品运营·零售
断眉的派大星2 小时前
用opencv校正图片的方向
人工智能·opencv·计算机视觉
西柚小萌新2 小时前
【深度学习:理论篇】--Pytorch基础入门
人工智能·pytorch·深度学习
Jamence3 小时前
多模态大语言模型arxiv论文略读(七)
人工智能·深度学习·语言模型