transformer目标检测 DETR

(在某些位置上查询有无物体以及类别)

四部分组成:

  • 骨干是CNN,输出的特征拉成一维;
  • transformer的encoder;
  • ransformer的decoder,Object Query,向量形式的anchor;
  • FFN,就是由两个全连接层+ReLu激活函数组成。

亮点:位置编码,encoder中加了,decoder中也加了;没用NMS,用的匈牙利匹配;两个注意力自注意力+交叉注意,交叉注意在decoder,object queries做的是qurey;object queries是固定100个;

论文:https://arxiv.org/abs/2005.12872

代码:GitHub - facebookresearch/detr: End-to-End Object Detection with Transformers

翻译论文博客:https://zhuanlan.zhihu.com/p/701507885
https://zhuanlan.zhihu.com/p/366938351

相关推荐
数据猎手小k2 小时前
Vision Based Navigation :针对航天领域的基于视觉导航机器学习应用生成训练数据集
人工智能·机器学习
AI原吾2 小时前
探索Mem0:AI的智能记忆层
人工智能·python·ai·mem0
sp_fyf_20244 小时前
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-15
论文阅读·人工智能·算法·搜索引擎·语言模型·自然语言处理
草莓奶忻4 小时前
ububtu20.04下opencv3.4.10+opencv_contrib3.4.10编译安装及问题解决
人工智能·opencv·webpack
非常规定义M5 小时前
Day30_0.1基础学习MATLAB学习小技巧总结(30)——优化工具箱及
开发语言·人工智能·学习·算法·数学建模·matlab
柠檬少少开发5 小时前
碎纸片的自动拼接复原技术
人工智能·算法·计算机视觉
说私域6 小时前
AI 智能名片链动 2+1 模式商城小程序中的体验策略
人工智能·小程序
Jurio.7 小时前
【JPCS出版】第二届应用统计、建模与先进算法国际学术会议(ASMA2024,9月27日-29)
大数据·人工智能·深度学习·算法·机器学习·数学建模
sp_fyf_20247 小时前
[杂谈-黑神话:悟空] 中国3A游戏的崛起之路:挑战与机遇并存
人工智能·游戏·语言模型