(论文阅读15/100)You Only Look Once: Unified, Real-Time Object Detection

|----|------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 文献阅读笔记 |||
| 简介 | 题目 | You Only Look Once: Unified, Real-Time Object Detection |
| 简介 | 作者 | Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi |
| 简介 | 原文链接 | https://arxiv.org/pdf/1506.02640.pdf 《You Only Look Once: Unified, Real-Time Object Detection》-CSDN博客 |
| 简介 | 关键词 | Null |
| 简介 | 研究问题 | 目标检测框架问题。 |
| 简介 | 研究方法 | 将detection视为回归问题,仅使用一个neural network同时预测bounding box的位置和类别,因此速度很快。 由于不需提取region proposal,而是直接在整幅图像进行检测,因此YOLOv1可以联系上下文信息和特征,减少将背景检测为物体的错误。 YOLOv1学习到的是目标的泛化表示(generalizable representations),泛化能力非常强,更容易应用于新的领域或输入。 由于不需提取region proposal,则YOLOv1的检测流程很简单: Resize image:将输入图片resize到448x448。 Run ConvNet:使用CNN提取特征,FC层输出分类和回归结果。 Non-max Suppression:非极大值抑制筛选出最终的结果。 |
| 简介 | 研究结论 | 背景上预测假阳性的可能性比较低。 |
| 简介 | 创新不足 | 损失函数设计存在缺陷,会产生更多地定位错误。 对重叠、邻近的物体检测不友好。 测试数据中出现了训练数据中没有的长宽比时,泛化能力低。 |
| 简介 | 额外知识 | DPM(Deformable PartsModel)算法:基于部件的检测方法,对目标的形变具有很强的鲁棒性。 DPM(Deformable Parts Model)--原理(一)_deformable parts models.-CSDN博客 |

相关推荐
小陈phd32 分钟前
OpenCV从入门到精通实战(九)——基于dlib的疲劳监测 ear计算
人工智能·opencv·计算机视觉
Guofu_Liao2 小时前
大语言模型---LoRA简介;LoRA的优势;LoRA训练步骤;总结
人工智能·语言模型·自然语言处理·矩阵·llama
ZHOU_WUYI5 小时前
3.langchain中的prompt模板 (few shot examples in chat models)
人工智能·langchain·prompt
如若1235 小时前
主要用于图像的颜色提取、替换以及区域修改
人工智能·opencv·计算机视觉
老艾的AI世界6 小时前
AI翻唱神器,一键用你喜欢的歌手翻唱他人的曲目(附下载链接)
人工智能·深度学习·神经网络·机器学习·ai·ai翻唱·ai唱歌·ai歌曲
DK221516 小时前
机器学习系列----关联分析
人工智能·机器学习
Robot2516 小时前
Figure 02迎重大升级!!人形机器人独角兽[Figure AI]商业化加速
人工智能·机器人·微信公众平台
浊酒南街7 小时前
Statsmodels之OLS回归
人工智能·数据挖掘·回归
畅联云平台7 小时前
美畅物联丨智能分析,安全管控:视频汇聚平台助力智慧工地建设
人工智能·物联网
加密新世界8 小时前
优化 Solana 程序
人工智能·算法·计算机视觉