|----|------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 文献阅读笔记 |||
| 简介 | 题目 | You Only Look Once: Unified, Real-Time Object Detection |
| 简介 | 作者 | Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi |
| 简介 | 原文链接 | https://arxiv.org/pdf/1506.02640.pdf 《You Only Look Once: Unified, Real-Time Object Detection》-CSDN博客 |
| 简介 | 关键词 | Null |
| 简介 | 研究问题 | 目标检测框架问题。 |
| 简介 | 研究方法 | 将detection视为回归问题,仅使用一个neural network同时预测bounding box的位置和类别,因此速度很快。 由于不需提取region proposal,而是直接在整幅图像进行检测,因此YOLOv1可以联系上下文信息和特征,减少将背景检测为物体的错误。 YOLOv1学习到的是目标的泛化表示(generalizable representations),泛化能力非常强,更容易应用于新的领域或输入。 由于不需提取region proposal,则YOLOv1的检测流程很简单: Resize image:将输入图片resize到448x448。 Run ConvNet:使用CNN提取特征,FC层输出分类和回归结果。 Non-max Suppression:非极大值抑制筛选出最终的结果。 |
| 简介 | 研究结论 | 背景上预测假阳性的可能性比较低。 |
| 简介 | 创新不足 | 损失函数设计存在缺陷,会产生更多地定位错误。 对重叠、邻近的物体检测不友好。 测试数据中出现了训练数据中没有的长宽比时,泛化能力低。 |
| 简介 | 额外知识 | DPM(Deformable PartsModel)算法:基于部件的检测方法,对目标的形变具有很强的鲁棒性。 DPM(Deformable Parts Model)--原理(一)_deformable parts models.-CSDN博客 |
(论文阅读15/100)You Only Look Once: Unified, Real-Time Object Detection
朽月初二2023-11-04 14:44
相关推荐
Jamence24 分钟前
多模态大语言模型arxiv论文略读(113)haf-Lydia29 分钟前
金融科技的数字底座shengjk132 分钟前
多智能体大语言模型系统频频翻车?三大失败根源与解决方案全解析北极的树34 分钟前
谁说AI只会模仿,从Google AlphaEvolve项目看算法的自主创新安思派Anspire38 分钟前
用 LangGraph 构建第一个 AI 智能体完全指南(一)广州正荣39 分钟前
Scrapy-Redis分布式爬虫架构的可扩展性与容错性增强:基于微服务与容器化的解决方案加油搞钱加油搞钱41 分钟前
鹰盾加密器基于AI的视频个性化压缩技术深度解析:从智能分析到无损压缩实践Baihai_IDP44 分钟前
OCR 识别质量如何影响 RAG 系统的性能?有何解决办法?新智元1 小时前
20 人团队提前实现 DeepSeek 构想,AI 算力变天?直击大模型算力成本痛点硬核隔壁老王1 小时前
从零开始搭建RAG系统系列(十):RAG系统性能优化技巧-生成模块优化 (Optimizing Generator)