(论文阅读15/100)You Only Look Once: Unified, Real-Time Object Detection

|----|------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 文献阅读笔记 |||
| 简介 | 题目 | You Only Look Once: Unified, Real-Time Object Detection |
| 简介 | 作者 | Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi |
| 简介 | 原文链接 | https://arxiv.org/pdf/1506.02640.pdf 《You Only Look Once: Unified, Real-Time Object Detection》-CSDN博客 |
| 简介 | 关键词 | Null |
| 简介 | 研究问题 | 目标检测框架问题。 |
| 简介 | 研究方法 | 将detection视为回归问题,仅使用一个neural network同时预测bounding box的位置和类别,因此速度很快。 由于不需提取region proposal,而是直接在整幅图像进行检测,因此YOLOv1可以联系上下文信息和特征,减少将背景检测为物体的错误。 YOLOv1学习到的是目标的泛化表示(generalizable representations),泛化能力非常强,更容易应用于新的领域或输入。 由于不需提取region proposal,则YOLOv1的检测流程很简单: Resize image:将输入图片resize到448x448。 Run ConvNet:使用CNN提取特征,FC层输出分类和回归结果。 Non-max Suppression:非极大值抑制筛选出最终的结果。 |
| 简介 | 研究结论 | 背景上预测假阳性的可能性比较低。 |
| 简介 | 创新不足 | 损失函数设计存在缺陷,会产生更多地定位错误。 对重叠、邻近的物体检测不友好。 测试数据中出现了训练数据中没有的长宽比时,泛化能力低。 |
| 简介 | 额外知识 | DPM(Deformable PartsModel)算法:基于部件的检测方法,对目标的形变具有很强的鲁棒性。 DPM(Deformable Parts Model)--原理(一)_deformable parts models.-CSDN博客 |

相关推荐
yiyu07162 小时前
3分钟搞懂深度学习AI:实操篇:卷积层
人工智能·深度学习
字节架构前端3 小时前
Skill再回首—深度解读Anthropic官方最新Skill白皮书
人工智能·agent·ai编程
冬奇Lab4 小时前
OpenClaw 深度解析(八):Skill 系统——让 LLM 按需学习工作流
人工智能·开源·源码阅读
冬奇Lab4 小时前
一天一个开源项目(第45篇):OpenAI Agents SDK Python - 轻量级多 Agent 工作流框架,支持 100+ LLM 与实时语音
人工智能·开源·openai
小兵张健4 小时前
两个配置让 Codex 效率翻倍
人工智能·程序员·github copilot
kymjs张涛6 小时前
OpenClaw 学习小组:初识
android·linux·人工智能
yangpow26 小时前
拆解 OpenClaw 的 Skills 机制:一个为 AI Agent 设计的"包管理器"
人工智能
warm3snow6 小时前
AI 重塑产品管理工具:从 Jira 到智能体项目经理的终极演进
人工智能·ai·excel·项目管理·飞书·产品经理·jira·协同·tapd
吴佳浩6 小时前
OpenClaw macOS 完整安装与本地模型配置教程(实战版)
人工智能·macos·agent