【北邮鲁鹏老师计算机视觉课程笔记】10 Classification 分类

【北邮鲁鹏老师计算机视觉课程笔记】10 Classification 分类

1 图像识别的基本范式

检测问题:不仅要知道有没有,还要知道在哪里

分类是整图级标签,检测是区域级标签,分割是像素级标签

2 检测任务的应用

3 单实例识别与类别识别


单实例:独立无二的

4 行为和事件识别


5 影响应用任务的因素

要识别10000-30000类物体

视角的变化

光照的变化

尺度的变化

形变
遮挡

背景杂波

6 图像识别系统

7 表达

通过区域表达整个图像


8 生成式和判别式模型

直观上的差别:生成式是自己能生成数据,判别式是知道各个分类的差异

生成式模型:需要先验和似然



9 学习

找一个目标函数

10 识别


11 如何把图像表示成向量:词袋模型



用一个图片的拼图表示

起源于纹理识别任务

直方图与袋子是一一对应的


怎么把图像变成区块

用词典的频率表示


提取特征后归一化为向量

构建视觉词典







空间金字塔

相关推荐
小小杨树3 天前
读懂色彩:拍照调色不再难
算法·计算机视觉·配色
H__Rick4 天前
自动对焦学习-3
人工智能·学习·计算机视觉
计算机科研狗@OUC5 天前
(cvpr26) AIMDepth: Asymmetric Image-Event Mamba for Monocular Depth Estimation
人工智能·深度学习·计算机视觉
闪闪发亮的小星星5 天前
高斯光以及高斯光公式解释
笔记
qq_366566505 天前
2026最新:5款AI视频口型同步工具实测横评,视频翻译后嘴型对不上的终极解决方案
人工智能·计算机视觉·新媒体运营
梦想三三5 天前
OpenCV银行卡数字识别项目(图像预处理与字符分割)
人工智能·opencv·计算机视觉
cqbzcsq5 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
阿米亚波5 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
自传.5 天前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding