【北邮鲁鹏老师计算机视觉课程笔记】01 introduction

量子-Alex2024-02-11 13:09

1 生活中的计算机视觉

生活中的各种计算机视觉识别系统已经广泛地应用起来了。

2 计算机视觉与其他学科的关系

认知科学和神经科学是研究人类视觉系统的，如果能把人类视觉系统学习得更好，可以迁移到计算机视觉。是计算机视觉的理论基础。

算法、系统、框架、机器学习等是计算机视觉的工具。

光学设备采集图像给计算机视觉提供输入

图像处理强调的是：我输入的是图像，输出的也是图像，比如增强亮度、去噪

计算机视觉系统：输入的图像，输出的不只是图像。

应用：①图像检索。文字搜图，计算机视觉识别后给图像打了标签。在互联网上占领大的流量的还是图像和视频。②机器人。

3 计算机视觉的介绍

首先谈谈智能的概念，1997年的人工智能系统"深蓝"，战胜了国际象棋的世界冠军。2015年和2017年AlphaGo战胜了李世石和柯洁。

但是这是不是真的智能，现在的人工智能系统能下棋，但是它不能创作诗歌超过人类最优秀的诗人。从这个角度看，这并不是真的智能，它有一个很好的搜索算法，去搜索出最优解。因此，现在只能在数理和数学计算上部分实现人类的智能。

4 三维重构

计算机视觉系统还不够完善。

5 什么是视觉系统

感知 + 解释

人类的视觉系统

机器视觉系统

机器看到的是什么？是一个灰度图，是一个二维矩阵300 * 400

语义鸿沟：从像素到语义内容。存在的极大的差距

我们首先会从人类的视觉系统中去借鉴

6 人类的视觉系统是什么样的

诺贝尔奖成果：让猫去看图片。确定视觉和大脑皮层的关系。

给猫看了大量的图片，但是猫的大脑皮层没有反应。

给猫看简单的图形，某些神经元会有反应。通过后续实验，发现大脑对视觉信息的处理事分层的。

人类的视觉系统非常优秀。

任务：人类能以多快的速度和多高的精度去区分动物和非动物

过了150ms，区分动物和非动物的脑电波信号就不一样了。

7 运动视盲

8 利用上下文去理解语义

上下文背景引导了我们理解图像的过程。

实际上A、B的颜色是一样的。人类的视觉系统会对B进行自动增强。

9 计算机视觉的起源

MIT的研究生暑期项目

1966年，计算机视觉从图像处理中独立出来

先驱人物：马尔

计算机视觉的框架：①计算理论：任务是什么？②表达和算法：输入和输出是什么？③硬件实现：

10 我们能从图像中获取什么信息

3D信息更多地是用于定位

①SLAM

②三维重建

③漫游：一天建成罗马

从这个角度，计算机视觉分为两个大方向：从图像中恢复3D结构信息、从图像中恢复语义信息

11 计算机视觉的发展历程

12 为什么要做计算机视觉

三维重建

人脸识别：计算机识别的第一个真正的应用

虹膜识别

检测与跟踪：

VR：虚拟现实

13 课程资源

14 路线图

上一篇：JS中ES5和ES6的区别

下一篇：lua：有关表访问的metamethod

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04OpenClaw + 飞书（Feishu）环境搭建指南 05Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 06Window 10部署openclaw报错node.exe : npm error code 128 07Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 08AI 规范驱动开发“三剑客”深度对比：Spec-Kit、Kiro 与 OpenSpec 实战指南 09OpenClaw优化飞书API 额度已耗尽问题 10AI Agent 平台横评：ZeroClaw vs OpenClaw vs Nanobot