【北邮鲁鹏老师计算机视觉课程笔记】01 introduction

1 生活中的计算机视觉

生活中的各种计算机视觉识别系统已经广泛地应用起来了。

2 计算机视觉与其他学科的关系

认知科学和神经科学是研究人类视觉系统的,如果能把人类视觉系统学习得更好,可以迁移到计算机视觉。是计算机视觉的理论基础。

算法、系统、框架、机器学习等是计算机视觉的工具。

光学设备采集图像给计算机视觉提供输入

图像处理强调的是:我输入的是图像,输出的也是图像,比如增强亮度、去噪

计算机视觉系统:输入的图像,输出的不只是图像。

应用:①图像检索。文字搜图,计算机视觉识别后给图像打了标签。在互联网上占领大的流量的还是图像和视频。②机器人。

3 计算机视觉的介绍

首先谈谈智能的概念,1997年的人工智能系统"深蓝",战胜了国际象棋的世界冠军。2015年和2017年AlphaGo战胜了李世石和柯洁。

但是这是不是真的智能,现在的人工智能系统能下棋,但是它不能创作诗歌超过人类最优秀的诗人。从这个角度看,这并不是真的智能,它有一个很好的搜索算法,去搜索出最优解。因此,现在只能在数理和数学计算上部分实现人类的智能。

4 三维重构

计算机视觉系统还不够完善。

5 什么是视觉系统

感知 + 解释

人类的视觉系统

机器视觉系统

机器看到的是什么?是一个灰度图,是一个二维矩阵300 * 400

语义鸿沟:从像素到语义内容。存在的极大的差距

我们首先会从人类的视觉系统中去借鉴

6 人类的视觉系统是什么样的

诺贝尔奖成果:让猫去看图片。确定视觉和大脑皮层的关系。

给猫看了大量的图片,但是猫的大脑皮层没有反应。

给猫看简单的图形,某些神经元会有反应。通过后续实验,发现大脑对视觉信息的处理事分层的。

人类的视觉系统非常优秀。

任务:人类能以多快的速度和多高的精度去区分动物和非动物

过了150ms,区分动物和非动物的脑电波信号就不一样了。

7 运动视盲

8 利用上下文去理解语义


上下文背景引导了我们理解图像的过程。


实际上A、B的颜色是一样的。人类的视觉系统会对B进行自动增强。

9 计算机视觉的起源

MIT的研究生暑期项目

1966年,计算机视觉从图像处理中独立出来

先驱人物:马尔

计算机视觉的框架:①计算理论:任务是什么?②表达和算法:输入和输出是什么?③硬件实现:

10 我们能从图像中获取什么信息


3D信息更多地是用于定位

①SLAM

②三维重建

③漫游:一天建成罗马

从这个角度,计算机视觉分为两个大方向:从图像中恢复3D结构信息、从图像中恢复语义信息

11 计算机视觉的发展历程

12 为什么要做计算机视觉

三维重建



人脸识别:计算机识别的第一个真正的应用

虹膜识别




检测与跟踪:

VR:虚拟现实

13 课程资源

14 路线图

相关推荐
正脉科工 CAE仿真3 分钟前
基于ANSYS 概率设计和APDL编程的结构可靠性设计分析
人工智能·python·算法
EasyGBS8 分钟前
视频设备轨迹回放平台EasyCVR打造视频智能融合新平台,驱动智慧机场迈向数字新时代
网络·人工智能·安全·音视频
Chaos_Wang_14 分钟前
NLP高频面试题(三十三)——Vision Transformer(ViT)模型架构介绍
人工智能·自然语言处理·transformer
新知图书27 分钟前
OpenCV单窗口显示多图片
人工智能·opencv·计算机视觉
荷包蛋蛋怪28 分钟前
【北京化工大学】 神经网络与深度学习 实验6 MATAR图像分类
人工智能·深度学习·神经网络·opencv·机器学习·计算机视觉·分类
小马哥编程30 分钟前
【软测】AI助力测试用例
人工智能·测试用例
与火星的孩子对话41 分钟前
Unity3D开发AI桌面精灵/宠物系列 【三】 语音识别 ASR 技术、语音转文本多平台 - 支持科大讯飞、百度等 C# 开发
人工智能·unity·c#·游戏引擎·语音识别·宠物
事变天下1 小时前
今是科技发布全新测序仪G-seq1M:以效率与精准引领基因测序新标杆
人工智能·科技
贤小二AI1 小时前
贤小二c#版Yolov5 yolov8 yolov10 yolov11自动标注工具 + 免python环境 GPU一键训练包
人工智能·深度学习·yolo
nuo5342021 小时前
黑马 C++ 学习笔记
c语言·c++·笔记·学习