数据科学每日总结--Day43--计算机视觉

简介

计算机视觉是人工智能（AI）的一个领域，使计算机能够基于视觉输入（如图像、视频和实时相机馈送。它模仿了人类看待和理解世界的方式，但有能力更快、更准确地处理大量数据，比较常见的是面部识别，对象检测和图像分类。

演变史

在初期，人们通过把图像分成一个个圆来框选不同的部分，后来，随着光流的诞生（通过像素来判断），逐渐可以捕捉到更具体的事物。接着，边缘算法的诞生，使人们在很长一段时间内，把图像变化明显的部分称作边缘，以此分割图像。紧接着是划时代的创新，机器学习和深度学习的产物：神经网络，展示了强大的图像分类能力；最后是最近几年的人工智能结合计算机视觉。

从一开始的简陋的几何形状，到后来甚至能够自主根据图像回答问题，代表了视觉研究的角度的变化，从探究形状到深层的像素。

目的

一开始，计算机视觉只是用来识别简单的东西，比如人的字迹，修复修复不清楚的数字，到后来，便利性提高到了为人类服务，比如人脸识别，瞳孔追踪，这让不用密码却能登录成了可能；以及娱乐app里的3D特效，AI生成脸，智能驾驶和登上火星的检测仪，能够获取并识别高质量的图像。

这其中所反映的就是从观察像素，到从图像上提取特征，虽然都是用来区分图像，但是后者是前者加工后的数字化信息。

常用的技术有

边缘检测：通过识别图像中对象边界的技术强度或颜色发生显著变化的检测点，将图像转换为区域或对象
目标检测：识别和定位图像中对象，通常用于面部识别系统、检测行人的自动车辆等
图像分类：根据图像的内容将标签或类别分配给图像的过程，广泛用于医学判断（比如识别，标记肿瘤）
面部识别：基于面部特征识别或验证个人身份的技术，广泛用于访问控制安全系统、社交媒体平台
卷积神经网络：通过自适应地学习空间层次的特征，达到自动分类图像的效果，一般用于图像识别，自动驾驶