吴恩达2022机器学习专项课程C2(高级学习算法)W1(神经网络):2.3 案例图像识别

目录

电脑如何表示一张图像

1.像素

像素是图像最小单位,用于表示图像中的点或区域,并具有特定的亮度或颜色值。本案例图像的像素为1000x1000像素。在计算机中,实际上是一个1000x1000的像素亮度(强度)值矩阵。

2.像素亮度值

像素亮度值描述像素的亮度或颜色强度,此案例中。亮度值的范围是0-255。197是图像左上角的亮度值,214是图像右下角的亮度值。

3.展开像素亮度值

将这些像素亮度转换成一个向量,向量包含1000*1000,也就是100万个亮度值。

神经网络构建人脸识别

1.需求

构建一个人脸识别应用程序,能否训练一个神经网络,该网络以包含100万像素亮度值的特征向量为输入,并输出图片中人物的身份。

2.整体过程

将图像X输入到第一个隐藏层,隐藏层提取一些特征。第一个隐藏层的输出到第二个隐藏层,第二个隐藏层的输出到到第三层,最后到输出层,最后估计,例如这可能是某个特定人物的概率。

3.隐藏层识别图像

  • 第一个隐藏层:寻找图像中非常短的线或非常短的边缘,层里的神经元寻找低垂直线或类似的垂直边缘,或寻找一个方向的线或方向的边缘,或寻找具有该方向的线。
  • 第二个隐藏层:检测面部的某个部分存在或不存在,神经元们检测眼睛,检测耳朵,或检测鼻子的某个角落。
  • 第三个隐藏层: 检测更大更粗的面部形状的存在或不存在。
  • 输出层:最后,检测脸部与不同脸部形状的对应程度,创建了一组丰富的特征,然后帮助输出层尝试确定图片中人物的身份

4.小结

本例中,第一层中查找短小的边缘,第二层中查找眼睛和鼻子等面部部位,然后在第三层中查找更完整的面部形状。神经网络能够自己从数据中找出这些特征,而无需明确指引。同时,每一层用的窗口更大,也就是在图像的搜寻范围上更大。

神经网络构建识别汽车

第一个隐藏层层学习图像边缘,第二个隐藏层学习检测汽车的部件,第三个隐藏层学习检测更完整的汽车轮廓。

神经网络在计算机视觉应用中的工作原理

只要输入不同的数据,神经网络就会自动学习检测不同的特征,从而完成汽车检测、人脸识别,或者判定输入是否含有某个特定事物的预测任务。

相关推荐
学术小白人1 分钟前
【落幕新闻】2026年计算智能与机器学习国际学术会议在杭启幕 共探领域前沿发展新路径
人工智能·机器学习·能源·rdlink研发家·智能感知·内燃机
Q741_1473 分钟前
每日一题 力扣 3474. 字典序最小的生成字符串 贪心 字符串 C++ 题解
c++·算法·leetcode·贪心
人道领域5 分钟前
LeetCode【刷题日记】:螺旋矩阵逆向全过程,边界缩进优化
算法·leetcode·矩阵
ALex_zry7 分钟前
物联网数据质量控制系统设计:质控算法与实现
物联网·算法·struts
EQUINOX111 分钟前
货物运输问题,前缀和优化dp,[牛客周赛137 F-小苯的糖果盒]
算法·动态规划
小此方13 分钟前
Re:从零开始的 C++ STL篇(九)AVL树太“较真”,红黑树更“现实”:一文讲透工程中的平衡之道
开发语言·数据结构·c++·算法·stl
地平线开发者13 分钟前
多 Batch 量化校准与单 Batch 校准的数值差异
算法·自动驾驶
AnalogElectronic13 分钟前
uniapp学习7,美团闪购生鲜蔬菜商家详情页
javascript·学习·uni-app
少许极端13 分钟前
算法奇妙屋(三十八)-贪心算法学习之路 5
java·学习·算法·贪心算法
woai336414 分钟前
学习JVM-基础篇-Java虚拟机栈&本地方法栈
java·jvm·学习