深度学习DAY1:神经网络NN;二元分类

深度学习笔记

DAY1

深度学习基本知识

1.神经网络

1.1 单一神经元

所有神经元将房屋大小size作为输入x,计算线性方程,结果取max(0,y),输出预测房价y

ReLU函数(线性整流函数)--max(0,y)

1.2 神经网络

多个单一神经元组成神经网络

逻辑分析:

小圆圈就是ReUL函数及其他非线性函数

在上面的神经网络中:

x1,x2,x3,x4------输入的特征 (输入层)

小圆圈------神经网络中的隐藏神经元,每个小圆圈都将四个特征作为输入(全连接层)

y------神经网络的工作:根据输入的特征预测y

而与上述逻辑分析不同的是,在神经网络中,网络节点(小圆圈)是神经网络自己决定的,只要给定足够的训练数据(x,y),神经网络就可以很好地拟合一个函数建立x和y的映射关系

2 监督学习与神经网络

2.1神经网络基本分类

神经网络有money的应用:

更多地聚焦结构化数据

在线广告系统

根据用户的信息,预测用户是否会点击某一广告

利润推荐系统

standard NN:

房价预测

在线广告点击预测

CNN(卷积)--图像信息

图像分类

RNN(循环)--对一维序列化数据(时序数据)有很好的效果:音频、文本

语音转文本

机器翻译

定制化的CNN、雷达等其他复合:

自动驾驶技术(根据周围图像信息+雷达位置信息),预测周围车辆位置

2.2 结构化数据与非结构化数据

结构化数据是基于数据库的数据:表格

非结构化数据:原始音频、图像、文本

2.3 Why深度学习好

横坐标表示数据量

纵坐标表示学习算法的性能:例如垃圾邮件分类的准确率

信息化时代,数据爆炸,传统机器学习算法在大规模的数据上性能体现不好

规模驱动深度学习发展

规模:①神经网络的规模(隐藏神经元、参数、连接)②数据的规模

规模大,深度学习的效果好

m:数据量

m小,算法性能取决于特征的提取和算法的细节处理(参数),有可能神经网络效果比SVM差,深度学习可能不如机器学习

算法的优化可以大大减少神经网络的运行时间

例子1

神经网络的重大突破:激活函数从sigmoid函数到ReUL函数的迁移--提高了梯度下降算法速度

回顾:梯度下降(损失函数下降最快的方向)--损失函数最小

sigmoid有个问题:它存在梯度几乎为0的情况,因此在使用梯度下降法寻找损失函数最低点的时候,在sigmod "S"曲线的前后两部分会很缓慢

ReUL:Rectified linear unit修正线性单元

也就是对所有的正输入,梯度都是1

3 二元分类

神经网络:不显式使用for循环来遍历整个训练集

在神经网络组织计算时,常用前向传播和反向传播

为什么训练神经网络时计算可以被正向转播组织为一次前向传播过程以及一次反向传播过程

以LR(logistics regression逻辑回归)

3.1 逻辑回归LR

LR:二元分类1 or 0

应用场景:识别图像是否为猫

在计算机中保存彩图需要存储3个独立矩阵(对应图像的红、绿、蓝通道),若图像大小为6464,则会有3 6464大小的实数矩阵(也就是该图像向量的维度为364*64)

输入特征向量的维度n=36464

预测输出y:0 or 1

符号表示

构建神经网络非常有用的惯例:混合不同的训练样本数据,"数据"指的是单个x或y,或者之后其他的数据,混合不同训练样本的数据,将混合后的数据按列排列

相关推荐
MYH51612 分钟前
在NLP文本处理中,将字符映射到阿拉伯数字(构建词汇表vocab)的核心目的和意义
人工智能·深度学习·自然语言处理
狂小虎3 小时前
02 Deep learning神经网络的编程基础 逻辑回归--吴恩达
深度学习·神经网络·逻辑回归
猫天意4 小时前
【深度学习】为什么2个3×3的卷积可以相当于一个5×5的卷积核?为什么3个3×3的卷积相当于一个7×7的卷积核,到底区别在哪里?我们该如何使用?
人工智能·深度学习·神经网络·目标检测·视觉检测
阔跃生物5 小时前
Nature Methods | OmiCLIP:整合组织病理学与空间转录组学的AI模型
人工智能·深度学习·机器学习
Mrs.Gril5 小时前
RKNN3588上部署 RTDETRV2
深度学习·yolo·rknn·rtdetr
Ama_tor6 小时前
14.AI搭建preparationのBERT预训练模型进行文本分类
人工智能·深度学习·bert
QQ676580087 小时前
基于 PyTorch 的 VGG16 深度学习人脸识别检测系统的实现+ui界面
人工智能·pytorch·python·深度学习·ui·人脸识别
Blossom.1187 小时前
量子通信:从科幻走向现实的未来通信技术
人工智能·深度学习·目标检测·机器学习·计算机视觉·语音识别·量子计算
大模型铲屎官8 小时前
【深度学习-Day 23】框架实战:模型训练与评估核心环节详解 (MNIST实战)
人工智能·pytorch·python·深度学习·大模型·llm·mnist
yorushika_9 小时前
python打卡训练营打卡记录day45
开发语言·python·深度学习·tensorboard