深度学习入门-第4章-神经网络的学习

学习就是从训练数据中自动 获取最优****权重参数 的过程。引入损失函数 这一指标,学习的目的是找出 使损失函数 达到最小的权重参数。使用函数斜率的梯度法来找这个最小值。

人工智能有两派,一派认为实现人工智能必须用逻辑和符号系统,自顶向下看问题;另一派认为通过仿造人脑可以达到人工智能,自底向上看问题。前一派是"想啥来啥 ",后一派是"吃啥补啥"。前者偏唯心,后者偏唯物。两派一直是人工智能领域"两个阶级、两条路线"的斗争,这斗争有时还是你死我活。今天学习的是神经网络派。

4.1 从数据中学习

4.1.1 数据驱动

数据是机器学习的命根子。机器学习避免人为介入,通过数据发现模式。比如识别手写数字5,可以从图像中提取特征量,再用机器学习学习这些特征量的模式。其中图像转换为向量时使用的特征量仍由人设计,不同问题需要人工考虑不同的特征量。

神经网络(深度学习)称为端到端学习,图像中的特征量也由机器来学习。不管识别5还是识别狗,神经网络都是通过不断学习数据,尝试发现模式。

4.1.2 训练数据和测试数据

追求的模型泛化能力 。训练数据也叫监督数据。一套数据集,无法获得正确的评价。要避免对某数据集的过拟合

4.2 损失函数

相关推荐
惊鸿一博44 分钟前
Transformer模型图解(简单易懂版)
人工智能·深度学习·transformer
晓梦林1 小时前
homelab2靶场学习笔记
笔记·学习
AI绘画哇哒哒1 小时前
Agent三种思考模式深度解析:CoT/ReAct/Plan-and-Execute,小白程序员必看,助你轻松掌握大模型精髓(收藏版)
人工智能·学习·ai·程序员·大模型·产品经理·转行
Omics Pro1 小时前
填补蛋白质组深度学习预处理教学空白
人工智能·python·深度学习·plotly·numpy·pandas·scikit-learn
LN花开富贵1 小时前
Ubuntu aarch64 架构安装 NoMachine 远程控制 避坑与实战
linux·运维·笔记·学习·ubuntu·嵌入式
解局易否结局2 小时前
ops-transformer 的 FlashAttention:给昇腾NPU 配了个“高效厨房“
人工智能·深度学习·transformer
-To be number.wan2 小时前
数据库单表查询全攻略
数据库·学习
东湖山上2 小时前
GTAC: A Generative Transformer for Approximate Circuits
服务器·人工智能·深度学习·transformer·gpu算力
ゆづき2 小时前
Java 初学者入门指南:常见问题 + 核心知识点 + 进阶 20 道练习题
java·开发语言·学习·算法·水题
解局易否结局3 小时前
ops-transformer 里的 FlashAttention:让大模型在昇腾NPU上“吃得少、跑得快“
人工智能·深度学习·transformer